有趣的统计1.4 否定虚无假设_有趣的统计1.4 否定虚无假设试读-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 数学 > 有趣的统计 > 1.4 否定虚无假设

有趣的统计——1.4 否定虚无假设

实验科学家通过质疑向前推进。 科学是个目标驱动的过程,其目标是构建一个解释世界的知识体系。这个知识体系由一长串的科学法则、定律以及关于事物如何存在与运转的理论构成。实验科学引进新的法则和理论,并通过一系列逻辑步骤对其加以测试,这个测试过程称作假设检验。 1.4.1 假设检验 一个假设是对可检验世界做出的一个估计。比如,我也许会假设洗车导致下雨或是假设进浴缸导致电话响了。在这些假设中,我认为洗车和下雨之间或洗澡和电话响铃之间存在关联。 验证这些假设是否正确的一个合理方式是观察假设中的变量(为了听起来更像统计学家,我们把这称作收集数据),看是否存在显在的相关性。如果数据显示变量间存在相关性,那么我的假设得到了支持,我也许有理由认为自己的估计是正确的。如果数据没有明显的相关性,我也许会明智地开始怀疑自己的假设是否错误,或是完全抛弃它。 科学家们通过收集数据来检验假设时,有4种可能的结果。表1-3显示了该决策制定过程中的可能结果。 表1-3:研究假设检验的可能结果 假设正确:事实的确如此 假设错误:事实并非如此 数据支持假设:接受假设 A. 正确的决策:科学取得进步 B. 错误的决策:科学发展受阻 数据不支持假设:抛弃假设 C. 错误的决策:该死,又失败了 D. 正确的决策:科学取得进步 结果A和D可为科学的知识体系添砖加瓦。虽然A更可能让研究科学家激动不已,D其实也还不错。而B和C则是错误的,它们代表着错误的信息,只会混淆我们对世界的理解。 1.4.2 统计假设检验 你可能觉得假设检验的过程很有道理,这是一种相当直观的方式,可用来对世界和身处其中的人得出结论。人们在日常生活中总是通过这种假设检验来理解事情。 统计学家也检验假设,但针对的是某些非常特定的假设。首先,他们拥有代表样本值的数据,这些样本是从他们希望获得结论的真实或理论总体中抽取的。所以,他们的假设是关于总体的假设。其次,他们通常预先假设所关注总体内的不同变量之间存在某种相关性。统计学家提出的研究假设通常是这个样子的:所关注总体中变量X和变量Y之间存在相关性。 统计假设检验不同于研究假设检验,统计学家在假设检验结束时做出的概率解释,与研究假设为真的可能性无关。统计学家对研究假设为假的可能性做概率解释。在技术上更准确的表述为,统计学家对与研究假设相反的假设为真的可能性做出解释。这个相反的假设通常是关于变量间不存在相关性的假设,所以叫做虚无假设。统计学家提出的虚无假设通常是这个样子的:所关注总体中变量X和变量Y之间不具相关性。 研究假设和虚无假设涵盖了所有的可能性。变量间要么存在相关性要么不存在相关性。本质上,当必须从这两种假设中选择其一时,声明一个为假就等于为另一个提供了支持。因此从逻辑上讲,虚无假设检验和之前介绍的日常生活中人们自然运用的直觉方法一样有道理。研究人员执行虚无假设检验时偏好的结果和表1-3中介绍的一般假设检验方法略有不同。 如表1-4所示,统计学家通常希望否定他们的假设。统计研究人员通过否定虚无假设就能证实他们的研究假设,进而获得研究津贴,赢得诺贝尔奖,或许有朝一日他们的头像也能印在邮票上。 表1-4:虚无假设检验的可能结果 虚无假设是正确的:总体中存在相关性 虚无假设是错误的:总体中不存在相关性 数据支持虚无假设:无法拒绝虚无假设 A. 正确的决策:科学取得进步 B. 错误的决策:科学进步受阻 数据不支持虚无假设:拒绝虚无假设 C. 错误的决策:该死,又失败了 D. 正确的决策:科学取得进步 尽管结果A在科学角度上是可以接受的,但在这种情境下结果D更令研究人员高兴,因为该结果支持了他们关于世界的真实推测,即研究假设。和上面一样,结果B和结果C仍然是有碍于科学进步的错误。 1.4.3 生效原理 统计学家检验虚无假设——估计希望找到的结果的反面,这么做有几个原因。首先,证明某件事为真的确非常非常难,尤其是当假设中包含了特定值时,这在统计学研究里是很常见的。证明一个特定的估计不正确要比证实它正确容易得多。例如,我无法证明我今年29岁,但要证明我今年不是29岁却相当容易。 同样,要证明某个特定的总体估计值不可能正确,也相对容易一些。大多数统计中的虚无假设都假定总体的值为0(也就是说,总体中变量X和变量Y之间不具相关性),要拒绝虚无假设就是去证明:不论总体的值是什么,它很可能不是0。对研究人员假设的支持通常来源于证明总体值大于零,并不需要具体说明这一总体值具体是多少。 对专业统计学家来说,这一点相当令人振奋,是不是?统计学家要做的就是告诉你,你的答案是错误的,无需提供正确答案! 甚至无需举出数字实例,科学哲学家长久以来便声称,科学是通过提出假设并试图证明假设错误而取得进步的。对于真正的科学来说,可证伪的假设是最好的假设。 统计分析通常按以下方式进行:提出与研究假设相反的虚无假设,然后尝试能否证伪该虚无假设。这个方法最早由20世纪早期最伟大的统计学家费歇尔博士(R. A Fisher)提出,此后便传播开来。此外还有一些其他的方法。许多现代统计学家认为我们应集中精力对所关注的总体值(比如变量间相关性的大小)做出最佳估计,而不是证明相关性大小为某个不确定的非零值。

展开全文

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读

《有趣的统计》其他试读目录

• 1.1 不可不知的秘密
• 1.2 仅用两个数字描述世界
• 1.3 计算概率
• 1.4 否定虚无假设 [当前]
• 1.5 增加样本量以减少误差
• 无
• 1.6 精确测量
• 1.7 提高测量尺度
• 1.8 提高检验力
• 1.9 展示因果
• 1.10 敏锐识别效应值