假说检定

假说检定（Hypothesis testing）是推论统计中用于检定统计假设的一种方法。而「统计假设」是可通过观察一组随机变数的模型进行检定的科学假说。一旦能估计未知母数，就会希望根据结果对未知的真正母数值做出适当的推论。

一张包含虚无假说与对立假说两个曲线的示意图，两常态分布有不同的期望值与相同的变异数。

统计上对母数的假设，就是对一个或多个母数的论述。而其中欲检定其正确性的为虚无假说（Null hypothesis，记为 $H_0$ ），虚无假说通常由研究者决定，反映研究者对未知母数的看法。相对于虚无假说的其他有关母数之论述是对立假说（Alternative hypothesis，记为 $H_{a}$ 或 $H_1$ ），它通常反应了执行检定的研究者对母数可能数值的另一种（对立的）看法（换句话说，对立假说通常才是研究者最想知道的）。

假说检定的种类包括：t检定，Z检定，卡方检定，F检定等等。

说明

假说检定的过程，可以用法庭的审理来说明。先想像现在法庭上有一名被告，假设该被告是清白的，而检察官必须要提出足够的证据去证明被告的确有罪。

在证明被告有罪前，被告是被假设为清白的。

假设被告清白的假设，就相当于虚无假说。
假设被告有罪的假设，则是对立假说。

而检察官提出的证据，是否足以确定该被告有罪，则要经过检定。这样子的检定过程就相当于用T检定或Z检定去检视研究者所搜集到的统计资料。

检定过程

在统计学的文献中，假说检定发挥了重要作用。假说检定大致有如下步骤：

最初研究假设为真相不明。
提出相关的虚无假说和对立假说。
考虑检定中对样本做出的统计假设；例如，关于母体资料的分布形式或关于独立性的假设。无效的假设将意味此检定的结果是无效的。
选择一个显著水准 (α)，若低于这个机率阈值，就会拒绝虚无假说。最常用的是 5% 和 1%。
选择适合的检定统计量(Test statistic)T。
在设定虚无假说为真下推导检定统计量的分布。在标准情况下应该会得出一个熟知的结果。比如检定统计量可能会符合常态分布或司徒顿t分布。
根据在虚无假说成立时的检定统计量T分布，找到机率为显著水准 (α)的区域，此区域称为「拒绝域」(记作RR或CR)，即在虚无假说成立的前提下，落在拒绝域的机率只有α。
针对检定统计量T，根据样本计算其估计值t_obs。
若估计值t_obs未落在拒绝域，则「不拒绝」虚无假说（do no reject $H_0$ ）。若估计值t_obs落在拒绝域，则拒绝虚无假说，接受对立假说。

要注意的是一般不会将检定结果称作「接受」虚无假说，而是因没有显著证据证明虚无假说为非，所以「不拒绝」虚无假说。

例子

淑女品茶是一个有关假说检定的著名例子^[2]。统计学家费雪的一个女同事，也是藻类学家的缪丽·布里斯托声称可以判断在奶茶中，是先加入茶还是先加入牛奶。费雪提议给她八杯奶茶。缪丽已知其中四杯先加茶，四杯先加牛奶，但随机排列，而她要说出这八杯奶茶中，哪些先加牛奶，哪些先加茶，检定统计量是确认正确的次数。虚无假说是她无法判断奶茶中的茶先加入还是牛奶先加入，对立假说为她有此能力。

若单纯以机率考虑（即缪丽没有判断的能力）下，八杯都正确的机率为1/70（这是个简单的组合问题），约1.43%，因此「拒绝域」为八杯的结果都正确。而测试结果为缪丽八杯的结果都正确^[3]，在统计上是相当显著的的结果。也就是说，几乎可以排除她只是恰好猜对结果的可能。

参考文献

^ Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model (Edward Arnold) §20.2.
^ Fisher, Sir Ronald A. Mathematics of a Lady Tasting Tea. James Roy Newman (编). The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. 1956 [1935]. ISBN 978-0-486-41151-4. Originally from Fisher's book Design of Experiments.
^ Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.

Category:需要数学专家关注的页面

[1] Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model (Edward Arnold) §20.2.

[fisher-2] Fisher, Sir Ronald A. Mathematics of a Lady Tasting Tea. James Roy Newman (编). The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. 1956 [1935]. ISBN 978-0-486-41151-4. Originally from Fisher's book Design of Experiments.

[3] Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.

[2]

[3]

假说检定

目次

说明

检定过程

例子

相关条目

参考文献