假设检验的p值(T检验和其他假设检验的P值怎么理解)

关于单样本和两独立样本T检验的操作方法,我们今天先不谈具体的步骤,而是通过案例全方位地将T检验和P值的逻辑和思想,掰开揉碎,尝试用白话再梳理一遍,增进大家的理解,不足之处,欢迎指出讨论。

假设检验的p值(T检验和其他假设检验的P值怎么理解)(1)

案例:5年前,全国男性的平均身高是1.75米(普查得到的总体均值),现在我们想知道如今男性的平均身高是否发生了改变。

思路:从全国男性群体中随机抽取1000名样本,获得样本均值和样本标准差,进行假设检验。

此处需要提醒的是,在进行假设检验时,我们的关注点在样本均值上,即我们不太关注原始样本的情况,而是关注由这个样本计算的样本均值了。

现在,在脑海中重复上面的操作:比如我们随机抽取100次,每次都抽取1000名,所以,我们会得到100个样本均数,将这100个样本均数放在一起再求均数和标准差,得到的均数会更加接近全国这个总体的均数,而这个标准差就是你听过的“标准误”。

然而,现实情况中我们只会抽取一次,只会得到一个样本均数和一个样本标准差,虽然这一个样本均数不如上面由100个样本均数平均后计算地精确,但在数学上仍可以证明,这一个样本均数也可以用来很好地估计总体均数。所以,问题的关键就变成了,不抽取100次,怎么计算“标准误”?好在我们也能证明,只抽样一次获得的样本标准差(S),除以根号N就可以得到“标准误”的估计值了,于是抽样一次就可以简单算出“标准误”,再次提醒,这个“标准误”实际上就是均数的标准差。

现在我们正式开始T检验的思路。上文提到了,我们关注的随机变量已经不是原始的身高了,而是身高的均数,身高的均数,身高的均数(重要的话,讲三遍)。所以,身高均数成为了我们研究的随机变量,它也存在总体与样本的区分,它也有均值和标准差,而且我们还可以确定无论身高是否真正服从正态分布,身高均值这个变量总是近似服从正态分布(中心极限定理),由此我们就可以利用这些性质进行假设检验。

回到上面的问题,5年前全国男子身高的总体均值是1.75米(μ),我们想知道现在是否有变化,其实就是想检验,5年后的现在全国男子身高的总体均值是否还是1.75米。因为我们不进行普查,所以我们希望通过随机抽取一个1000人的样本来进行推断和检验。得到样本后,我们可以计算出样本均数、样本标准差以及标准误。

假设样本均数为 1.77,显然我们不能因为1.77和1.75这两个数字的不同就判断说现在全国男子的平均身高要大于5年前了。因为即使现在的身高没有变化,你随机抽取一个1000人的样本得到的样本均数也不可能就恰好等于1.75,这很好理解,抽样是有误差的。于是,我们就要搞清楚现在得到的这个样本均数(1.77)和5年前的总体均数(1.75)的差异仅仅是因为抽样误差,还是确实是因为现在人们的平均身高发生了变化,这里的“变化”用数学的语言表达就是:现在全国男子身高的总体均数到底还是不是1.75,注意这里是“总体均数”,也就是说我们真正关心的是总体,样本只是用来获得总体信息的一个手段。

我们先假设,现在的总体均数没有变,仍等于1.75。所以,我们抽取的1000人就认为是在这个总体中抽取的一个样本。在零假设情况下,这个总体的均数是1.75,而我们获得的样本计算出来的样本均数是1.77,假设检验的问题就转换成了:在一个总体均数为1.75的总体中,抽到如今这个样本的概率是多少?

很明显,如果这样问,答案肯定就是0。在先前的文章中,我们知道一个样本相当于数轴上的一个点,而从一个数轴中抽取一个点的概率就是0。然后,你就看到了那句“永远让人费解的话”:P值是抽取到现有样本或更极端情况样本的概率。

如果把样本割裂来看,抽到一个样本的概率就是0,而“现有样本或更极端情况的样本”中的“或”字表明,P不是指的一个点的概率,而是一个区间的概率,也就是在μ为1.75的总体中,根据抽到的样本计算的样本均值比1.77还要大的样本(比如1.78或1.80),这些样本合起来的概率就是P,而这些样本相对均数为1.75的总体而言便是“更极端样本”了。看到这里,你可以想想这句话怎么用概率式子表示出来呢?

最后一个问题就是,如何计算P值?这里需要的基础知识是:知道一个变量服从正态分布,怎么计算这个变量在某个区间上的概率。比如,随机变量X服从均值为2.5,标准差为1.6的正态分布,如何求X<4的概率。这种问题的解法应该都学过,我们简单回顾一下。首先将X进行标准化处理(即将变量减去均数然后除以标准差),比如将4标准化:(4-2.5)/1.6=0.94,然后查标准正态概率分布表P(Z≤0.94)=0.8264,于是就得到P(X<4)=0.94。

以下内容,涉及公式的编辑,为保清晰,所以采取截图的形式发布

假设检验的p值(T检验和其他假设检验的P值怎么理解)(2)


我们是谁?

我们是由毕业于北京大学的丁小丁和丁小点共同创立的,旨在搭建一个知识分享和一对一咨询平台——丁点帮你。

希望通过我们的努力,给大家分享有价值的观点和知识,同时让您的问题得到及时的、有针对性的回答。欢迎扫描下方二维码关注我们的微信公众号“丁点帮你”。

欢迎交流,欢迎投稿!

假设检验的p值(T检验和其他假设检验的P值怎么理解)(3)

"丁点帮你"微信公众号

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页