样本量对假设检验有无影响(假设检验基础α错误)

阅读提示

本文针对刚刚接触零假设显著性检验的同学,最好已经了解:

  • 假设检验
  • 抽样分布
  • 正态分布
  • 标准分数
做研究的基本套路

随机变量服从均值为,标准差为的正态分布,即。

现在对施加某种处理,使的值发生了变化,变成。我们假设这种处理的效果是恒定的,即。那么,只是均值发生了变化,而方差不变,分布的形态也不变。,其中

做心理学实验,基本上就是这个套路:对施加处理得到。然后比较一下与的均值有没有变化,以此来判断处理是否有效果,效果如何。

当然直接比较和是不可能的,因为这两个都是总体参数,基本上是不可能直接获取的。我们能够得到的只是和的一个样本,需要通过样本来推断总体参数。

为了便于讲解,我们假设未知的只是

现在我们就需要从中抽取一个样本量为的样本,该样本均值用表示。因为样本容量为的样本可以抽取非常多,理论上是无限个,于是可以得到非常多的。

也就是说,也是一个随机变量,此时的分布叫做样本均值的抽样分布,其分布的均值与的相同,均为,标准差为,形态依然是正态分布。此时抽样分布的标准差也称为标准误,因为其体现了抽样误差的大小。

零假设和备择假设

进行假设检验的第一步,就是提出假设。

我们的研究总是期待处理是有效果的:才是我们所希望的结果。

不过,进行假设检验所采用的逻辑是反证法,通常是从反面出发进行推导。所以,我们通常先假设,这就是假设检验中的零假设

与零假设互不相容的,就是研究者所希望的结果,即,称为备择假设

不同假设下抽样分布的形态,以及两种错误

当成立时,,的抽样分布为。

当成立时,,的抽样分布为。

可见,两个假设下,的抽样分布仅仅是均值发生了变化,从图像上来看,二者相当于是平移了的距离。

当然,的取值是未知的,这个值实际上体现了效应量的大小,也是需要估计的。

图像如下:

样本量对假设检验有无影响(假设检验基础α错误)(1)

由于进行假设检验都是从出发,设定的显著性水平是在红色的分布中体现。

样本量对假设检验有无影响(假设检验基础α错误)(2)

此时橘色纵线就是临界值,它的位置由决定,并将图像分成了两部分:右边是拒绝域。如果得到的样本均值位于该区域,那么做出的决断就是拒绝。左边是接受域,如果得到的样本均值位于临界值的左边,则接受(准去来说应该是“不能拒绝 ”)。

不论在临界值的左边还是右边,都包含了红色和蓝色的两个分布。

  • 临界值右边,红色的分布对应区域表示:在成立时拒绝了,说明做出了错误的决断,此时犯错的概率就是显著性水平。此时的错误也叫做Ⅰ型错误或者错误
  • 临界值左边,蓝色的分布对应区域表示:在成立时(不成立),接受了。说明做出了错误的决断,此时犯错的概率为,也称为Ⅱ型错误或者错误。如下图:

样本量对假设检验有无影响(假设检验基础α错误)(3)

  • 临界值左边,红色的分布对应的区域表示:在成立时,接受了。此时做出了正确的决断。概率为。如下图:

样本量对假设检验有无影响(假设检验基础α错误)(4)

  • 临界值右边,蓝色的分布对应的区域表示:在成立时(不成立),拒绝了,说明做出了正确的决断,此时的概率用表示,也称为统计检验力。表示了在 成立时,正确得到显著结果的概率。如下图:

样本量对假设检验有无影响(假设检验基础α错误)(5)

在研究中,我们都是希望样本均值掉落在临界值右边,为了避免在这种情况下犯错,所以通常对进行限制。

从图中可以看到,和并不是属于同一个分布的,所以二者之和并不是1。

此外,在其他条件不变的情况下,如果变小,临界值往右移动,那么随之变大。反之,变大,就变小

可以在研究前设定,那么怎么计算呢?

研究中通常设定了的大小,那么就不管了吗?

当然不是,也是一个非常重要的指标,因为它决定了统计检验力的大小。

让我们先来,看看,如果要计算,还需要什么?

如下图:

样本量对假设检验有无影响(假设检验基础α错误)(6)

既然已经知道了,那么便可以得到临界值到的距离,。

从而求出

在蓝色的分布中,体现了临界值到的距离,将其转换为标准分数:

知道了之后,便可以轻松的求出了

可知,受到3个因素的影响:

  • 决定了临界值的位置,所以肯定会影响
  • 两个分布的标准距离,影响了两个分布的偏离程度,从而影响了。这个标准距离就是我们熟知的效应量
  • 样本的大小,影响了抽样分布的标准差,从而影响了分布的形状(高狭,低矮),进一步影响了。

实际上,,以及效应量这四个指标,知道了任意三个,就可以推导出最后一个。通常,是已知的(由研究者确定,一般为0.05)。

在研究开始之前,通常需要确定样本量。此时可以通过查阅文献,合理的假设效应量大小。并且进一步规定本次研究的检验力,确定。据此推算出本次研究需要的。

在研究结束之后,通常需要估计的检验力的大小。此时已知,可以利用样本均值来估计,样本标准差来估计(如果已知就不用估计了),从而估计效应量的大小。进一步可以计算出检验力。

当然,上面的讲解使用的是最简单的检验,通常实际研究中很少用到。但计算的原理与检验等是一致的,只是分布图不同而已。

分布图比正态分布要复杂,通常也不会手算效应量,可以利用G*Power很方便的计算。

小结
  • 和位于不同的分布中(前提不同),二者并不是互补的关系。
  • 和效应量可以互相推导,知道了任意三个可以推导另一个。
  • 可以利用G*Power方便的计算上述指标。

感谢大家耐心看完,也欢迎大家的意见和建议。

如果你是一个大学本科生或研究生,如果你正在因为你的统计作业、数据分析、论文、报告、考试等发愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何问题,都可以联系我。因为我可以给您提供最好的,最详细和耐心的数据分析服务。

如果你对Z检验,t检验,方差分析,多元方差分析,回归,卡方检验,相关,多水平模型,结构方程模型,中介调节等等统计技巧有任何问题,请私信我,获取最详细和耐心的指导。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

加油吧,打工人!

本文转载自AhaDad,请支持原创!

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页