统计学相关分析的常用方法(白话统计阅读笔记)

正如本书P201给出的例子,要明确两个变量之间是否存在相关性及其方向,可以通过计算均值的方式来初步评估,在本例中通过计算两个变量与其均值的差值在不同象限的分布情况以明确两个变量之间的相关性及其正负,如果两个变量呈正相关,那么大多数数据应该位于1、3象限,如果呈负相关,则位于2、4象限,如果二者没有什么关系,那么4个象限中的数据应该差不多,下面我们就来聊聊关于统计学相关分析的常用方法?接下来我们就一起去了解一下吧!

统计学相关分析的常用方法(白话统计阅读笔记)

统计学相关分析的常用方法

正如本书P201给出的例子,要明确两个变量之间是否存在相关性及其方向,可以通过计算均值的方式来初步评估,在本例中通过计算两个变量与其均值的差值在不同象限的分布情况以明确两个变量之间的相关性及其正负,如果两个变量呈正相关,那么大多数数据应该位于1、3象限,如果呈负相关,则位于2、4象限,如果二者没有什么关系,那么4个象限中的数据应该差不多。

随后通过计算差值之和,如果总和为正,说明差值正数居多,即位于1、3象限中的点越多,则说明这两个变量之间可能呈正相关。为了排除数据越多造成的值越大的干扰,通过将差值和除以例数后可以得到进一步校正,由此得到协方差,但由于度量单位不统一的为导致协方差不能不用不同数据的相关性计算,所以需要进行标准化,使得不同度量单位的数据均变换为以0为均数,以1为标准差的值,这样就可以直接比较数据大小了。而根据标准化后的数据所计算的协方差就是线性相关系数,所以线性相关系数就是将协方差与数据标准化结合起来的一个公式。

Ref: 《白话统计》 冯国双著

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页