每天学点统计概率(每天一点统计学)

离散数据和连续数据

前面讲到的二项分布、超几何分布和泊松分布所涉及的都是离散数据,即数据由一个个单独的数值组成,其中的每一个数值都有相应的概率,离散数据往往能以某种方式进行计数,能取确切值,所以离散数据也被称为数值型数据。

然而,并非所有的数值型数据都是离散的。有时候,一一列举一个数据集中的所有数值并不总是能够实现。有时候,数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件结果。例如,假如让你称重几个苹果的重量,并且已知这些苹果的重量在500g到800g之间,称重结果可能是500.1g、500.56g、600.36g等等。类似重量、长度这样的数据叫做连续数据,连续数据往往通过测量得到,而不是通过计数得到。

每天学点统计概率(每天一点统计学)(1)

对于离散概率分布来说,我们关心的是取得一个特定数值的概率;而对于连续概率分布来说,我们关心的是取得一个特定范围的概率,而概率密度函数就是用于描述连续随机变量的概率分布的。

概率密度函数

概率密度函数f(x)是这样一种函数:通过它可以求出一个数据范围内的某个连续变量的概率,它向我们指出该概率分布的形状。

1、欲算概率,先求f(x)

f(x) * 20 = 1, => f(x) = 0.05(概率密度函数)

2、再求面积,可得概率

假设我们要求出P(x>5),如下图

每天学点统计概率(每天一点统计学)(2)

P(x>5)= (20-5)* f(x)=15 * 0.05 = 0.75

所以,处理连续数据时,所计算的是一个数值范围内的概率,在图形中表现为面积。

理解概率密度函数是计算连续型概率分布的基础,下一节将详细剖解正态分布。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页