守株待兔会成为笑柄的原因(能否科学地守株待兔)

金虎奔腾辞旧岁,玉兔欢跃迎新春,转眼间春节假期就已经离我们远去了在这个“美好时刻”里,笔者忍不住想起了“守株待兔”的故事——

宋人有耕者。田中有株,兔走触株,折颈而死。因释其耒而守株,冀复得兔。兔不可复得,而身为宋国笑。

——《韩非子·五蠹》

”作为一个打工人,此刻不免有个疑问,有没有可能科学、合理、可持续地守株待兔,而不会像寓言里的那位宋国人一样遭人嘲笑呢?

守株待兔会成为笑柄的原因(能否科学地守株待兔)(1)

图片来源:giphy

简单情况:某次试验成功的概率分布

为了方便研究,我们抽象化问题的表述。假设宋国人某段时间守株待兔成功的几率为p,显然这一段时间在树下一无所获的概率为 q = 1 - p,其中 0 ≤ p ≤ 1。对于这种只有两种结果的单次随机试验,我们又称为“伯努利试验”,由数学家雅各布·伯努利提出。(为抢C位,这个史上第一数学天团都经历了哪些内部纷争? )

根据上面伯努利试验的设定,我们可以得出对应的概率分布,即伯努利分布,又称两点分布或者0-1分布。

概率分布

所谓概率分布,指的是随机变量的概率性质。两个随机变量具有同样的分布时,我们无法用概率来区别它们。不严谨地讲,概率分布就是在统计图中用横轴表示数据的值,用纵轴坐标表示横轴对应数据的概率。而横轴纵轴之间的对应关系,就是所谓的“概率函数”。

对于离散随机变量,其对应概率质量函数(probability mass function, pmf, 如上图;对于连续随机变量,其对应概率密度函数(probability density function, pdf,如下图)。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(2)

守株待兔会成为笑柄的原因(能否科学地守株待兔)(3)

很显然,伯努利分布是一个离散型概率分布,根据定义我们可以得到其pmf

守株待兔会成为笑柄的原因(能否科学地守株待兔)(4)

如果取p = 0.3,我们可以得到函数图象

守株待兔会成为笑柄的原因(能否科学地守株待兔)(5)

同时我们也可以求得伯努利分布的数学期望

守株待兔会成为笑柄的原因(能否科学地守株待兔)(6)

数学期望

在统计学中,数学期望即随机试验在同样情况下重复无穷多次,所有可能状态趋近的结果。对于离散随机变量而言,其数学期望是试验中每次可能结果乘以其结果对应概率的和,即

守株待兔会成为笑柄的原因(能否科学地守株待兔)(7)

譬如,掷一枚六面骰子,点数的数学期望E(X) = 1/6 × 1 1/6 × 2 1/6 × 3 1/6 × 4 1/6 × 5 1/6 × 6 = 21/6 = 3.5。

结论其实非常显而易见,即如果兔子撞树的概率是p,寓言中宋国人某次“试验”中捡到兔子的数学期望就是p。

n次独立试验:多次守株待兔的情况

按照寓言的设定,宋人“因释其耒而守株,冀复得兔。”为了简化问题,我们假设兔子撞树属于独立事件,也就是说其他兔子并没有因为之前的事件意识到超速的危害,也没有将事故现场标记为事故多发路段。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(8)

图片来源:giphy

很显然,多次守株待兔问题的本质其实就是n次独立的伯努利试验中成功的次数的离散概率分布。同样地,继续假设宋国人某次守株待兔成功的几率为p,宋人一共“守株”n次,其中k次成功,那么结合前面伯努利分布的结论,我们可以得到新的pmf

守株待兔会成为笑柄的原因(能否科学地守株待兔)(9)

其中

守株待兔会成为笑柄的原因(能否科学地守株待兔)(10)

读作“n取k”,即二项式系数(二项式定理各项的系数),所以n个独立的是/非试验中成功次数k的离散概率分布又被称为二项分布

守株待兔会成为笑柄的原因(能否科学地守株待兔)(11)

二项式系数的直观展示——帕斯卡三角/杨辉三角 三角形第n层(第1行定义为第0层,以此类推,第n 1行即第n层)正好对应于二项式(a b)n展开的系数。例如第2层1、2、1为(a b)2展开形式a2 2ab b2的系数。 图片来源:Wikipedia

这里有必要稍微复习一下二项式系数“n取k”。除了上面的记法,“n取k”还可以写作下面这些形式

守株待兔会成为笑柄的原因(能否科学地守株待兔)(12)

所以这其实只是一个中学的知识点,“n取k”即从n个不同元素中取出k个元素的方法数,觉得生疏的同学可以复习中学排列组合相关课程。那么回到上面介绍的二项分布的pmf

守株待兔会成为笑柄的原因(能否科学地守株待兔)(13)

绿色部分代表前一节所述的伯努利试验的pmf,红色部分可以理解为我们希望在n次试验中有k次成功,但这k次成功可以发生在总共n次试验中的任意位置。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(14)

二项分布的概率质量函数(pmf)。图中横坐标为k,纵坐标是对应的概率。显然p和n不同,pmf的形状也会改变。

由于二项分布本质上就是n次伯努利试验的结果,所以二项分布的数学期望等于n倍的伯努利分布的数学期望,即np,记作λ。

真实情景:“守株待兔”试验成功的概率

经过了之前的铺垫,下面让我们来讨论真实的场景,即我们如果亲自去守株待兔会有怎样的结果。故事的结局里,宋国人终日守在树旁(即试验次数n很大),但“兔不可复得,而身为宋国笑”。我们以此作为样本可知,兔子撞到树上的概率是非常低的(概率p非常小)。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(15)

朱迪警官为大家亲自示范兔子的灵敏程度 图片来源:YouTube

我们考虑极限情况,令n趋近于无穷(n是试验次数,“趋于无穷”描述了守株待兔过程中“终日守在树旁”的状态)。那么,上一节中的二项分布可以写作

守株待兔会成为笑柄的原因(能否科学地守株待兔)(16)

此处我们代入上一节中二项分布的期望值λ = np,即p = λ/n。为了后面计算的方便,这里我们引入自然常数e的定义

守株待兔会成为笑柄的原因(能否科学地守株待兔)(17)

代入上面式子,之后的计算就显而易见啦——

守株待兔会成为笑柄的原因(能否科学地守株待兔)(18)

综上所述,我们得到了真实情况下的概率质量函数pmf,也就是著名的泊松分布。上面计算说明,当试验的次数趋于无穷大,而λ = np不变时,二项分布收敛于泊松分布。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(19)

守株待兔会成为笑柄的原因(能否科学地守株待兔)(20)

西梅翁·德尼·泊松(1781-1840),法国数学家、几何学家和物理学家。泊松是著名数学家拉格朗日和拉普拉斯的学生,其研究覆盖了当时数学几乎各个方向。中学课本上泊松光斑的故事说的就是他的故事。为了推翻光的波动理论,泊松计算发现在波动说的前提下,用一个圆片作为遮挡物时,光屏的中心应出现一个亮斑。结果菲涅耳和阿拉戈精心设计了一个实验,确认了这一亮斑的存在,反而成为了支持波动说的强有力证据。 图片来源:Wikipedia

当然,只是看数学公式可能有些抽象,所以让我们直接上图。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(21)

图像为泊松分布的pmf。参数λ可以用样本的均值来近似。简单地说,将宋人守株待兔的时间划分成无数份,其中λ次等到了兔子撞树。横轴代表k,也就是我们如果去守株待兔,事件(等到兔子)发生次数。纵坐标则代表在上述λ的前提下,实际等到0,1,2 ,......,50只兔子的概率。显然,泊松分布以λ为中心,且λ越大,越接近正态分布。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(22)

《理 想 情 况》图片来源:Giphy

泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。比如汽车站台的候客人数、放射性原子核的衰变数等之类的事件。值得一提的是,在“守株待兔”的故事中,“兔不可复得”,可见样本的估计值是很低的,我们假设λ小于0,可以得到如下图像

守株待兔会成为笑柄的原因(能否科学地守株待兔)(23)

可见即使令λ = 0.1,能等到两只兔子的概率都趋近于0。所以指望守株待兔发家致富是不太可能的。当然要得到严谨的结论,我们还可以计算一下泊松分布的数学期望,不过需要用到一点点大一的数学知识(泰勒展开)。

守株待兔会成为笑柄的原因(能否科学地守株待兔)(24)

所以泊松分布的数学期望实际上就等于λ。如果实际中宋国人每蹲守1000次才能等到一只兔子(笔者怀疑这是不是也太过于乐观了),那么守株待兔数学期望E(守株待兔) = 0.001。

综上所述,建议屏幕前的朋友们开工之后一定要认真地工作学习,毕竟天上掉馅饼的概率极小,而且很可能也不太好接——

守株待兔会成为笑柄的原因(能否科学地守株待兔)(25)

图片来源:Giphy

作者:铸雪

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页