一分钟研究博弈论(这才是真正的博弈论)

我曾经写过一篇以华容道为材料讲解博弈论的文章,可能是因为我的叙述太简单,以至于好多人没有看懂,我决定重新论述一次。

赤壁之战曹操被东吴一把火烧了战船,仓皇逃窜,摆在他面前的逃生之路有两条,一条是平坦大道,一条是崎岖小路。诸葛亮在大道上虚插旗帜,却让军队在小路拦截曹操。曹操看到大道上有敌军旗帜,就选择了小路,因小路险恶,人马自相践踏,死伤无数,本以为勉强能逃出升天,不料还是掉入罗网,幸好关羽义薄云天,才侥幸大难不死。这就是著名的华容道。

我们就来分析一下,曹操和诸葛亮分别选择的策略是不是优选策略。

在华容道这一局博弈中,曹操的目标是将更多的兵力带回老巢,诸葛亮的目标是尽可能多的消灭曹操的兵力(虽然诸葛亮可能并不想消灭曹操的兵力,但是曹操认为诸葛亮一定要消灭他。无论诸葛亮是不是打算放走曹操,他既然派人去拦截,就一定是要设法遇到曹操)。最终,曹操剩下的兵力,为其收益;曹操损失的兵力,为诸葛亮的收益。

一分钟研究博弈论(这才是真正的博弈论)(1)

曹操大路曹操小路诸葛大路1111诸葛小路0220

(前方数字为诸葛收益,后方数字为曹操收益)

从以上收益矩阵能够看出,诸葛亮在这一局博弈中,并没有优选策略可供选择。诸葛亮守大路,曹操选择任何策略,诸葛亮的收益一样;诸葛亮守小路,他的收益高低取决于曹操选择哪个策略(曹操大路,他收益0,曹操小路,他收益2)。但是,无论诸葛亮选择什么策略,曹操走大路的收益,都不低于走小路。诸葛亮守大路,曹操选择任何策略,收益都是1,1=1;诸葛亮守小路,曹操走大路收益2,走小路收益0,2>0。所以曹操选择走大路,才是严格的优选策略,所谓严格的优选策略,即无论对手怎么选择,我选择这个策略的收益,都不低于选择其他策略。存在严格的优选策略时,选择其他任何策略都不会获得最好的结果。所以,曹操放弃了严格的优选策略,是选错了,就算诸葛亮真的大路守着,他都要义无反顾地冲过去,何况仅仅是见到了一些旗子。

本来,诸葛亮是没有优选策略可用的,他可以随便选。由于曹操存在严格的优选策略,就是走大路,所以诸葛亮守在大路上,是与曹操相遇概率最大的策略,就是诸葛亮的优选策略。所以,诸葛亮也放弃了优选策略。虽然诸葛亮还是遇到了曹操,而且取得了双方策略矩阵中,对他来说最好的结果(即诸葛亮收益2,曹操收益0)。这是建立在曹操做出了错误选择的基础上。

任何人选择策略前,只能假设对方一定会选择最好的、最对的策略,而不能假设对方一定不会选择最好的、最对的策略,我方根据对方最好的、最对的策略,确定自己的策略。如果总是认为对方选不对,那不好的策略多了去了,你又怎知对方选择哪一个呢?我方又该如何做出决策呢?

曹操就地自裁也算一个策略,诸葛亮怎么不考虑呢?当然因为就地自裁对曹操来说是严格的劣选策略,他不会选的。曹操的优选策略,无非就是从大路逃跑还是从小路逃跑,诸葛亮要考虑的是,这两个策略,对曹操来说,哪一个更好。诸葛亮守在小路上,要是曹操真的从大路跑了,诸葛亮的收益不就成0了么。

凭什么诸葛亮认为以曹操的多疑,他一定会走小路呢?就凭你竖的那几杆破旗?你怎么知道曹操不会因为多疑而想:诸葛亮知道我的性格,他故意竖着些破旗迷惑我,逼我走小路,我偏不!然后刘备问诸葛亮为什么守小路上不守大路,诸葛亮回答:因为曹操生性多疑……哪个员工敢这么回答老板的问题?若是诸葛亮守在大路,而曹操走了小路,刘备问诸葛亮为什么不守小路时,诸葛亮回答:因为走大路是曹操最好的选择,所以我守在大路上;即使曹操从小路逃跑了,我们依然获得了1个单位的收益。各位可以比较一下两者的回答,究竟哪一个更像一位运筹帷幄的智者。

诸葛亮在这一局博弈中,虽然得到了最好的收益,也只不过因为运气好罢了。运气,能作为我们决策的依据么?要是有人把完成目标可能性完全押宝在运气上,我估计这人几乎不可能完成任何目标。

当然,这个收益矩阵并不是一点问题没有。比如说,小路的地形可能并不如我想象中的恶劣;大路的状况也不如我想象中的这样安全;曹操部队可能失败以后及其不愿战斗,遭遇敌人的损失比我想象中要严重,等等。这些因素都是可以影响收益,从而左右曹操的策略的。如果这其中有某一个因素是十分确定的,比如现在十分确定,小路的恶劣情况只是我们想象中情况的70%,那我们就把曹操走小路的收益提高30%,诸葛亮的收益降低30%。收益矩阵就变成下面这个样子。

曹操大路曹操小路
诸葛大路110.71.3
诸葛小路021.70.3

(前方数字为诸葛收益,后方数字为曹操收益)

这样看来,曹操也不存在严格的优选策略,走哪边都可以,诸葛亮守哪边也都可以,遇不遇得到,真的得看运气了。

问题在于,我们无法十分确定某件事,曹操和诸葛亮也不能!他们不能知道走小路的损失具体是多少,发生战斗的损失具体又是多少。

有时,走崎岖地形会遇到很多状况,导致非战斗损失大于战斗损失;有时,战斗中会遇到很多状况,导致战斗损失大于非战斗损失。这两种损失,是无法确定究竟谁高谁低的,只能认为一样。有人认为,影响战争的因素很多,都会影响收益。但是这些因素,有可能是对诸葛亮有利,也有可能对曹操有利,不仅我们不知道,就连曹操和诸葛亮本人,也无法确切得知。所以,我们在收益矩阵中将非战斗损失和战斗损失都定为1,是合理的估计。

既然都是估计,那为什么要建模呢?大多数情况下,我们确定收益,都是在估计,我们没有能力算出精确的收益和亏损。我们选择的策略,也都建立在估计来的收益的基础上。既然都是估计,建立模型好歹算是一种分析方法,怎么也比毫无方法的空想精确(如果谁有更精确的方法,请告诉我)。

在华容道这一局博弈中,曹操因为一败涂地,仓皇逃命,无暇细思,忙中出错,放弃了严格的优选策略,还情有可原;诸葛亮时间宽裕,准备充分,却依旧大失水准,只能让人叹息了。

一分钟研究博弈论(这才是真正的博弈论)(2)

第五大洋:历史百家争鸣特约作者。 1987生于中国青岛,毕业于青岛大学汉语言文学专业,取得文学学士学位。现任天津某事业单位助理工程师。业余历史爱好者,信奉美国联邦大法官理查德·A波斯纳为首的法律经济学流派,热衷于使用现代经济学分析方法分析历史事件。座右铭:存在不一定合理,存在一定有原因。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页