博弈论完美的纳什均衡(博弈论2)

纳什均衡

又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作最佳应对。 如果两个博弈的局中人的策略组合分别构成各自的最佳应对,那么这个组合就被定义为纳什均衡。

博弈论完美的纳什均衡(博弈论2)(1)

在给出纳什均衡解释前,我们先得把一个概念说清楚最佳应对。

最佳应对

博弈论完美的纳什均衡(博弈论2)(2)

纳什均衡

纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的最佳对应,则称该局势是一个纳什均衡

博弈论完美的纳什均衡(博弈论2)(3)

占优策略

如果一个局中人的某个策略对其他局中人的任何策略都是最佳对应,那么这个策略就是该局中人的占优策略

在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。

经典示例

首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是双方都坦白,属于占优策略

博弈论完美的纳什均衡(博弈论2)(4)

  • 当处于 (-1,-1)(−1,−1) 局势时,如果一方改变就可能从 -1 到 0
  • 而在 (-3,-3)(−3,−3) 的局势时,如果一方改变就可能从 -3 到 -10

其实不管局中人 2 是抗拒还是坦白,对于局中人的最佳应对都是坦白。从而可以看出纳什均衡点并不一定是整体的最优解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里最佳应对是无论对手进行策略对自己都是最佳策略,在最后 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。

博弈论完美的纳什均衡(博弈论2)(5)

博弈论完美的纳什均衡(博弈论2)(6)

这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q

  • 丈夫选择看足球策略的期望收益

博弈论完美的纳什均衡(博弈论2)(7)

丈夫选择了看足球,当妻子以概率 1-p 也选择了看足球会得到收益 2

  • 丈夫选择看舞蹈策略的期望收益

博弈论完美的纳什均衡(博弈论2)(8)

妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同

博弈论完美的纳什均衡(博弈论2)(9)

妻子选择看足球策略的期望收益

博弈论完美的纳什均衡(博弈论2)(10)

妻子选择了看足球,当丈夫以概率 1-q 也选择了看足球会得到收益 1

  • 妻子选择看舞蹈策略的期望收益

纯策略纳什均衡(Pure-Strategy Nash Equilibrium)与混合策略纳什均衡(Mixed-Strategy Nash Equilibrium)的区别就在于此,任何一个有限的博弈都有一个混合策略纳什均衡(这个证明来自于纳什定理),但不是每一个博弈都有纯策略纳什均衡。在这里,我们表述为:任何二元矩阵博弈都有纳什均衡

当丈夫给出概率分布不会让妻子在看足球和看,关于以我对丈夫了解他更喜欢看足球,

  • 2/3 的概率会选择去看足球
  • 1/3 的概率会选择去看舞蹈
混合策略下
  • 混合策略: 每个局中人以某个概率分布在其策略集合中选择策略
  • 混合策略下的纳什均衡:定义和纯策略纳什均衡一致:基于最佳应对定义必要条件: 给定其他局中人的策略选择概率分布的情况下,当前局中人选择任意一个(纯)策略获得的期望效用相等

博弈论完美的纳什均衡(博弈论2)(11)

博弈论完美的纳什均衡(博弈论2)(12)

博弈论完美的纳什均衡(博弈论2)(13)

剪刀—石头—布的混合纳什均衡态

  • 如果局中人没有遵循 1/3 的随机策略,谁就会失去有利位置
  • 每个玩家各以 1/3 的概率
  • 期望收益为 0
纳什定理

任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)

纳什均衡的存在性与多重性
  • 占优均衡:例如囚徒困境
  • 纯策略纳什均衡:性别之战
  • 混合策略纳什均衡
,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页