第三章 混合策略纳什均衡

发布时间:2024-11-25

博弈论教程

§ 第三章 混合策略纳什均衡 混合策略与期望支付 计算混合策略纳什均衡的三种方法 支付最大值法 支付等值法 反应函数法 多重纳什均衡及其甄别 混合博弈在现实经济中的运用案例

博弈论教程

§剪刀、石头、布的游戏 每个同学跟后面一排对应的同学玩剪刀、石 头、布的游戏. 玩二十次,将结果记下来 赢了十次以上同学举起手来 告诉我你有什么秘决 怎么样才能赢得多?

博弈论教程

§剪刀、石头、布的游戏 我们知道—— 如果博弈只进行一次,我们无法明确预测博 弈的结果,不管是哪个博弈方,也不管他们 的选择是哪个策略,都不能保证得到较好的 结果。根据我们上一章所学的方法,这个博 弈没有纳什均衡。 那么是不是意味着这样的博弈中,你可以随 意选择,结果都一样呢?

博弈论教程

§剪刀、石头、布的游戏 答案是否定的。 事实上,局中人的选择仍然是很有讲究的, 策略选择的好坏对局中人的利益仍然有很大 的影响。 在这个零和博弈里,无论双方采用哪种策略 组合,结果都是一方输一方赢,而输的一方 又总是可以通过单独改变策略而反输为赢。 如果哪个局中人能找到对手方的规律或者偏 好,他就能猜测到对手的策略而采用针对性 策略从而保证赢。

博弈论教程

§剪刀、石头、布的游戏 因此,秘决在于—— 自己的策略选择不能预先被对手方知道或猜 测到,在该博弈的多次重复中,博弈方一定 要避免自己的选择具有规律性; 观察对手方策略选择是否具有规律或者偏好, 预先猜测对手策略,从而采用针对性策略赢 得这个博弈。

博弈论教程

§ 第三章 混合策略纳什均衡 纯策略(pure strategies):如果一个策略规 定参与人在一个给定的信息情况下只选择一 种特定的行动。 混合策略(mixed strategies):如果一个策 略规定参与人在给定的信息情况下,以某种 概率分布随机地选择不同的行动。 在静态博弈里,纯策略等价于特定的行动, 混合策略是不同行动之间的随机选择。

博弈论教程

§ 期望支付 与混合策略(mixed strategies)相伴随的一个问 题,是局中人支付的不确定性(uncertainty).可用 期望支付(expected payoff)来描述——有个n可 能的取值X1,X2…,Xn ,并且这些取值发生的概率 分别为p1,p2,…,pn,那么我们可以将这个数量指 标的期望值定义为发生概率作为权重的所有可能 取值的加权平均,也就是EUA

p 1 X 1 p 2 X 2 ... p n X n

博弈论教程

政府和流浪汉的博弈 政府想帮助流浪汉,但前提是后者必须试图寻 找工作,否则,不予帮助;而流浪汉若知道政 府采用救济策略的话,他就不会寻找工作。他 们只有在得不到政府救济时才会寻找工

作。他 们获得的支付如图所示:流浪汉

寻找工作救济 政府 不救济

游闲

(3,2) (-1,3)

(-1,1) (0,0)

博弈论教程

政府和流浪汉的博弈 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡? ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗? 那么政府和流浪汉最有可能采用什么策略? ——使自己的预期支付最大化。 ——若能够猜的对方的策略,就可以采用针 对性的策略,使自己的支付增加。

博弈论教程

求解混合策略纳什均衡1、假定政府采用混合策略: G ,1

1 的概率选择不救济。

即政府以 的概率选择救济,

2、流浪汉的混合策略为: L

,1

的概率选择寻找工作,

即流浪汉以

1 的概率选择游闲。

博弈论教程

解一:支付最大化 那么,政府的期望效用函数为:v G

3 5 1 G

,

L

1 1

1

0 1

对上述效用函数求微分,得到政府最优化的一阶条件 为: vG 5 1 0

0 .2

就是说,从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作,0 .8的概率选择 游闲。

博弈论教程

解一:支付最大化 流浪汉的期望效用函数为:

L

2 1 0

0 .5

博弈论教程

解二:支付等值法 政府选择救济策略 1期望效用 v G 1,

政府选择不救济策略 0

期望效用 1 1

3

v G 0 ,

1 0 1

4 1

如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即: v G 1, 4 1 v G 0 ,

0 .2

博弈论教程

解二:支付等值法如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:

v L 1, 1 3 v L 0 ,

0 .5

博弈论教程

政府和流浪汉的博弈 如果政府救济的概率小于0.5; 则流浪汉的最优选择是寻找工作; 如果政府救济的概率大于0.5; 则流浪汉的最优选择是游闲等待救济。 如果政府救济的概率正好等于0.5; 流浪汉的选择无差异。

博弈论教程

讨论 上面的均衡要求每个参与人以特定的概率 选择纯策略。也就是说,一个参与人选择 不同策略的概率不是由他自己的支付决定 的,而是由他的对手的支付决定的。 正是由于这个原因,许多人认为混合策略 纳什均衡是一个难以令

人满意的概念。 事实上,正是因为它在几个(或全部)策 略之间是无差异的,他的行为才难以预测, 混合策略纳什均衡才会存在。

第三章 混合策略纳什均衡.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219