论博弈论中的策略思维(2)
发布时间:2021-06-06
发布时间:2021-06-06
学习博弈论,提高自身策略思维
上海经济研究 2010年第1期表彰他们在机制设计理论方面的开拓性工作,机制设计理论为博弈论的运用搭建了一个更加广阔的平台,同时与经济政策的关系也更为密切。至此,共有13位经济学家和数学家与诺贝尔经济学奖结下不解之缘。
那么博弈论为什么能在经济学领域产生如此巨大的影响呢?又何以在经济分析中独辟蹊径,形成了能与(随机)一般均衡理论相对立的另一种经济学研究范式?这恐怕还得益于博弈论的起源和其中蕴含的策略思维。博弈论从本质上讲是一种游戏理论,在给定游戏的特定规则(信息结构)下,游戏参与人要想赢得游戏就必须对其他参与人的心理和可能采取的行动进行反复揣摩,并据此决定和调整自己的行为,这就是制定策略或对策的过程。为此, 博弈论#一般也称为 对策论#或 游戏理论#。加之博弈论的游戏情节一般也源于人们的真实生活,是生活环境的抽象和概念化,因此,博弈的结果不仅仅是游戏胜败的表现,而且更是生活哲理的凝结,它为人们深刻理解和准确把握各类社会经济现象提供了一份独特的视角,同时对制定社会规则和经济政策具有现实的指导意义。
本文试图从一些常见的实例介绍和展示博弈论中策略思维的演进过程,这些实例都是我们能在生活中观察到的,并且假设读者已经具备一定的博弈论和拍卖理论的基础知识。
一、 囚徒困境#:合作还是不合作
考虑这样一种情形,小偷甲和乙联手作案,私入民宅被警方逮住,但未获证据。警方将两人分别置于两所房间分开审讯。若一人招供但另一人不招,则招供者立即释放,不招供者判入狱10年;若二人都招供则各判刑8年;若两人都不招供则因未获证据但私入民宅而各拘留1年(见表1)。试问甲和乙应该如何抉择自己的行为?理性行为人的想法是这样的:对甲来说,无论乙是选择 招#还是 不招#,选择 招#都会比选择 不招#来得更好。因此, 不招#是相对于 招#的严格劣策略,所以,甲会选择 招#。同理,根据对称性,乙也会选择 招#,于是纳什均衡解便是甲乙两人都招供,各判8年。这个例子表明,运用 剔除严格劣策略#的方法可以找到问题的均衡解。虽然甲乙两人都选择 不招#是集体最优的,但是这个结果不会出现,或者说,甲乙双方都存在偏离这一结果的激励,个体理性与集体理性之间存在着冲突。假设从两人都不招供出发,只要其中一人变卦,他就能谋取更多的利益。为此,即便甲乙两人都有不招供的约定在先,这样的约定也只能是 不可置信的承诺#而已,故而纳什均衡解具有内在稳定性。
表1囚徒困境博弈支付矩阵招供
招供
不招供-8,-8-10,0不招供0,-10-1,-1 表2修路博弈支付矩阵修修不修1,13,-1不修-1,30,0
下面我们让模型活动起来,也就是说,考虑甲乙两人刑满释放后重新作案,却又被警方逮住,重复上述过程,以此往复。这样的情形称为重复博弈,重复博弈的每次博弈称作阶段博弈。分析阶段博弈和分析一次性博弈的情形十分类似,理性行为人在行动前,依旧会根据各种方案收益与成本的比较,作出最优选择。但不可忽略的是,行为人过去的行为信息将作为共同知识影响行为人当下的决策。在囚徒困境的重复博弈中,有两种著名的策略,一种叫 冷酷#策略(grimstrategy),另一种叫 针锋相对#策略(tic for tacstrategy)。所谓 冷酷#策略是指对于事先两人均不招供的攻守同盟,一旦有人招供,则对方在以后的任一阶段博弈中,都将选择招供,以示对对方违约的惩罚,对方也将丧失改正错误的机会;而 针锋相对#策略是指行为人在本阶段选择对方前一阶段的行为选择,相
上一篇:整顿干部作风自查整改措施