第1章 博弈论基本模型
发布时间:2021-06-11
发布时间:2021-06-11
第1章 博弈论基本模型
第1章 博弈论基本模型 章(Game Theory)
华侨大学商学院
第1章 博弈论基本模型
什么是学习? 什么是学习?大学之道, 学习的三个层次(大学之道,在明明德,在亲民,在止于至善 大学之道 在明明德,在亲民,在止于至善) 专业学习: 专业学习:谋职,谋生(身无长物,何以生存). 事理学习: 事理学习:明白事理,懂得分析生活中的很多问题.(崔琦: 明白这个世界是一个什么样子,这很重要).一个人,其实只 要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质 世界中生活的很好.但这只是像一个盲人一样在生活,"春天 来了,但我却看不到" .(明明德) 人生学习: 人生学习:充实人生,提高人生的境界,把学习融入人的生活 中.人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习.一 个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来 也不思考什么是天行健,好像也是在生活.看看很多人下班后 在做什么?打牌,或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味. (身体在成长,心灵也在成长吗?)(新民) 仰望星空
第1章 博弈论基本模型
为什么学习? 为什么学习?从学习中获得心灵的提高,获得心灵的享受. 学习,其实就为自己创造一个美丽的心灵世界的过程. 有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些"无用"的知识,你怎么驾驭哪些实用的知识呢? "世人只知有用之用,而不知无用只用". 很多人30岁后就不再读书,到60岁还是30年前的思维;很多人感 慨"现在一读书就头痛";农村现在不要为生存而挣扎了,那做 什么呢?"我不打牌又做什么呢?" 每个人都生活在现实的物质世界和心灵的精神世界中,但很多人 只知现实世界的繁华,却不知心灵世界的清新和高远.行万里路, 读万卷书,就是为追求心灵世界.这些年我深刻体会到:生活的 基础是衣食住行,但生活的重点在于文化和精神.我不知道文化 有什么用,我只知道一个人没有了文化还有什么用呢? 教师的功能:催化剂(使学生更快速更深入地学习) 教师的功能:催化剂(使学生更快速更深入地学习) 大医医心:能医心者,才是大医. 大医医心:能医心者,才是大医.
第1章 博弈论基本模型
0一,从三国演义谈起
绪 论
1,曹操走华容道,有一条大路和一条小路,走哪条路呢? 2,田忌与齐王赛马,孙膑出主意. 3,三个和尚没水喝,为什么? 4,一个村子里,道路泥泞,村子里一家很富有,其他贫穷, 该修一条好路,能修成吗? 5,剪刀-石头-布,为什么成为猜先的选择? 6,黔驴是如何技穷的? 7,A,B,C三人去钓鱼,A钓了5条,B钓了3条,C没钓着, 中午一起吃饭,把钓的鱼吃完了,C不好意思,就给了A和B 共8元钱,A和B如何分配?
第1章 博弈论基本模型
二,什么是博弈论1,安
踏的广告是什么? 2,一般人平时的思维是怎么样的? (决策,只知其一不知其二)("我以为…","我觉得…") 3,博弈论的思想是什么?(对策) 博弈,就是对手之间的游戏(game),在游戏中如何做到立 于不败之地. 博:? 弈:? 下棋的最高享受是什么? 囚徒困境(Prisoner's dilemma) 囚徒困境
第1章 博弈论基本模型
博弈论的创立与发展1,博弈论思想最早产生于我国古代 ,2000多年前的春秋时期孙武在《孙子兵法》中论述的军事思想和治 国策略,就蕴育了丰富和深刻的博弈论思想. 田忌赛马:齐威王的上,中,下马分别优于大将田忌的上,中,下, 但田忌上马,中马分别优于齐威王的中,下马.比赛规则:每次双方各 出三匹马,一对一比赛三场,第一场的输方要赔一千金给赢方. 齐 田忌策略: 田忌策略: 田 结 果: 齐 谋士孙膑 策略: 策略: 田 结 果: 上马 ∨ 上马 中马 ∨ 中马 下马 ∨ 下马
田忌将军每次输掉三千金 上马 ∨ 下马 中马 ∧ 上马 下马 ∧ 中马
田忌将军胜二负一赢一千金
第1章 博弈论基本模型
博弈论的创立与发展2,博弈论的发展阶段 , 第一阶段:萌芽期(20世纪 年代前). 世纪40年代前 第一阶段:萌芽期 世纪 年代前 .利益冲突的研究是分散和初 步的,带有很大程度的随意性. 孙子兵法:古诺(Cournot,1883)—古诺的"双寡头垄断"模型;艾 奇 沃 思 (F.Y.Edgeworth , 1925)——" 双 寡 头 等 分 市 场 " ; 霍 特 林 (H.Hotelling,1929)——产品差异而引起的"价格竞争"模型;斯塔克 尔伯格(H.V.Stackelberg,1934)——"领导——跟随(leader—follower)" 模 型 ; 斯 威 齐 (P.M.Sweezy , 1939)——" 折 弯 的 需 求 曲 线 (Kinky Demand Curve)"模型等等. 第二阶段:创立期(20世纪 年代). 世纪40年代 第二阶段:创立期 世纪 年代 .博弈论首次系统地被引入经济 学. 1944年冯诺依曼(Von.Neuman)和摩根斯坦恩(Morgen Stlern)合作 出版了《对策论与经济行为》,从而奠定了合作博弈的理论与方法.
第1章 博弈论基本模型
博弈论的创立与发展第三阶段:大发展期(20世纪 世纪50's—90's).非合作博弈以及合作博弈的理论获得了 第三阶段: 大发展期 世纪 . 空前的发展. 纳什(Nash,1950)——n人非合作博弈及提出博弈均衡的定义 塔克(A Tucker)——提出"囚徒困境"(prisoner's dilemma)模型 泽尔腾(Selten,1965)——提出精练子博弈纳什均衡概念,并把这一概念引入到了 动态分析之中 海萨尼(J.Harsnyi,1967~1986)——提出贝叶斯纳什均衡概念,并把这一概念引入 不完全信息博弈模型研究 泽尔腾(Selten ,1975),克瑞普斯(Kreps,1982)和威尔森(Wilson,1982). 弗得伯格(Fudenberg,1991)和泰勒尔(Tirole,1991)研究了精练贝叶斯纳什均衡, 解决动态不完全信息博弈.泽尔腾定义了"颤抖手均衡"(trembling hand equilibrium); 克瑞普斯和威尔森定义了"序贯均衡"(Sequential equilibrium)并提出了著名的"信誉" 问题模型
;弗得伯格和泰勒尔给出了"精练贝叶斯均衡"的正式定义. 颤抖手均衡>序贯均衡>精练贝叶斯均衡(但在许多情况下,三个概念是一致的) 博弈论近期发展:除了博弈论与信息经济学的结合外,还出现了新的理论与应用分 支诸如博弈学习理论,进化(演化)博弈论,博弈论与新制度经济学,博弈论与行为科学, 博弈论与实验经济学,博弈论与组织管理的结合.
第1章 博弈论基本模型
1.1 有限扩展型博弈模型博弈模型的构建 应用博弈论方法分析研究问题,首先要构造出博弈模型来,因 而需要从大量的博弈活动中抽象出博弈模型的基本要素,对这 些要素进行严格,准确的刻画后,形成博弈模型. 将博弈活动构造成博弈模型,需要了解以下6个方面的情况: 1.局中人; 2.外生事件的概率分布; 3.局中人选择行动的次序; 4.局中人所能选择的行动; 5. 局中人在选择行动时所了解的信息. 6.局中人的支付.
第1章 博弈论基本模型
构造博弈模型所需要的要素N = {0,1,2, L, n} ,称 N 为局中人或参与人集合.N 中元素称为参与人或局 中人.参与人不专指人,它泛指参与博弈活动的政府,企业,地区,国家, 个人……等决策主体.通常用"0"表示虚拟局中人,它的行为是以确定的 概率分布进行随机选择, i = 1,2, L , 表示实际参与人. n
1.局中人集合 局中人集合
2.行动集合 行动集合
称参与人 i ∈ N在博弈中所有可能选择的行动构成的集合 A i 为局中人i的行 行 动集合. 行动. 动集合 A i 中的元素 a i 称为局中人i 的行动 行动 局中人的行动集合可能是有限集,也可能是无限集.如果博弈活动中每个 局中人的行动集合都是有限集,且每个局中人行动的次数也是有限的,称 该博弈为有限博弈 有限博弈. 有限博弈
3.博弈树 博弈树对于有限博弈,可用博弈树直观地刻画它,市场进入问题的博弈树如图1-1 所示(见p2上的例子).
第1章 博弈论基本模型
旺 盛
I ① 01
疲软
①进 入② 容 许 不 进 容 许 进 入②
①不 进 抵 制
图1-1 市场进入博弈树
4. 支付向量 博弈树中终点Z下面的向量 u = (u1,u 2 , L , u n ) 称为支付向 支付向 i(= 1,2, L , n) 个分量表示博弈结束于Z时,局中 量,它的第 人i所得的支付.支付可表示参与人的某种收益或损失.本书 中的支付指收益,效用,利润等.正式地,支付向量是终点 集合Z到n维向量集合R n 的映射.
U : Z → R n , U ( z ) = (u1 ( z ),u 2 ( z ), L , u n ( z )), z ∈ Z
第1章 博弈论基本模型
5. 信息集与信息集分割 信息集由同一个局中人,在相同的时点上的具有相同信息 的决策节点组成.用 I ik (i = 0,1,2, L , n, k = 0,1,2, L , ri )表示局中 人i的第k个信息集.它满足 I (1) ik ≠ Φ ( Φ 表示空集); (2)从博弈起始点到任一终点的路径至多与 I ik 交一点 (描写同一信息集中的节点处于同一时点上); (3)从 I ik 中的任一节点出发,局中人i可能
选择的行动集 合都相同(因为局中人在同一信息集的不同节点上具有相 同的信息). 在博弈树上,将属于同一信息集的节点用虚线框在一起. 称 I i = {I i1 , I i 2 , L,I ir } 为局中人 i(= 0,1,2, L , n) 的信息集类 信息集类(在数 信息集类 学上,称以集合为元素的集合为类). 称 I = {I 0 , I 1 , I 2 , L,I n } 为信息集分割 信息集分割. 信息集分割i
第1章 博弈论基本模型
有限扩展型博弈模型的定义 定义1.1 称 G = N, Y, U, I, q 为有限扩展型博弈模型.其中N为参与 有限扩展型博弈模型. 定义 有限扩展型博弈模型 人集合,Y为博弈树,U为支付向量,I为信息集分割,q为外生事件的 概率分布. 完全信息博弈与不完全信息博弈 如果所有的局中人对构成G的元素N,Y,U,I,q都完全了解,称G为完全 完全 信息博弈,否则为不完全信息博弈 不完全信息博弈. 信息博弈 不完全信息博弈 静态博弈与动态博弈 如果所有的局中人都同时选择行动,称G为静态博弈 静态博弈,否则,称G为 静态博弈 动态博弈.静态博弈 动态博弈 静态博弈更本质的特征是所有局中人在选择行动时不知道 静态博弈 对手选择了什么行动.
第1章 博弈论基本模型
例1.1 考虑按以下步骤进行的博弈活动. 第1步 局中人1从字母T,H中选一个; 第2步 局中人2不知第1步的选择,再从H,T中选一字母; 第3步 局中人知道1,2两步的选择,又从T,H中选一字母; 第4步 局中人2不知第3步的选择,但知1,2两步的选择,最后 从T,H中选一字母,博弈结束.按照每步选择的结果,每个局 中人各得一笔报酬(略). 该博弈的局中人集合 N = {1,2.} 该博弈的信息集合分别为I = {I1 , I 2 } ,其中 I1 = {I11 , I12 , I13,I14 , I15 }, I 2 = {I 21 , I 22 , I 23,I 24 , I 25 } .T ② T ① I12 T ② I 22 T H T H ② HT T ② H H ① ①
I11H ② T H ① I15 T ② H T ② I 25 H T H ② H
I 21
I13H T ② T H ② T
① I14 H
I 23
I 24H T
图1-2
第1章 博弈论基本模型
信息集可以告诉我们以下4点 信息集可以告诉我们以下 点 1.在一个信息集上应由哪个参与人选择行动. 2.从一个信息集出发,局中人可能选择哪些行动. 3.局中人在一个信息集上选择行动时已知道了哪些信息. 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息 集的博弈历程. 完美信息博弈 如果G的每个信息集都是单点信息集.表明博弈的每个参与人 在选择行动时对博弈到现在为止的历程都完全了解,这时称G 为完美信息博弈 完美信息博弈. 完美信息博弈 扩展型博弈不仅能刻画动态博弈, 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈
第1章 博弈论基本模型
静态扩展型博弈的例子例1.2 两个参与人同时从字母T,H中选择一个,博弈结束时 两个参与人各得一笔支付,该博弈的博弈树如图1-3所示. 练习:写出剪刀-石头-布的博弈树.T ② T H 图1-3 ①
I11H ② T H
I 21
囚徒困境问题: 囚
徒困境问题:p11 例1.6 完全信息: 完全信息:博弈各方对各个节点的 支付都很明了. 支付都很明了. 完美信息: 完美信息:博弈各方对博弈进行的路 径都很明了,完美信息这一概念只用 径都很明了, 于动态博弈. 于动态博弈.
① I11坦白 抗拒
②坦白 抗拒
I 21坦白
②抗拒
5 5
0 8
8 0
1 1
图1-4
第1章 博弈论基本模型
扩展型博弈的子博弈 扩展型博弈的子博弈 扩展型博弈的子博弈大体上说是原博弈的一部分,但 它不能破坏原博弈的信息集. 定义1.2 设 G = N, Y, U, I, P 为一有限扩展型博弈,从Y的决 定义 策节点h出发的子博弈 G = N , Y , U , I , P 满足 子博弈 (1)h是G的单点信息集; (2) N h N ; (3) Yh 是Y的子树,它由h及其后的所有节点与终 点构成; (4)G h 不能割裂G的信息集; Nh Gh (5)若"自然"仍属于 ,则 中"自然"的概率 分布 P = P h ; U ( z) = U ( z) Ph (6)设Z为 的终点,支付向量 .h h h h h h
h
第1章 博弈论基本模型
1.2 有限扩展型博弈的策略策略的定义 定义1.3 局中人 i = 1,2, L , n 的策略集合 S i 表示, 策略集合用 定义 策略集合 Si si 策略.它定义为局中 中的元素 称为局中人 i 的策略 策略 Ai Ii 人i的信息集类 到行动集 i 的映射:S i : I i → Ai , S i ( I ik ) = a i , a i ∈ Ai , i = 1,2, L , n, k = 1,2, L , ri
策略是信息集的映射,行动是映射值. 策略是信息集的映射,行动是映射值.两者是不 同的概念.相当于策略是函数,行动是函数值. 同的概念.相当于策略是函数,行动是函数值.
第1章 博弈论基本模型
例1.3 考虑图1-1所示的扩展型博弈的策略.(p7)旺 盛
◎I11不 进
I01疲软
①进 I 入② 21 容 许
①进 入② 容 许
I22抵 制
不 进
S1 =
图1-1 市场进入博弈树
{a
, 11 a 12 }
S 2 = {( x1 , x2 ) x1
= a 21,a 22 ,
x2
= a 21,a 22 }
= {( a 21, a 21 ), ( a 21, a 22 ), ( a 22, a 21 ), ( a 22, a 22 )}
策略 (a 22 , a 21 ) 表明参与人2 在第1个信息集 I 21 上 选择行动 , a 22 I 22 a 21 在第2个信息集 上选择行动 .其余策略可同样理解.a11---进入;a12---不进入;a21---允许;,a22---抵制. x1---表示2在I21上选择的行动,可以是a21和a22; x2---是在I22上的选择.
第1章 博弈论基本模型
例1.4 考虑例1.1所给出的扩展型博弈的策 略.S1 = {( x1 , x 2 , x3,x 4 , x5 ) x = T, H, k = 1,2,3,4,5} k
S 2 = S1
例1.5 考虑例1.2给出的扩展型博弈的策略. 在静态博弈模型中,局中人策略与行动等 在静态博弈模型中, 同.s1 = A1 = {T, H}, s 2 = A 2 = {T, H}
第1章 博弈论基本模型
1.3 一般扩展型博弈模型构成一般扩展型博弈模型的要素 (1)一个有限的局中人集合:N = {0,1,2,L, N},其中"0"表示虚拟局中人—"自 然",它以确定的概率分布进行随机选择. (2)一个满足下列三条性质的行动序列集合H. ①H中包含一个空序列,即 Φ ∈ H ; ②如果局中人的有限行动序列 (a k )K=1 ∈ H,则对 正整数 L < K ,都有 k (a k )∞=1 ∈ H; k k ∞
③对于局中人的无限行动序列 ( a ) k =1 ,若对任何正整数 L 都 k ∞ L 有 (a k )k =1 ∈ H ,则 (a k )∞=1 ∈ H,否则 ( a ) k =1 H.称满足以上三条性质的行 k 动序列集合H为历史集 历史集.称历史集中的元素 h ∈ H为博弈的一段历史 一段历史. 历史集 一段历史 k k +1 称一段历史 (a ) k =1 ∈ H为博弈的终点,如果它是无限的(k = ∞ )或不 k K 存在 a k +1 使 (a ) k =1 ∈ H.博弈全体终点构成集合记为 Z . (3)局中人映射 P : H \ Z → N, P(h ) = i, h ∈ H \ Z ,表示历史h之后应由局中人i 选择行动. (4)定义"自然"的行动集合上的概率分布为q.