耶鲁公开课--博弈论笔记(6)
发布时间:2021-06-06
发布时间:2021-06-06
如图:X轴P(r)表示 、play2选择R策略的概率;Y轴表示play1的预期得分。
当P(r)=0时,就是说play2选择L策略。play1选择u,m,d 时的得分分别是5,1,3。 当P(r)=100%时,就是说play2选择R策略。play1选择u,m,d 时的得分分别是0,4,2。 将这六个点分别在图中标出,然后连成直线。就得出了三个函数:
U1(u,p(r))=5-5p(r); ... ...(play1选择u策略时,得分随play2选择R策略的概率变化而变化的函数)
U1(m,p(r))=3p(r)+1;
U1(d,p(r))=-2p(r)+4.
其中三条直线有三个交点,分别位于P(r)=1/3;1/2;3/5 三处。
结论:从图中可以看出,Play1要得分最高,要根据Play2的P(r)不同分三段来选择策略。 当P(r)小于1/3时,应该选择u策略;当P(r)大于1/3小于3/5时;应该选择中间的线外外代表的策略d;当P(r)大于3/5时,应该选择m策略。
上一篇:跳棋社团活动计划