Your SlideShare is downloading. ×
0
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
this is test api2
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

this is test api2

687

Published on

this is test api2

this is test api2

Published in: Spiritual
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
687
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 普通高等教育“ 十一五” 国家级规划教材 第三章 信息与非合作博弈理 论
  • 2. 3 信息与非合作博弈理论 教学目标 了解博弈论的基本概念 掌握非合作博弈的种类及其均衡解之间的关系 会求博弈的一些基本类型的均衡解
  • 3. 3 信息与非合作博弈理论 博弈论概述 3 .1 完全信息静态博弈 3 .2 完全信息动态博弈 3 .3 3 .4 不完全信息静态博弈 3 .5 不完全信息动态博弈
  • 4. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.1 什么是博弈论 博弈论( game theory )定义: 研究决策主体的行为发生直接相互作用时候的决策 以及这种决策的均衡问题的,是专门研究博弈如何出现均 衡的规律的学科。 博弈论的相关概念包括:参与人、行动、战略、信 息、共同知识、支付函数、结果、均衡。
  • 5. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.2 博弈的分类 非合作博弈 参与人行动的先后顺序 参与人对对手信息的掌握 静态博弈 完全信息博弈 动态博弈 不完全信息博弈
  • 6. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.2 博弈的分类 表 3.1 博弈的分类及对应的均衡概念 静态 动态 完全信息静态博弈; 完全信息动态博弈; 完全信息 纳什均衡; 子博弈精炼纳什均衡; 代表人物:纳什 代表人物:泽尔腾( 1965 ) ( 1950 , 1951 ) 不完全信息静态博弈; 不完全信息动态博弈; 贝叶斯纳什均衡; 精炼贝叶斯纳什均衡; 不完全信息 代表人物:泽尔腾( 1975 ), 代表人物:海萨尼 ( 1967-1968 ) 克瑞普斯和威尔逊( 1982 ), 费登伯格和泰勒尔( 1991 )
  • 7. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.3 博弈论的发展简述 1944 年,冯 · 诺伊曼和摩根斯坦恩合作的 《博弈论和经济行为》一书的出版 博 50 年代,合作博弈发展到鼎盛时期 弈 论 60 年代,出现了泽尔腾 , 海萨尼等一些重要人物 的 发 80 年代,出现了几个比较有影响的人物, 展 包括克瑞普斯和威尔逊 80 年代以后,博弈论逐渐成为主流经济学的一部分, 甚至可以说成为微观经济学的基础
  • 8. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.1 博弈的战略式表述 战略式表述 1 2 3 博弈的参与人集 每个参与人的 每个参与人的 合: 策略空间 支付函数 i∈Γ,Γ= ( 1,2, Si,i=1,2,…,n ui(s1,…si, …,n ) …,sn),i=1,2, …,n 一般用 G={S1,S2,…Sn;u1,u2,…un} 表示战略式博弈。
  • 9. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.1 博弈的战略式表述 表 3.2 房地产开发博弈 ( a )高需求情况 开发商 B 开发 不开发 开发商 A 开发 4000 , 4000 8000 , 0 不开发 0 , 8000 0,0
  • 10. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.1 博弈的战略式表述 表 3.2 房地产开发博弈 ( b )低需求情况 开发商 B 开发 不开发 开发商 A 开发 -3000 , -300 1000 , 0 0 不开发 0 , 1000 0,0
  • 11. 3 信息与非合作博弈理论 ∀ 3 .2 完全信息静态博弈 3.2.2 纳什均衡 1 、占优战略均衡 一个参与人的最优战略并不依赖于其他参与人的战略 选择,即不论其他参与人选择什么战略,他的最优战略是唯一 的,这样的最优战略被称为“占优战略”( dominant strategy )。 表 3.3 囚徒困境 囚犯 B 坦白 抵赖 囚犯 A 坦白 -8 , -8 0 , -10 -10 , 0 -1 , -1 抵赖
  • 12. 3 信息与非合作博弈理论 ∀ 3 .2 完全信息静态博弈 3.2.2 纳什均衡 1 、占优战略均衡 占优战略 si * ui (si*,s-i) >ui (si′,s-i) , si′ ≠si* 在博弈的战略式表述中,如果对 于所有的 i , si* 是 i 占优战略, 占优战略均衡 那么,战略组合 s*= ( s1*, …,sn* )就称为占优战略均衡
  • 13. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 战略组合 s*= (s1*,…,sn*) 称为重复剔除的占优均衡,如 果它是重复剔除劣战略后剩下的唯一的战略组合。如果这种唯 一的战略组合是存在的,我们说该博弈是重复剔除占优可解的 。
  • 14. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 表 3.4 抽象博弈 参与人 2 左 中 右 1,0 1,2 0,1 参与人 1 上 0,3 0,1 2,0 下
  • 15. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 表 3.5 抽象博弈 参与人 2 左 中 1,0 1,2 参与人 1 上 0,3 0,1 下
  • 16. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 表 3.6 抽象博弈 参与人 2 左 中 1,0 1,2 参与人 1 上 显然,(上,中)就是该博弈唯一的均衡解。这种方 法在博弈论中被称为重复剔除严格劣战略。
  • 17. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 G={S1,S2 ,… Sn;u1,u2, … , un} 中 , 战略组合 s*= (s1 *,s2 *,…,sn*) 是一个纳什 均衡 如果对于每一个 i, si* 是给定 或: si* 是下述最大化问题的解 其他参与人的选择 s-i*=(s1*, : …,si-1*,si+1*,…,sn*) 的情况下 , si*∈argmax ui(s1*, 第 i 个人的最优战略 , 即 ui … , si-1*,si,si+1*,… , sn*), (si*,s-i*)≥ui (si,s-i*) , si*∈Si*,i∈Γ si*∈Si*, i=1,2,… , n
  • 18. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 在两人有限博弈中,求解纳什均衡有一种简单的方法:划线法。 表 3.7 抽象博弈 参与人 B L C R U 0,4 4,0 5,3 参与人 A 4,0 0,4 5,3 M 3,5 3,5 6,6 D
  • 19. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 纳什均衡有强弱之分。上述定义中给出的是弱纳什 均衡 , 一个纳什均衡是强的 , 如果给定其他参与人的策略 , 每 一个参与人的选择是唯一的。即 ,s* 是一个强 Nash 均衡 , 当 且仅当对每一个 i , si′≠si* ,总有 ui (si*,s-i*)>ui (si′,s-i*) 。在 有些博弈中,纳什均衡存在,但它不是强纳什均衡。如表 3.8 的博弈中,( U,L )和 (U,R) 都是纳什均衡,但没有一个是强 纳什均衡。
  • 20. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 表 3.8 抽象博弈 参与人 B L C R U 2 , 12 1 , 10 1 , 12 参与人 A M 0 , 12 0 , 10 0 , 11 0 , 12 0 , 12 0 , 1 D
  • 21. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.3 理论应用: Gournot 寡头竞争模型 设有两个参与人 , 分别称为企业 1 和企业 2, 每个企业的策 略是选择产量 , 得益是利润 , 它是两个企业产量的函数。我们用 qi∈[0,∞) 表示第 i 个企业的产量 ,Ci(qi) 表示成本函数 ,P= P(q1+q2) 表示逆需求函数。第 i 个企业的利润函数为 : πi (q1,q2)=qiP (q1 +q2) - Ci (qi ), i = 1, 2 (q1*,q2*) 是纳什均衡产量意味着 : q1*∈argmaxπ1 (q1,q2*) = q1P (q1+q2*) - C1 (q1) q2*∈argmaxπ2 (q1*,q2) = q2P (q1*+q2) - C2 (q2 )
  • 22. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.3 理论应用: Gournot 寡头竞争模型 找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并 令其为零 : Əπ1 / Əq1 = P (q1+q2) + q1P′(q1+q2) - C1′(q1) = 0 Əπ2 / Əq2 = P (q1+q2) + q2P′(q1+q2) - C2′(q2) = 0 上述两个一阶条件分别定义了两个反应函数 : q1*= R1 (q2) q2*= R2 (q1) 反应函数意味着每个企业的最优策略 ( 产量 ) 是另一个企业产量 的函数 , 两个函数的交点就是纳什均衡 q*=(q1*,q2*) ,如下图。
  • 23. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.3 理论应用: Gournot 寡头竞争模型 Cournot模型 q2 R1(q2) NE q2* R2(q1) q1 O q1* 图 3.1 Gournot 模型的 纳什均衡
  • 24. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.4 混合战略纳什均衡 表 3.9 猜硬币游戏 儿童 B 正面 反面 儿童 A 正面 -1 , 1 1 , -1 反面 -1 1, -1 , 1 表 3.10 社会福利博弈 流浪汉 寻找工作 游荡 政府 救济 , 2 3 -1 , 3 -1 , 1 0,0 不救济
  • 25. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.4 混合战略纳什均衡 定义 在博弈 G = {S1,S2,…Sn;u1,u2,…un} 中,参与人 的战略空间为 Si={si1,si2,…sik}, 则参与人 i 以概率分布 σi= (σi1,… σi k) 随机地在其 k 个可选战略中选择的“战略”称为-个混合 战略。其中 0≤σij≤1, 且∑ σij=1 。 这样,纯战略可以理解为混合战略的特例,如纯战略 si’ 可以看作是混合策略 σi=(1,0,…0), 即选择纯战略 si’ 的概率为 1 ,选择任何其它纯战略的概率为 0 。
  • 26. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 外生事 扩展式表 件概率 集合 述 支付函 数 行动 顺序 信息集 行动空 间
  • 27. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 h 表示信 hA(1) A 息集 开发 不开发 N hN(2) N hN(1) 需求大 需求小 需求大 需求小 B hB(3 B hB(1) B hB(2 B hB(4) ) ) 开发 不开发 开发 不开发 开发 不开发 开发 不开发 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) 单位 : 千万 元 图 3.2 房地产开发博弈
  • 28. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 结 博弈树基 本元素 枝 信息 集
  • 29. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 不允许出现下面的情况: 图 3.3 博弈树不允许的情况
  • 30. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.2 扩展式表述博弈的纳什均衡 h1(1) 1 上 下 2 h2(2) 2 h2(1) 右 右 左 左 h1(3) h1(2) 1 1 1 1 A B A B C D C D 图 3.4 抽象例子
  • 31. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.2 扩展式表述博弈的纳什均衡 从上图抽象例子的博弈树我们可以得到,参与人 2 有两 个战略集 , 相应地也有两个信息集, A(h2(1))=A(h2(2))={ 左 , 右 } ,其中 H2={h2(1),h2(2)}; 参与人 2 的纯战略空间为 : S2= (A(h2(1)),Ah2(2))={( 左 , 右 )×( 左 , 右 )}={( 左 , 左 ),( 左 , 右 ), ( 右 , 左 ),( 右 , 右 )}, 其中纯战略 ( 左 , 左 ) 表明 : 当 1 取“上” 时 ,2 取“左” ; 当 1 取“下”时 ,2 取“左” , 如此等等。 参与人 1 有三个信息集 H1={hi(i),i=1,2,3},1 的纯战略空间 为 :S1=A(h1(1))×A(h1(2))×A(h1(3))={( 上 , 下 )×(A,B)×(C,D)}, 共 8 种纯战略。
  • 32. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.2 扩展式表述博弈的纳什均衡 定义 战略组合 s* 是扩展式博弈的一个纳什均衡,如果 对于所有的 i , si* 最大化 ui (si*,s-i*) ,即: si*∈arg max ui (si*,s-i*), 对于任意 i 注意,因为一个参与人的纳什均衡战略是假定其他参与 人的战略为给定时的最优战略,所有参与人似乎是在同时选择战 略。但这并不意味着在纳什均衡中,参与人一定是在同时选择行 动。 定理 一个有限完美信息博弈有一个纯战略纳什均衡。
  • 33. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 纳什均衡在原则上适用所有的博弈 , 但对于预测参与人 的行为来说 , 纳什均衡可能并不是一个合理的预测 , 如房地产博 弈: A 开发 不开发 B B 开发 不开发 开发 不开发 (-3,-3) (1,0) (0,1) (0,0) 图 3.5 房地产开发博弈 图 3.6 房地产开发博弈
  • 34. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 A 开发 不开发 B B 开发 不开发 开发 不开发 (-3,-3) (1,0) (0,1) (0,0) (a) 原博弈 B B 开发 不开发 开发 不开发 (-3,-3) (1,0) (0,1) (0,0) (c) 子博弈 (b) 子博弈 图 3.6 房地产开发博弈 图 3.7 房地产开发博弈
  • 35. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 正式地,我们有下述定义: 定义 一个扩展式表述博弈的子博弈 G 由一个决策结 x 和所有该决策结的后续结 T(x)( 包括终点结 ) 组成 , 它满足下列条 件 :⑴x 是一个单点信息集,即 h(x)={x};⑵ 对于所有的 x′∈T(x), 如果 x″∈h(x′), 则 x″∈T(x) 。
  • 36. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 1 U D 1 1 U D 2 2 U D 2 2 1 L R L R UL D R L R 2 2 2 2 3 图 3.8 3 3 3 L R L R C D C D C D C D L R L R 图 3.7 3.8 图 抽象博弈 图 3.8 抽象博弈 图 3.9 3 3 3 3 C D C D C D C D 图 3.9
  • 37. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 有了子博弈的概念,下面给出“子博弈精炼纳什均衡” 的正式定义: 定义 扩展式表述博弈的战略组合 s*=(s1*,… , si*,… sn*) 是一个子博弈精炼纳什均衡 , 如果满足 :(1) 它是原博弈的纳 什均衡 ;(2) 它在每一个子博弈上给出纳什均衡。
  • 38. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 2 、子博弈精炼纳什均衡的求解 --- 逆向归纳法 1 h1 L R h2 2 h2′ 2 A B C D 1 h1′ (2,0) (1,1) (0,1/2) E F (3,1) (2,2) 图 3.9 三阶段完美信息 图 3.11
  • 39. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.4 理论应用: Stackelberg 寡头竞争模型 如同在库诺特模型中一样,在斯坦科尔伯格模型中,企 业的行动也是选择产量。不同的是,在斯坦科尔伯格模型中,企 业 1( 称为领头企业 ) 先选择产量 q1∈Q1=[0,∞), 企业 2 ( 称为尾随 企业 ) 观测到 q1 后选择自己的产量 q2∈Q2=[0,∞) 。因此,这是一 个完美信息动态博弈。 假定逆需求函数为 P ( Q ) =a - q1 - q2, 两个企业有 相同的不变单位成本 c≥0 ,则支付 ( 利润 ) 函数为: ui (q1 , q2)= qi (P(Q) - c), i=1,2
  • 40. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.4 理论应用: Stackelberg 寡头竞争模型 我们用逆向归纳法求解这个博弈的子博弈精炼完美纳什 均衡。假定 q1 已经选定 , 企业 2 的问题是 : max u2(q1, q2)= q2 (a - q1 - q2 - c) 最优化一阶条件为 s2(q1)= (a - q1 - c)/2 假定 q1 < a - c 。这是实际上是库诺特模型中企业 2 的反应函 数,不同的是,这里, s2(q1) 是当企业 1 选择 q1 时企业 2 的实际 选择,而在库诺特模型中, R2 (q1) 是企业 2 对于假设的 q1 的最 优反应。
  • 41. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.4 理论应用: Stackelberg 寡头竞争模型 因为企业 1 预测到企业 2 将根据 s2 (q1) 选择 q2 ,企业 1 在第一阶段的问题是: max u1(q1, s2 (q1))= q1 (a - q1 - s2 (q1) - c) 解一阶条件得: q1*= (a - c)/2 将 q1* 代入 s2 (q1) 得: q2*= s2 (q1*)= (a - c)/4 这就是子博弈精炼纳什均衡结果(一般称为斯坦科尔伯格均衡结 果)。子博弈精炼纳什均衡是( q1* , s2 (q1) )
  • 42. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 赢利表 进入 不进入 进入 不进入 0 , -1 2 , 0 3 ,5 0 建厂 -1 , 2 1 3, 2 ,1 3, 不建厂 0 0 在位者高成本情况( p ) 在位者低成本情况( 1-p ) 表 3.12 B 表 3.12 A
  • 43. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 分析表 3.12 A 和 3.12 B 可发现,进入者是否应该进入,应取决于在 位者的成本 : 在位者高成本则进入者应该进入,在位 者低成本则进入者应不进入。现在,进入者不知道在 位者成本高低,因此它分别计算进入和不进入的预期 收益: EU2( 进入 )=p*U2 (不建厂,进入 |t1=H ) + ( 1- p ) *U2 (建厂,进入 |t1=L )
  • 44. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 给定对方进入,如果自己是高成本则应不建厂 ,自己是低成本则应建厂。由此,可计算出: EU2( 进入 )=1*p+ ( -1 ) * ( 1-p ) =2p-1 EU2 (不进入) =p*U2 (不建厂,不进入 |t1=H+ ( 1-p ) * U2 (建厂,不进入 |t1=L ) =0 因此有: P > 1/2 进入者进入; P≤1/2 进入者不进入
  • 45. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 博弈的均衡是: * 如果在位者成本高,则不建厂;若 p > 1/2 则进入者 进入, p ≤1/2 则进入者不进入; * 如果在位者成本低,则建厂;进入者是否进入仍取决 于对概率 p 的判断。 进入者是否进入仍取决于对概率 p 的判断。
  • 46. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 2 、静态贝叶斯博弈 静态贝叶斯博弈的时间顺序为: 1 、自然选择类型向量,参与人 i 能观测到自己的类型 ,但参与人 j 只知道除 i 之外所有参与人类型,但不知道参 与人 i 的类型。 2 、 n 个参与人同时行动; 3 、参与人 i 得到类型依存支付函数。 给定参与人 i 只知道自己的类型而不知道其他参与 人的类型,参与人 i 将选择使自己的效应最大化的期望效用 。
  • 47. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3 、海萨尼转换 海萨尼在 1967-1968 年提出了一个处理不完全信息的 方法——引入一个虚拟的参与人“自然”,自然首先行动 ,选择决定参与人的特征(如成本函数),参与人知道自 己的特征,其他参与人不知道。这样不完全信息博弈就转 换为完全但不完美信息博弈,可以利用标准的分析技术进 行分析,这就是“海萨尼转换”。
  • 48. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3 、海萨尼转换 类型:一个参与人拥有的所有的个人信息(即所有不 是共同知识的信息)称为他的类型。 根据这个定义,甚至允许参与人不知道其他参与人是 否知道自己的类型。 例如:市场进入博弈:在位者不知道进入者是否知道 自己是高成本还是低成本,只知道进入者有 p’ 的概率知 道自己的成本函数,( 1-p’ )的概率不知道自己的成本 函数。 这种情况下,进入者也有两种类型:知道(在位者的成本 )或不知道(在位者的成本)。 不完全信息意味着,至少有一个参与人有多个类型 。
  • 49. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 4 、贝叶斯纳什均衡 贝叶斯纳什均衡: n 人不完全信息静态博弈的 纯战略均衡是一个类型依存战略组合,其中每个参与人 i 在给定自己的类型 θi 和其他参与人类型依存战略的情 况下,最大化自己的期望效用。
  • 50. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 1 、不完全信息古诺模型 参与人:企业 1 、企业 2 ;  企业 2 企业 1 行动顺序:同时行动  不完全信息:企业 1 单位成本 c1 是共同知识,  企业 2 的成本可能是 c2l 或 c2h ,企业 1 只知道 c2=c2l 的可能性是 1/2 ,这是共同知识。
  • 51. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 1 、不完全信息古诺模型 qi :第 i 个企业的产量 Ci :代表第 i 个企业的成本 假定逆需求函数为: P(Q) = a − (q1 + q2 ) 第 i 个企业的利润函数为: π i (q1 , q2 ) = qi ( P (Q) − ci ), i = 1,2
  • 52. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 假定 a=2 , c1=1 , c2l=3/4 , c2h=5/4 。 给定企业 2 知道企业 1 的成本,企业 2 将选择 q2 最大化利润函数: π 2 = q2 (t − q − q2 ) * 1 t=a-c=a-3/4=5/4 或 t=a-5/4=3/4 依赖于企业 2 的实际成本。从最优化一阶条件 可得企业 2 的反应函数为: 1 q1 (q1 , t ) = (t − q1 ) * 2
  • 53. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 1 q (q1 , t ) = (t − q1 ) * 2 2 也就是说,企业 2 的最优产量不仅依赖于企业的产 量,而且依赖于自己的成本,令 q2l 为 t=5/4 时企业 2 的最优产量, q2h 为 t=3/4 时企业 2 的最优产量。那么 , q2l=1/2* ( 5/4-q1 ); q2h= 1/2* ( 3/4-q1 ) 企业 1 不知道企业 2 的真实成本从而不知道企业 2 的最优反应究竟是 q2l 还是 q2h ,因此企业 1 将选择 q1 最 1 1 Eπ 1 = q1 (1 − q1 − q2 l ) + q1 (1 − q1 − q2 h ) 大化下列利润函数: 2 2
  • 54. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 最优化一阶条件得企业 1 的反应函数为: 1 1 1 1 q1 = (1 − q − q2 l ) = (1 − Eq2 ) * 2h 2 2 2 2 1 1 Eq2 = q2 l + q2 h 是企业 1 关于企业 2 产量的期望值 2 2 均衡意味着两个反应函数同时成立,解两个反 应函数得贝叶斯均衡为: 1* q = ; q2l = 11 / 24; q2 h = 5 / 24 * * 1 3
  • 55. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 2 、密封拍卖 一次密封价格拍卖是许多拍卖方式中的一种,投标 人同时将自己的出价写出来装入一个信封,密封后交给拍卖 人,由拍卖人打开信封,出价最高者按其出价支付价格获得 走被拍卖的物品。 这里,每个投标人的战略是根据自己对该物品的评价 相对其他投标人评价的判断来选择自己的出价,赢者的支付 是他对物品的评价减去他的出价,其他投标人的支付为零。
  • 56. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 2 、密封拍卖 ⑴ 行动空间——参与人 i 的行动是递送一个 ( 非负 ) 标价 bi,bi∈[0,+∞) 。 ⑵ 类型空间——参与人 i 的类型是他对货物的估价 vi, 类型空间为 Ti=[0,1] 。 ⑶ 信念——估价是独立的 , 参与人都相信 vi 均匀地 分布在 [0,1] 上 v - b 如果b > b i i i j  ⑷ 得益函数 ui(b1,b2,v1,v2)= (vi - bi )/2 如果bi = b j  0, 如果b < b i j 
  • 57. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 在日常生活中,当面临不确定时,我们对某事件发生 的可能性有一个判断,然后,会根据新的信息来修正这个判 断。 统计学上,修正之前的判断称为“先验概率” 修正后的判断称为“后验概率” 贝叶斯法则就是人们根据新的信息从先验概率得到 后验概率的基本方法。
  • 58. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 假定参与人的类型是独立分布的,参与人 i 有 K 个类 型,有 H 个可能的行动, өk 和 ah 分别代表一个特定的类型 和一个特定的行动。 如果我们观察到 i 选择了 ah , i 属于 өk 的后验概率 是多少? p (a h θ k ) p (θ k ) p (a h θ k ) p (θ k ) Pr ob{θ k a h } ≡ ≡k h Pr ob{a } ∑ p (a h θ j ) p (θ j ) j =1
  • 59. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 人:好人( GP ),坏人( BP ) 事:好事( GT ),坏事( BP ) 一个好人干好事的概率等于他是好人的概率 p ( GP ) 乘以好人干好事的概率 p ( GT|GP ),加上他是坏人的 概率 p ( BP )乘以坏人干好事的概率 p ( GT|BP ): Prob{GT}= p ( GT|GP ) * p ( GP ) + p ( GT|BP ) * p ( GT|BP )
  • 60. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 假定观测到一个人干了一件好事,那么这个人 的是好人的后验概率是: p (GT GP) p (GP) Pr ob{GP GT } ≡ Pr ob{GT } 假定我们认为这个人是好人的先验概率是 1/2 ,观测到他干了好事之后如何修正他的先验概率依 赖于他干的好事好到什么程度:
  • 61. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 1 )是一件非常好的好事,坏人绝对不可能干,则 p ( GT|GP ) =1 p ( GT|BP ) =0 1× 1 / 2 Pr ob{GP GT } ≡ =1 1× 1 / 2 + 0 × 1 / 2 2 )这是一个非常一般的好事,好人会干,坏人也会干 : p ( GT|GP ) =1 p ( GT|BP ) =1 1× 1 / 2 1 Pr ob{GP GT } ≡ = 1× 1 / 2 + 1× 1 / 2 2
  • 62. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 3 )介于上述两种情况之间:好人肯定会干,但坏 人可能会干也可能不会干: p ( GT|GP ) =1/2 p ( GT|BP ) =1/2 1× 1 / 2 2 Pr ob{GP GT } ≡ = 1× 1 / 2 + 1 / 2 × 1 / 2 3
  • 63. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 假定我们观测到他干了一件坏事,我们相信,好人绝 对不会干坏事,那么可以肯定他绝对不是一个好人。 0 ×1 / 2 Pr ob{GP BT } ≡ =0 0 ×1 / 2 + p ×1 / 2 假定我们原来认为他是个好人,大突然发现他干了一 件好事,我们如何看待呢? p ×1 / 2 Pr ob{BP GT } ≡ =1 q × 0 + p ×1
  • 64. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 2 、精炼贝叶斯均衡 1 )在每个信息集上,决策者必须有一个定义在属于该 信息集的所有决策结上的一个概率分布(信念); 2 )给定该信息集上的概率分布和其他参与人的后续战 略,参与人的行动必须是最优的; 3 )每一个参与人根据贝叶斯法则和均衡战略修正后验 概率。
  • 65. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 信号传递博弈是一种比较简单的但有广泛应用意义的 不完全信息动态博弈。 1 )信息不对称可能导致潜在的交易不能进行; 2 )但在许多情况下,为了获得交易带来的收益,拥有 私人信息的一方会主动揭示自己的私人信息; 3 )信号传递 : 拥有私人信息的一方通过一定的行为选 择来告诉没有私人信息的一方自己的真实类型。 4 )参与人:两个,信号发送者 1 和信号接收者 2 ; 1 的类型是私人信息, 2 的类型是公共信息(即只有一个 类型)。
  • 66. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 博弈顺序: 1 )“自然”首先选择参与人 1 的类型,参与人 1 知道 ,但参与人 2 不知道,只知道 1 属于该类型 x 的先验概率 。 2 )参与人 1 观测到类型 x 后发出信号。 3 )参与人 2 观测到参与人 1 发出的信号,使用贝叶斯 法则从先验概率得到后验概率,然后选择行动。
  • 67. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 应用举例 : 最早的信号博弈模型是斯彭思 1973 年提出的求职模型。 企业招聘工人的时候,总是希望能招聘到素质比较 高的工人,因为高素质的工人的劳动生产率比较高,能够给 企业带来更大的经济效益。但是,识别工人的素质也不是一 件容易的事。但是,过分要求高素质也不现实,因为一方面 高素质的工人可能会要求较高的报酬,另一方面当工人的普 遍素质不是很高的时候,筛选标准定的过高,就难以找到足 够的工人。
  • 68. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 劳动生 产率信 P’ 号成本 b p 工人素质 0 0.5
  • 69. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 劳动生产 p 率信号成 a 本 b p c d c’ 工人素 0 质 e 0.5 (e+1)/2 1
  • 70. 信息与非合作博弈理论 思考与练习 1 .简述博弈论的含义。 2 .简述博弈的几种类型。 3 .找出下面战略式表述博弈中的重复剔除的占优均衡解。 参与人 B L C R 4,3 5,1 6,2 U 2,1 8,4 3,6 参与人 A M 3,0 9,6 5,8 D 4 .简述纳什均衡的含义。 5 .何为博弈的扩展式表述?
  • 71. 信息与非合作博弈理论 6 .用逆向归纳法求解下面博弈的子博弈精炼纳什均衡。 1 U D 2 (2,0) L R 1 (1,1) V M (3,0) (0,2)
  • 72. 信息与非合作博弈理论 7 .静态贝叶斯博弈中博弈方的战略有什么特点?为 什么? 8 .不完全信息库诺特模型可以解决现实生活中哪些 问题?举例说明。 9 .海萨尼转换的贡献是什么?可以解决什么问题? 10 .一次拍卖利与弊分别是什么?你能想出更公平的 拍卖规则么? 11 .对雇员的试用期是否越长越好?为什么? 12 .信号机制起作用的基本条件是什么? 13 .贝叶斯法则是什么?解决什么样的问题?
  • 73. 责任编辑:…… 撰稿教师:……(以姓氏为序) 电子编辑: 主编:…… 制作:

×