this is test api2

1,064 views

Published on

this is test api2

Published in: Spiritual
  • Be the first to comment

this is test api2

  1. 1. 普通高等教育“ 十一五” 国家级规划教材 第三章 信息与非合作博弈理 论
  2. 2. 3 信息与非合作博弈理论 教学目标 了解博弈论的基本概念 掌握非合作博弈的种类及其均衡解之间的关系 会求博弈的一些基本类型的均衡解
  3. 3. 3 信息与非合作博弈理论 博弈论概述 3 .1 完全信息静态博弈 3 .2 完全信息动态博弈 3 .3 3 .4 不完全信息静态博弈 3 .5 不完全信息动态博弈
  4. 4. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.1 什么是博弈论 博弈论( game theory )定义: 研究决策主体的行为发生直接相互作用时候的决策 以及这种决策的均衡问题的,是专门研究博弈如何出现均 衡的规律的学科。 博弈论的相关概念包括:参与人、行动、战略、信 息、共同知识、支付函数、结果、均衡。
  5. 5. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.2 博弈的分类 非合作博弈 参与人行动的先后顺序 参与人对对手信息的掌握 静态博弈 完全信息博弈 动态博弈 不完全信息博弈
  6. 6. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.2 博弈的分类 表 3.1 博弈的分类及对应的均衡概念 静态 动态 完全信息静态博弈; 完全信息动态博弈; 完全信息 纳什均衡; 子博弈精炼纳什均衡; 代表人物:纳什 代表人物:泽尔腾( 1965 ) ( 1950 , 1951 ) 不完全信息静态博弈; 不完全信息动态博弈; 贝叶斯纳什均衡; 精炼贝叶斯纳什均衡; 不完全信息 代表人物:泽尔腾( 1975 ), 代表人物:海萨尼 ( 1967-1968 ) 克瑞普斯和威尔逊( 1982 ), 费登伯格和泰勒尔( 1991 )
  7. 7. 3 信息与非合作博弈理论 3 .1 博弈论概述 3.1.3 博弈论的发展简述 1944 年,冯 · 诺伊曼和摩根斯坦恩合作的 《博弈论和经济行为》一书的出版 博 50 年代,合作博弈发展到鼎盛时期 弈 论 60 年代,出现了泽尔腾 , 海萨尼等一些重要人物 的 发 80 年代,出现了几个比较有影响的人物, 展 包括克瑞普斯和威尔逊 80 年代以后,博弈论逐渐成为主流经济学的一部分, 甚至可以说成为微观经济学的基础
  8. 8. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.1 博弈的战略式表述 战略式表述 1 2 3 博弈的参与人集 每个参与人的 每个参与人的 合: 策略空间 支付函数 i∈Γ,Γ= ( 1,2, Si,i=1,2,…,n ui(s1,…si, …,n ) …,sn),i=1,2, …,n 一般用 G={S1,S2,…Sn;u1,u2,…un} 表示战略式博弈。
  9. 9. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.1 博弈的战略式表述 表 3.2 房地产开发博弈 ( a )高需求情况 开发商 B 开发 不开发 开发商 A 开发 4000 , 4000 8000 , 0 不开发 0 , 8000 0,0
  10. 10. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.1 博弈的战略式表述 表 3.2 房地产开发博弈 ( b )低需求情况 开发商 B 开发 不开发 开发商 A 开发 -3000 , -300 1000 , 0 0 不开发 0 , 1000 0,0
  11. 11. 3 信息与非合作博弈理论 ∀ 3 .2 完全信息静态博弈 3.2.2 纳什均衡 1 、占优战略均衡 一个参与人的最优战略并不依赖于其他参与人的战略 选择,即不论其他参与人选择什么战略,他的最优战略是唯一 的,这样的最优战略被称为“占优战略”( dominant strategy )。 表 3.3 囚徒困境 囚犯 B 坦白 抵赖 囚犯 A 坦白 -8 , -8 0 , -10 -10 , 0 -1 , -1 抵赖
  12. 12. 3 信息与非合作博弈理论 ∀ 3 .2 完全信息静态博弈 3.2.2 纳什均衡 1 、占优战略均衡 占优战略 si * ui (si*,s-i) >ui (si′,s-i) , si′ ≠si* 在博弈的战略式表述中,如果对 于所有的 i , si* 是 i 占优战略, 占优战略均衡 那么,战略组合 s*= ( s1*, …,sn* )就称为占优战略均衡
  13. 13. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 战略组合 s*= (s1*,…,sn*) 称为重复剔除的占优均衡,如 果它是重复剔除劣战略后剩下的唯一的战略组合。如果这种唯 一的战略组合是存在的,我们说该博弈是重复剔除占优可解的 。
  14. 14. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 表 3.4 抽象博弈 参与人 2 左 中 右 1,0 1,2 0,1 参与人 1 上 0,3 0,1 2,0 下
  15. 15. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 表 3.5 抽象博弈 参与人 2 左 中 1,0 1,2 参与人 1 上 0,3 0,1 下
  16. 16. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 2 、重复剔除的占优均衡 表 3.6 抽象博弈 参与人 2 左 中 1,0 1,2 参与人 1 上 显然,(上,中)就是该博弈唯一的均衡解。这种方 法在博弈论中被称为重复剔除严格劣战略。
  17. 17. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 G={S1,S2 ,… Sn;u1,u2, … , un} 中 , 战略组合 s*= (s1 *,s2 *,…,sn*) 是一个纳什 均衡 如果对于每一个 i, si* 是给定 或: si* 是下述最大化问题的解 其他参与人的选择 s-i*=(s1*, : …,si-1*,si+1*,…,sn*) 的情况下 , si*∈argmax ui(s1*, 第 i 个人的最优战略 , 即 ui … , si-1*,si,si+1*,… , sn*), (si*,s-i*)≥ui (si,s-i*) , si*∈Si*,i∈Γ si*∈Si*, i=1,2,… , n
  18. 18. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 在两人有限博弈中,求解纳什均衡有一种简单的方法:划线法。 表 3.7 抽象博弈 参与人 B L C R U 0,4 4,0 5,3 参与人 A 4,0 0,4 5,3 M 3,5 3,5 6,6 D
  19. 19. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 纳什均衡有强弱之分。上述定义中给出的是弱纳什 均衡 , 一个纳什均衡是强的 , 如果给定其他参与人的策略 , 每 一个参与人的选择是唯一的。即 ,s* 是一个强 Nash 均衡 , 当 且仅当对每一个 i , si′≠si* ,总有 ui (si*,s-i*)>ui (si′,s-i*) 。在 有些博弈中,纳什均衡存在,但它不是强纳什均衡。如表 3.8 的博弈中,( U,L )和 (U,R) 都是纳什均衡,但没有一个是强 纳什均衡。
  20. 20. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.2 纳什均衡 3 、纳什均衡 表 3.8 抽象博弈 参与人 B L C R U 2 , 12 1 , 10 1 , 12 参与人 A M 0 , 12 0 , 10 0 , 11 0 , 12 0 , 12 0 , 1 D
  21. 21. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.3 理论应用: Gournot 寡头竞争模型 设有两个参与人 , 分别称为企业 1 和企业 2, 每个企业的策 略是选择产量 , 得益是利润 , 它是两个企业产量的函数。我们用 qi∈[0,∞) 表示第 i 个企业的产量 ,Ci(qi) 表示成本函数 ,P= P(q1+q2) 表示逆需求函数。第 i 个企业的利润函数为 : πi (q1,q2)=qiP (q1 +q2) - Ci (qi ), i = 1, 2 (q1*,q2*) 是纳什均衡产量意味着 : q1*∈argmaxπ1 (q1,q2*) = q1P (q1+q2*) - C1 (q1) q2*∈argmaxπ2 (q1*,q2) = q2P (q1*+q2) - C2 (q2 )
  22. 22. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.3 理论应用: Gournot 寡头竞争模型 找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并 令其为零 : Əπ1 / Əq1 = P (q1+q2) + q1P′(q1+q2) - C1′(q1) = 0 Əπ2 / Əq2 = P (q1+q2) + q2P′(q1+q2) - C2′(q2) = 0 上述两个一阶条件分别定义了两个反应函数 : q1*= R1 (q2) q2*= R2 (q1) 反应函数意味着每个企业的最优策略 ( 产量 ) 是另一个企业产量 的函数 , 两个函数的交点就是纳什均衡 q*=(q1*,q2*) ,如下图。
  23. 23. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.3 理论应用: Gournot 寡头竞争模型 Cournot模型 q2 R1(q2) NE q2* R2(q1) q1 O q1* 图 3.1 Gournot 模型的 纳什均衡
  24. 24. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.4 混合战略纳什均衡 表 3.9 猜硬币游戏 儿童 B 正面 反面 儿童 A 正面 -1 , 1 1 , -1 反面 -1 1, -1 , 1 表 3.10 社会福利博弈 流浪汉 寻找工作 游荡 政府 救济 , 2 3 -1 , 3 -1 , 1 0,0 不救济
  25. 25. 3 信息与非合作博弈理论 3 .2 完全信息静态博弈 3.2.4 混合战略纳什均衡 定义 在博弈 G = {S1,S2,…Sn;u1,u2,…un} 中,参与人 的战略空间为 Si={si1,si2,…sik}, 则参与人 i 以概率分布 σi= (σi1,… σi k) 随机地在其 k 个可选战略中选择的“战略”称为-个混合 战略。其中 0≤σij≤1, 且∑ σij=1 。 这样,纯战略可以理解为混合战略的特例,如纯战略 si’ 可以看作是混合策略 σi=(1,0,…0), 即选择纯战略 si’ 的概率为 1 ,选择任何其它纯战略的概率为 0 。
  26. 26. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 外生事 扩展式表 件概率 集合 述 支付函 数 行动 顺序 信息集 行动空 间
  27. 27. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 h 表示信 hA(1) A 息集 开发 不开发 N hN(2) N hN(1) 需求大 需求小 需求大 需求小 B hB(3 B hB(1) B hB(2 B hB(4) ) ) 开发 不开发 开发 不开发 开发 不开发 开发 不开发 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) 单位 : 千万 元 图 3.2 房地产开发博弈
  28. 28. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 结 博弈树基 本元素 枝 信息 集
  29. 29. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.1 博弈的扩展式表述 不允许出现下面的情况: 图 3.3 博弈树不允许的情况
  30. 30. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.2 扩展式表述博弈的纳什均衡 h1(1) 1 上 下 2 h2(2) 2 h2(1) 右 右 左 左 h1(3) h1(2) 1 1 1 1 A B A B C D C D 图 3.4 抽象例子
  31. 31. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.2 扩展式表述博弈的纳什均衡 从上图抽象例子的博弈树我们可以得到,参与人 2 有两 个战略集 , 相应地也有两个信息集, A(h2(1))=A(h2(2))={ 左 , 右 } ,其中 H2={h2(1),h2(2)}; 参与人 2 的纯战略空间为 : S2= (A(h2(1)),Ah2(2))={( 左 , 右 )×( 左 , 右 )}={( 左 , 左 ),( 左 , 右 ), ( 右 , 左 ),( 右 , 右 )}, 其中纯战略 ( 左 , 左 ) 表明 : 当 1 取“上” 时 ,2 取“左” ; 当 1 取“下”时 ,2 取“左” , 如此等等。 参与人 1 有三个信息集 H1={hi(i),i=1,2,3},1 的纯战略空间 为 :S1=A(h1(1))×A(h1(2))×A(h1(3))={( 上 , 下 )×(A,B)×(C,D)}, 共 8 种纯战略。
  32. 32. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.2 扩展式表述博弈的纳什均衡 定义 战略组合 s* 是扩展式博弈的一个纳什均衡,如果 对于所有的 i , si* 最大化 ui (si*,s-i*) ,即: si*∈arg max ui (si*,s-i*), 对于任意 i 注意,因为一个参与人的纳什均衡战略是假定其他参与 人的战略为给定时的最优战略,所有参与人似乎是在同时选择战 略。但这并不意味着在纳什均衡中,参与人一定是在同时选择行 动。 定理 一个有限完美信息博弈有一个纯战略纳什均衡。
  33. 33. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 纳什均衡在原则上适用所有的博弈 , 但对于预测参与人 的行为来说 , 纳什均衡可能并不是一个合理的预测 , 如房地产博 弈: A 开发 不开发 B B 开发 不开发 开发 不开发 (-3,-3) (1,0) (0,1) (0,0) 图 3.5 房地产开发博弈 图 3.6 房地产开发博弈
  34. 34. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 A 开发 不开发 B B 开发 不开发 开发 不开发 (-3,-3) (1,0) (0,1) (0,0) (a) 原博弈 B B 开发 不开发 开发 不开发 (-3,-3) (1,0) (0,1) (0,0) (c) 子博弈 (b) 子博弈 图 3.6 房地产开发博弈 图 3.7 房地产开发博弈
  35. 35. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 正式地,我们有下述定义: 定义 一个扩展式表述博弈的子博弈 G 由一个决策结 x 和所有该决策结的后续结 T(x)( 包括终点结 ) 组成 , 它满足下列条 件 :⑴x 是一个单点信息集,即 h(x)={x};⑵ 对于所有的 x′∈T(x), 如果 x″∈h(x′), 则 x″∈T(x) 。
  36. 36. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 1 U D 1 1 U D 2 2 U D 2 2 1 L R L R UL D R L R 2 2 2 2 3 图 3.8 3 3 3 L R L R C D C D C D C D L R L R 图 3.7 3.8 图 抽象博弈 图 3.8 抽象博弈 图 3.9 3 3 3 3 C D C D C D C D 图 3.9
  37. 37. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 1 、子博弈精炼纳什均衡 有了子博弈的概念,下面给出“子博弈精炼纳什均衡” 的正式定义: 定义 扩展式表述博弈的战略组合 s*=(s1*,… , si*,… sn*) 是一个子博弈精炼纳什均衡 , 如果满足 :(1) 它是原博弈的纳 什均衡 ;(2) 它在每一个子博弈上给出纳什均衡。
  38. 38. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.3 子博弈精炼纳什均衡 2 、子博弈精炼纳什均衡的求解 --- 逆向归纳法 1 h1 L R h2 2 h2′ 2 A B C D 1 h1′ (2,0) (1,1) (0,1/2) E F (3,1) (2,2) 图 3.9 三阶段完美信息 图 3.11
  39. 39. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.4 理论应用: Stackelberg 寡头竞争模型 如同在库诺特模型中一样,在斯坦科尔伯格模型中,企 业的行动也是选择产量。不同的是,在斯坦科尔伯格模型中,企 业 1( 称为领头企业 ) 先选择产量 q1∈Q1=[0,∞), 企业 2 ( 称为尾随 企业 ) 观测到 q1 后选择自己的产量 q2∈Q2=[0,∞) 。因此,这是一 个完美信息动态博弈。 假定逆需求函数为 P ( Q ) =a - q1 - q2, 两个企业有 相同的不变单位成本 c≥0 ,则支付 ( 利润 ) 函数为: ui (q1 , q2)= qi (P(Q) - c), i=1,2
  40. 40. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.4 理论应用: Stackelberg 寡头竞争模型 我们用逆向归纳法求解这个博弈的子博弈精炼完美纳什 均衡。假定 q1 已经选定 , 企业 2 的问题是 : max u2(q1, q2)= q2 (a - q1 - q2 - c) 最优化一阶条件为 s2(q1)= (a - q1 - c)/2 假定 q1 < a - c 。这是实际上是库诺特模型中企业 2 的反应函 数,不同的是,这里, s2(q1) 是当企业 1 选择 q1 时企业 2 的实际 选择,而在库诺特模型中, R2 (q1) 是企业 2 对于假设的 q1 的最 优反应。
  41. 41. 3 信息与非合作博弈理论 3 .3 完全信息动态博弈 3.3.4 理论应用: Stackelberg 寡头竞争模型 因为企业 1 预测到企业 2 将根据 s2 (q1) 选择 q2 ,企业 1 在第一阶段的问题是: max u1(q1, s2 (q1))= q1 (a - q1 - s2 (q1) - c) 解一阶条件得: q1*= (a - c)/2 将 q1* 代入 s2 (q1) 得: q2*= s2 (q1*)= (a - c)/4 这就是子博弈精炼纳什均衡结果(一般称为斯坦科尔伯格均衡结 果)。子博弈精炼纳什均衡是( q1* , s2 (q1) )
  42. 42. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 赢利表 进入 不进入 进入 不进入 0 , -1 2 , 0 3 ,5 0 建厂 -1 , 2 1 3, 2 ,1 3, 不建厂 0 0 在位者高成本情况( p ) 在位者低成本情况( 1-p ) 表 3.12 B 表 3.12 A
  43. 43. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 分析表 3.12 A 和 3.12 B 可发现,进入者是否应该进入,应取决于在 位者的成本 : 在位者高成本则进入者应该进入,在位 者低成本则进入者应不进入。现在,进入者不知道在 位者成本高低,因此它分别计算进入和不进入的预期 收益: EU2( 进入 )=p*U2 (不建厂,进入 |t1=H ) + ( 1- p ) *U2 (建厂,进入 |t1=L )
  44. 44. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 给定对方进入,如果自己是高成本则应不建厂 ,自己是低成本则应建厂。由此,可计算出: EU2( 进入 )=1*p+ ( -1 ) * ( 1-p ) =2p-1 EU2 (不进入) =p*U2 (不建厂,不进入 |t1=H+ ( 1-p ) * U2 (建厂,不进入 |t1=L ) =0 因此有: P > 1/2 进入者进入; P≤1/2 进入者不进入
  45. 45. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 1 、不完全信息博弈 博弈的均衡是: * 如果在位者成本高,则不建厂;若 p > 1/2 则进入者 进入, p ≤1/2 则进入者不进入; * 如果在位者成本低,则建厂;进入者是否进入仍取决 于对概率 p 的判断。 进入者是否进入仍取决于对概率 p 的判断。
  46. 46. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 2 、静态贝叶斯博弈 静态贝叶斯博弈的时间顺序为: 1 、自然选择类型向量,参与人 i 能观测到自己的类型 ,但参与人 j 只知道除 i 之外所有参与人类型,但不知道参 与人 i 的类型。 2 、 n 个参与人同时行动; 3 、参与人 i 得到类型依存支付函数。 给定参与人 i 只知道自己的类型而不知道其他参与 人的类型,参与人 i 将选择使自己的效应最大化的期望效用 。
  47. 47. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3 、海萨尼转换 海萨尼在 1967-1968 年提出了一个处理不完全信息的 方法——引入一个虚拟的参与人“自然”,自然首先行动 ,选择决定参与人的特征(如成本函数),参与人知道自 己的特征,其他参与人不知道。这样不完全信息博弈就转 换为完全但不完美信息博弈,可以利用标准的分析技术进 行分析,这就是“海萨尼转换”。
  48. 48. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 3 、海萨尼转换 类型:一个参与人拥有的所有的个人信息(即所有不 是共同知识的信息)称为他的类型。 根据这个定义,甚至允许参与人不知道其他参与人是 否知道自己的类型。 例如:市场进入博弈:在位者不知道进入者是否知道 自己是高成本还是低成本,只知道进入者有 p’ 的概率知 道自己的成本函数,( 1-p’ )的概率不知道自己的成本 函数。 这种情况下,进入者也有两种类型:知道(在位者的成本 )或不知道(在位者的成本)。 不完全信息意味着,至少有一个参与人有多个类型 。
  49. 49. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.1 不完全信息博弈和贝叶斯纳什均衡 4 、贝叶斯纳什均衡 贝叶斯纳什均衡: n 人不完全信息静态博弈的 纯战略均衡是一个类型依存战略组合,其中每个参与人 i 在给定自己的类型 θi 和其他参与人类型依存战略的情 况下,最大化自己的期望效用。
  50. 50. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 1 、不完全信息古诺模型 参与人:企业 1 、企业 2 ;  企业 2 企业 1 行动顺序:同时行动  不完全信息:企业 1 单位成本 c1 是共同知识,  企业 2 的成本可能是 c2l 或 c2h ,企业 1 只知道 c2=c2l 的可能性是 1/2 ,这是共同知识。
  51. 51. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 1 、不完全信息古诺模型 qi :第 i 个企业的产量 Ci :代表第 i 个企业的成本 假定逆需求函数为: P(Q) = a − (q1 + q2 ) 第 i 个企业的利润函数为: π i (q1 , q2 ) = qi ( P (Q) − ci ), i = 1,2
  52. 52. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 假定 a=2 , c1=1 , c2l=3/4 , c2h=5/4 。 给定企业 2 知道企业 1 的成本,企业 2 将选择 q2 最大化利润函数: π 2 = q2 (t − q − q2 ) * 1 t=a-c=a-3/4=5/4 或 t=a-5/4=3/4 依赖于企业 2 的实际成本。从最优化一阶条件 可得企业 2 的反应函数为: 1 q1 (q1 , t ) = (t − q1 ) * 2
  53. 53. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 1 q (q1 , t ) = (t − q1 ) * 2 2 也就是说,企业 2 的最优产量不仅依赖于企业的产 量,而且依赖于自己的成本,令 q2l 为 t=5/4 时企业 2 的最优产量, q2h 为 t=3/4 时企业 2 的最优产量。那么 , q2l=1/2* ( 5/4-q1 ); q2h= 1/2* ( 3/4-q1 ) 企业 1 不知道企业 2 的真实成本从而不知道企业 2 的最优反应究竟是 q2l 还是 q2h ,因此企业 1 将选择 q1 最 1 1 Eπ 1 = q1 (1 − q1 − q2 l ) + q1 (1 − q1 − q2 h ) 大化下列利润函数: 2 2
  54. 54. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 最优化一阶条件得企业 1 的反应函数为: 1 1 1 1 q1 = (1 − q − q2 l ) = (1 − Eq2 ) * 2h 2 2 2 2 1 1 Eq2 = q2 l + q2 h 是企业 1 关于企业 2 产量的期望值 2 2 均衡意味着两个反应函数同时成立,解两个反 应函数得贝叶斯均衡为: 1* q = ; q2l = 11 / 24; q2 h = 5 / 24 * * 1 3
  55. 55. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 2 、密封拍卖 一次密封价格拍卖是许多拍卖方式中的一种,投标 人同时将自己的出价写出来装入一个信封,密封后交给拍卖 人,由拍卖人打开信封,出价最高者按其出价支付价格获得 走被拍卖的物品。 这里,每个投标人的战略是根据自己对该物品的评价 相对其他投标人评价的判断来选择自己的出价,赢者的支付 是他对物品的评价减去他的出价,其他投标人的支付为零。
  56. 56. 信息与非合作博弈理论 3 .4 不完全信息静态博弈 3.4.2 应用举例 2 、密封拍卖 ⑴ 行动空间——参与人 i 的行动是递送一个 ( 非负 ) 标价 bi,bi∈[0,+∞) 。 ⑵ 类型空间——参与人 i 的类型是他对货物的估价 vi, 类型空间为 Ti=[0,1] 。 ⑶ 信念——估价是独立的 , 参与人都相信 vi 均匀地 分布在 [0,1] 上 v - b 如果b > b i i i j  ⑷ 得益函数 ui(b1,b2,v1,v2)= (vi - bi )/2 如果bi = b j  0, 如果b < b i j 
  57. 57. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 在日常生活中,当面临不确定时,我们对某事件发生 的可能性有一个判断,然后,会根据新的信息来修正这个判 断。 统计学上,修正之前的判断称为“先验概率” 修正后的判断称为“后验概率” 贝叶斯法则就是人们根据新的信息从先验概率得到 后验概率的基本方法。
  58. 58. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 假定参与人的类型是独立分布的,参与人 i 有 K 个类 型,有 H 个可能的行动, өk 和 ah 分别代表一个特定的类型 和一个特定的行动。 如果我们观察到 i 选择了 ah , i 属于 өk 的后验概率 是多少? p (a h θ k ) p (θ k ) p (a h θ k ) p (θ k ) Pr ob{θ k a h } ≡ ≡k h Pr ob{a } ∑ p (a h θ j ) p (θ j ) j =1
  59. 59. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 人:好人( GP ),坏人( BP ) 事:好事( GT ),坏事( BP ) 一个好人干好事的概率等于他是好人的概率 p ( GP ) 乘以好人干好事的概率 p ( GT|GP ),加上他是坏人的 概率 p ( BP )乘以坏人干好事的概率 p ( GT|BP ): Prob{GT}= p ( GT|GP ) * p ( GP ) + p ( GT|BP ) * p ( GT|BP )
  60. 60. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 假定观测到一个人干了一件好事,那么这个人 的是好人的后验概率是: p (GT GP) p (GP) Pr ob{GP GT } ≡ Pr ob{GT } 假定我们认为这个人是好人的先验概率是 1/2 ,观测到他干了好事之后如何修正他的先验概率依 赖于他干的好事好到什么程度:
  61. 61. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 1 )是一件非常好的好事,坏人绝对不可能干,则 p ( GT|GP ) =1 p ( GT|BP ) =0 1× 1 / 2 Pr ob{GP GT } ≡ =1 1× 1 / 2 + 0 × 1 / 2 2 )这是一个非常一般的好事,好人会干,坏人也会干 : p ( GT|GP ) =1 p ( GT|BP ) =1 1× 1 / 2 1 Pr ob{GP GT } ≡ = 1× 1 / 2 + 1× 1 / 2 2
  62. 62. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 3 )介于上述两种情况之间:好人肯定会干,但坏 人可能会干也可能不会干: p ( GT|GP ) =1/2 p ( GT|BP ) =1/2 1× 1 / 2 2 Pr ob{GP GT } ≡ = 1× 1 / 2 + 1 / 2 × 1 / 2 3
  63. 63. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 1 、贝叶斯法则 假定我们观测到他干了一件坏事,我们相信,好人绝 对不会干坏事,那么可以肯定他绝对不是一个好人。 0 ×1 / 2 Pr ob{GP BT } ≡ =0 0 ×1 / 2 + p ×1 / 2 假定我们原来认为他是个好人,大突然发现他干了一 件好事,我们如何看待呢? p ×1 / 2 Pr ob{BP GT } ≡ =1 q × 0 + p ×1
  64. 64. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.1 精炼贝叶斯均衡 2 、精炼贝叶斯均衡 1 )在每个信息集上,决策者必须有一个定义在属于该 信息集的所有决策结上的一个概率分布(信念); 2 )给定该信息集上的概率分布和其他参与人的后续战 略,参与人的行动必须是最优的; 3 )每一个参与人根据贝叶斯法则和均衡战略修正后验 概率。
  65. 65. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 信号传递博弈是一种比较简单的但有广泛应用意义的 不完全信息动态博弈。 1 )信息不对称可能导致潜在的交易不能进行; 2 )但在许多情况下,为了获得交易带来的收益,拥有 私人信息的一方会主动揭示自己的私人信息; 3 )信号传递 : 拥有私人信息的一方通过一定的行为选 择来告诉没有私人信息的一方自己的真实类型。 4 )参与人:两个,信号发送者 1 和信号接收者 2 ; 1 的类型是私人信息, 2 的类型是公共信息(即只有一个 类型)。
  66. 66. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 博弈顺序: 1 )“自然”首先选择参与人 1 的类型,参与人 1 知道 ,但参与人 2 不知道,只知道 1 属于该类型 x 的先验概率 。 2 )参与人 1 观测到类型 x 后发出信号。 3 )参与人 2 观测到参与人 1 发出的信号,使用贝叶斯 法则从先验概率得到后验概率,然后选择行动。
  67. 67. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 应用举例 : 最早的信号博弈模型是斯彭思 1973 年提出的求职模型。 企业招聘工人的时候,总是希望能招聘到素质比较 高的工人,因为高素质的工人的劳动生产率比较高,能够给 企业带来更大的经济效益。但是,识别工人的素质也不是一 件容易的事。但是,过分要求高素质也不现实,因为一方面 高素质的工人可能会要求较高的报酬,另一方面当工人的普 遍素质不是很高的时候,筛选标准定的过高,就难以找到足 够的工人。
  68. 68. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 劳动生 产率信 P’ 号成本 b p 工人素质 0 0.5
  69. 69. 信息与非合作博弈理论 3 .5 不完全信息动态博弈 3.5.2 信号博弈 劳动生产 p 率信号成 a 本 b p c d c’ 工人素 0 质 e 0.5 (e+1)/2 1
  70. 70. 信息与非合作博弈理论 思考与练习 1 .简述博弈论的含义。 2 .简述博弈的几种类型。 3 .找出下面战略式表述博弈中的重复剔除的占优均衡解。 参与人 B L C R 4,3 5,1 6,2 U 2,1 8,4 3,6 参与人 A M 3,0 9,6 5,8 D 4 .简述纳什均衡的含义。 5 .何为博弈的扩展式表述?
  71. 71. 信息与非合作博弈理论 6 .用逆向归纳法求解下面博弈的子博弈精炼纳什均衡。 1 U D 2 (2,0) L R 1 (1,1) V M (3,0) (0,2)
  72. 72. 信息与非合作博弈理论 7 .静态贝叶斯博弈中博弈方的战略有什么特点?为 什么? 8 .不完全信息库诺特模型可以解决现实生活中哪些 问题?举例说明。 9 .海萨尼转换的贡献是什么?可以解决什么问题? 10 .一次拍卖利与弊分别是什么?你能想出更公平的 拍卖规则么? 11 .对雇员的试用期是否越长越好?为什么? 12 .信号机制起作用的基本条件是什么? 13 .贝叶斯法则是什么?解决什么样的问题?
  73. 73. 责任编辑:…… 撰稿教师:……(以姓氏为序) 电子编辑: 主编:…… 制作:

×