《第3章 2信息經(jīng)濟(jì)學(xué)研究方法 博弈論4coin》由會(huì)員分享,可在線閱讀,更多相關(guān)《第3章 2信息經(jīng)濟(jì)學(xué)研究方法 博弈論4coin(27頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、3.5 不完全信息動(dòng)態(tài)博弈不完全信息動(dòng)態(tài)博弈3.5.1 不完全信息博弈不完全信息博弈 “自然”首先選擇參與人的類(lèi)型,參與人自己知道,其他參與人不知道;參與人開(kāi)始行動(dòng),后行動(dòng)者能觀測(cè)到先行動(dòng)者的行動(dòng),但不能觀測(cè)到先行動(dòng)者的類(lèi)型;后行動(dòng)者通過(guò)觀察先行動(dòng)者所選擇的行動(dòng)來(lái)推斷類(lèi)型或修正對(duì)其類(lèi)型的先驗(yàn)信念(概率分布),然后選擇自己的最優(yōu)行動(dòng);先行動(dòng)者預(yù)測(cè)到自己的行動(dòng)將被后行動(dòng)者所利用,就會(huì)設(shè)法選擇傳遞對(duì)自己最有利的信息,避免傳遞對(duì)自己不利的信息。13.5.2 3.5.2 貝葉斯法則先驗(yàn)概率(prior probability):修正之前的判斷;后驗(yàn)概率(posterior probability):修正
2、之后的判斷23.5.2 3.5.2 貝葉斯法則貝葉斯法則:假定參與人i有K個(gè)類(lèi)型,有H個(gè)行動(dòng),用k和sh分別代表一個(gè)特定的類(lèi)型和戰(zhàn)略,假定i屬于k的先驗(yàn)概率是p(k)0,p(k)=1,i選擇sh的條件概率為p(shk),p(shk)=1。33.5.2 3.5.2 貝葉斯法則貝葉斯法則:假如觀測(cè)到i選擇了sh,i屬于類(lèi)型k的后驗(yàn)概率Prob(ksh)有以下公式存在:43.5.2 3.5.2 貝葉斯法則貝葉斯法則舉例:假定現(xiàn)實(shí)中分為好人(1)和壞人(2)(type),所有的事分為好事(s1)和壞事(s2)(strategy),那么一個(gè)人干好事的概率ps1就等于他是好人的概率p(1)(先驗(yàn)概率)乘以
3、好人干好事的概率p(s11),加上他是壞人的概率p(2)乘以壞人干好事p(s12)的概率,即ps1=p(s11)p(1)+p(s12)p(2)(邊緣概率)。53.5.2 3.5.2 貝葉斯法則貝葉斯法則舉例:假定觀測(cè)到一個(gè)人干了一件好事,那么這個(gè)人是好人的后驗(yàn)概率為:63.5.2 3.5.2 貝葉斯法則貝葉斯法則舉例:假設(shè)認(rèn)為這個(gè)人是好人的先驗(yàn)概率為1/2,那么在觀測(cè)到他干了好事之后來(lái)修正他是好人的先驗(yàn)概率依賴(lài)于這件事好到什么程度。假設(shè)這件事非常好,好人一定干,壞人一定不干,則有p(s11)=1,p(s12)=0,那么后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+0*1/2)=1假
4、設(shè)這是一件非常一般的好事,好人會(huì)干,壞人也會(huì)干,則有p(s11)=1,p(s12)=1,后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+1*1/2)=1/2假設(shè)介于上述兩種之間,好人肯定會(huì)做,壞人可能做也可能不做,則有p(s11)=1,p(s12)=1/2,后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+1/2*1/2)=2/373.5.3 3.5.3 精煉貝葉斯均衡(PBNE)PBNE是不完全信息動(dòng)態(tài)均衡的基本均衡概念,是澤爾騰的完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡(SPNE)和海薩尼的不完全信息靜態(tài)博弈貝葉斯均衡(BNE)的結(jié)合。BNE中,參與人的信念是事前給定的,均衡概
5、念沒(méi)有規(guī)定參與人如何修正自己的信念。SPNE要求均衡戰(zhàn)略不僅在整個(gè)博弈上構(gòu)成納什均衡,而且要求在每個(gè)子博弈上構(gòu)成納什均衡,剔除了那些包含不可置信威脅的戰(zhàn)略。83.5.3 3.5.3 精煉貝葉斯均衡(PBNE)PBNE要求,給定每一個(gè)參與人有關(guān)其他參與人類(lèi)型的后驗(yàn)信念,參與人的戰(zhàn)略組合在每一個(gè)后續(xù)博弈(continuation game,每一個(gè)信息集開(kāi)始的博弈的剩余部分,不同于開(kāi)始于單結(jié)信息集的子博弈)上構(gòu)成貝葉斯均衡。99.5.3 9.5.3 精煉貝葉斯均衡(PBNE)PBNE要求:(1)在每一個(gè)信息集上,決策者必須有一個(gè)定義在屬于該信息集的所有決策結(jié)上的一個(gè)概率分布(信念);(2)給定該信息
6、集上的概率分布和其他參與人的后續(xù)戰(zhàn)略,參與人的行動(dòng)必須是最優(yōu)的;(3)每一個(gè)參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗(yàn)概率。103.5.3 3.5.3 精煉貝葉斯均衡(PBNE)精煉貝葉斯均衡的定義:s*()=(s1*(1),sn*(n)和一個(gè)后驗(yàn)概率組合 ,滿足:(P)對(duì)于所有的參與人i,在每一個(gè)信息集h,存在(B)是使用貝葉斯法則從先驗(yàn)概率pi(-ii),觀測(cè)到的行動(dòng) 和最優(yōu)戰(zhàn)略 得到的。113.5.3 3.5.3 精煉貝葉斯均衡(PBNE)精煉貝葉斯均衡是均衡戰(zhàn)略和均衡信念的結(jié)合:給定信念 ,戰(zhàn)略s*=(s1*,sn*)是最優(yōu)的;給定戰(zhàn)略s*=(s1*,sn*),信念 是使用貝葉斯法則從均衡
7、戰(zhàn)略和所觀測(cè)到的行動(dòng)得到的。123.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用信號(hào)傳遞博弈(signaling games)是一種比較簡(jiǎn)單但有廣泛應(yīng)用意義的不完是一種比較簡(jiǎn)單但有廣泛應(yīng)用意義的不完全信息動(dòng)態(tài)博弈(斯賓塞,全信息動(dòng)態(tài)博弈(斯賓塞,19741974)博弈中有兩個(gè)參與人博弈中有兩個(gè)參與人,1,1的類(lèi)型是私人信息的類(lèi)型是私人信息,為信號(hào)發(fā)送者為信號(hào)發(fā)送者;2;2的類(lèi)型是公共信息的類(lèi)型是公共信息,為信號(hào)接為信號(hào)接收者。收者。133.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用博弈順序(1)“自然”首先選擇1的類(lèi)型,2只知道1屬于的先驗(yàn)概率p=p();(2)1在觀測(cè)到類(lèi)型后選擇發(fā)出信號(hào)mM,M=
8、m1,mJ是信號(hào)空間;(3)2觀測(cè)到m(而非)使用貝葉斯法則從先驗(yàn)概率p得到后驗(yàn)概率 ,然后選擇戰(zhàn)略aA;(4)支付函數(shù)分別為u1(m,a,),u2(m,a,)。143.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用信號(hào)傳遞博弈的精煉貝葉斯均衡是戰(zhàn)略組合(m*(),a*(m)和后驗(yàn)概率 的結(jié)合,它滿足:(P1)a*(m)argmax u2(m,a,)(P2)m*()argmaxu1(m,a*(m),);(B)是參與人2使用貝葉斯法則從先驗(yàn)概率p=p()、觀測(cè)到的信號(hào)m和參與人1的最優(yōu)戰(zhàn)略m*()得到的。153.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用分離均衡(Separating equilibri
9、um)不同類(lèi)型發(fā)送者以1的概率選擇不同信號(hào),或者說(shuō),沒(méi)有任何類(lèi)型選擇與其他類(lèi)型相同的信號(hào)。在分離均衡下,信號(hào)準(zhǔn)確地揭示出類(lèi)型。163.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用分離均衡(Separating equilibrium)如果m1是類(lèi)型1的最優(yōu)選擇,m1就不可能是2的最優(yōu)選擇,并且,m2一定是類(lèi)型2的最優(yōu)選擇,即:u1(m1,s*(m),1)u1(m2,s*(m),1)u1(m2,s*(m),2)u1(m1,s*(m),2)后驗(yàn)概率為:173.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用混同均衡(pooling equilibrium)不同類(lèi)型的發(fā)送者選擇相同的信號(hào),或者說(shuō),沒(méi)有任何類(lèi)型選
10、擇與其他類(lèi)型不同的信號(hào),因此,接收者不修正先驗(yàn)概率。183.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用混同均衡(pooling equilibrium)假定mj是均衡戰(zhàn)略,那么:u1(mj,s*(m),1)u1(m,s*(m),1)u1(mj,s*(m),2)u1(m,s*(m),2)193.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用市場(chǎng)進(jìn)入博弈 假定有兩個(gè)時(shí)期t=1,2。在 t=1,市場(chǎng)上一個(gè)壟斷企業(yè)(在位者)在生產(chǎn),一個(gè)潛在的進(jìn)入者考慮是否進(jìn)入。如果進(jìn)入,兩個(gè)企業(yè)進(jìn)行庫(kù)諾特博弈,否則在位者仍是一個(gè)壟斷者。假定在位者有兩個(gè)可能類(lèi)型,高成本或低成本,其概率分別為,1-(先驗(yàn)信念)。假定進(jìn)入者只有一
11、個(gè)類(lèi)型,進(jìn)入成本為2。如果進(jìn)入,生產(chǎn)成本函數(shù)與高成本的在位者相同。203.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用市場(chǎng)進(jìn)入博弈 在t=1,作為壟斷者的在位者要決定該時(shí)期的價(jià)格,有三種可能的價(jià)格選擇,p=4,p=5或p=6;如果在位者是高成本,對(duì)應(yīng)三種價(jià)格選擇的利潤(rùn)分別是:2,6,或7 如果在位者是低成本,對(duì)應(yīng)三種價(jià)格選擇的利潤(rùn)分別是:6,9,或8213.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用市場(chǎng)進(jìn)入博弈 在t=2,如果在位者是高成本,兩企業(yè)成本函數(shù)相同,對(duì)稱(chēng)的庫(kù)諾特均衡產(chǎn)量下的價(jià)格為p=5,每個(gè)企業(yè)的利潤(rùn)是3;如果在位者是低成本,非對(duì)稱(chēng)的庫(kù)諾特均衡產(chǎn)量下的價(jià)格為p=4,在位者利潤(rùn)是5,進(jìn)入者
12、利潤(rùn)是1;在完全信息情況下,如果在位者是高成本,進(jìn)入者選擇進(jìn)入;如果在位者是低成本,進(jìn)入者選擇不進(jìn)入。223.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用市場(chǎng)進(jìn)入博弈N在位者在位者進(jìn)入者進(jìn)入者高低P=4 P=5 P=6 P=4 P=5 P=6 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不 進(jìn)進(jìn) 不不第一階段 (2,0)(2,0)(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)(8,0)(8,0)第二階段 (3,1)(7,0)(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(5,-1)(9,0)1-233.5.4 3.
13、5.4 信號(hào)傳遞博弈及其應(yīng)用市場(chǎng)進(jìn)入博弈求解(一)單階段最優(yōu)壟斷價(jià)格p=6(高成本)或p=5(低成本),不是精煉貝葉斯均衡。如果進(jìn)入者這樣選擇,則后驗(yàn)概率(6)=1(選擇p=6證明在位者是高成本),(5)=0(選擇p=5證明在位者是低成本)給定后驗(yàn)概率,當(dāng)觀測(cè)到在位者選擇p=6,進(jìn)入者選擇進(jìn)入,在位者兩期利潤(rùn)=7+3=10;而如果模仿低成本企業(yè),選擇p=5,則得到兩期利潤(rùn)=6+7=13。因此p=6不是高成本在位者的最優(yōu)選擇243.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用市場(chǎng)進(jìn)入博弈求解(二)假定 1/2,得到混同均衡,兩類(lèi)在位者選擇相同的價(jià)格給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,如果高成本選擇p=6,進(jìn)
14、入者進(jìn)入,u1=7+3=10,如果選擇p=5,進(jìn)入者不進(jìn)入,u1=6+7=13,p=5是高成本的最優(yōu)選擇;如果低成本選擇p=5,u1=9+9=18,大于選擇其他任何價(jià)格時(shí)的利潤(rùn),p=5是低成本的最優(yōu)選擇。給定兩類(lèi)在位者都選擇p=5,進(jìn)入者不能從觀測(cè)到的價(jià)格中得到任何新的信息,即后驗(yàn)概率=1*/(1*+1*(1-)=1/2,(式中的1分別為高成本、低成本時(shí)在位者選擇p=5的概率)進(jìn)入的期望利潤(rùn)*1+(1-)*(-1)=2-10,不進(jìn)入的期望利潤(rùn)為0,因此不進(jìn)入是最優(yōu)的。253.5.4 3.5.4 信號(hào)傳遞博弈及其應(yīng)用市場(chǎng)進(jìn)入博弈求解(三)假定 1/2,得到分離均衡,兩類(lèi)在位者選擇不同價(jià)格如果不同
15、類(lèi)型在位者選擇相同的價(jià)格,進(jìn)入者得不到新的信息,將選擇進(jìn)入,因?yàn)?1+(1-)*(-1)=2 -10。給定進(jìn)入者一定會(huì)進(jìn)入,在位者的最優(yōu)選擇是p=6(高成本)或p=5(低成本),前面已經(jīng)證明不是一個(gè)均衡。給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,低成本在位者選擇p=6(認(rèn)為他是高成本,進(jìn)入),u1=8+5=13;選擇p=5,進(jìn)入者進(jìn)入,u1=9+5=14;選擇p=4,進(jìn)入者不進(jìn)入,u1=6+9=15,最優(yōu)戰(zhàn)略為p=4,進(jìn)入者不進(jìn)入。給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,高成本在位者選擇p=4,進(jìn)入者不進(jìn)入,u1=2+7=9;選擇p=5,進(jìn)入者進(jìn)入,u1=6+3=9;選擇p=6,進(jìn)入者進(jìn)入,u1=7+3=10,因此p=6是最優(yōu)的。26課堂延伸趣味博弈:海盜分金幣的博弈求解27