| 5 | 1/1 | 返回列表 |
| 查看: 2546 | 回復(fù): 2 | ||||
| 當(dāng)前只顯示滿足指定條件的回帖,點(diǎn)擊這里查看本話題的所有回帖 | ||||
daiben06金蟲 (初入文壇)
|
[交流]
關(guān)于信號博弈的一些總結(jié) 已有1人參與
|
|||
|
信號博弈 Eric.lab 引: 信號博弈是不完全信息動態(tài)博弈的一種表現(xiàn)形式,基本的求解方法與不完全信息動態(tài)博弈中的貝葉斯nash均衡類似.但是要給予信號博弈貝葉斯納什均衡的幾個條件,從而形成了信號條件的概念. 1.定義: 是一種由一個發(fā)送者(S)和另一個接收者(R)所組成的動態(tài)博弈。一開始這個發(fā)送者有一個給定的類型(t),接著發(fā)送者會觀察這個沒有其他人(好比說接收者)知道的類型,去從訊息堆 M ={m1, m2, m3,..., mj} 中選擇送出一個訊息(m),接著接收者會觀察這個訊息后從他可行的動作中A = {a1, a2, a3,...., ak} 選一個作為反應(yīng)動作(a),這里要注意的是接收者除了訊息之外其他都無法得知(如發(fā)送者的類型t),接著根據(jù)(t, m, a)的組合來決定雙方會獲得的報酬或回報。 例子: 見附件。 2.信號博弈(不完全信息動態(tài)博弈) 問題的難點(diǎn): (1)在不完全信息動態(tài)博弈中,出現(xiàn)了類型的不同的問題,這樣的問題是經(jīng)典博弈論無法解決的.但是可以通過海薩尼轉(zhuǎn)換將一個不完全信息博弈,轉(zhuǎn)換成不完美但是完全信息的博弈.下面我們都將處理不完美動態(tài)博弈. (2)對于一般的完全信息動態(tài)博弈,我們可以采用完美子博弈nash均衡精煉nash均衡.然而,在不完全信息的博弈當(dāng)中,由于信息的缺失,我們通常難以尋找subgame. (3)由于類型的未知性,我們需要利用一定的理性方式,去描述這樣接受者對發(fā)送者類型的推測或者叫信念(belief). 3.引入元素解決方案 我們已經(jīng)講過利用海薩尼轉(zhuǎn)換,可以把一個不完全信息博弈轉(zhuǎn)換成完全但不完美信息博弈.所以我們的一個問題解決了. 3.1.元素1:后續(xù)博弈(identifysubforms) 動態(tài)博弈最基本的精煉nash均衡的方法就是尋找完美子博弈nash均衡.但是在信息集存在下,通常不能夠直接尋找到子博弈.所以我們需要引入更加廣義的子博弈的概念. 定義:subforms Condition 1)子樹只能從整個博弈中分離出來.(2)信息集可以作為子樹的根(相對于子博弈的只能是單節(jié)點(diǎn)作為根)通常情況下,我們把參與者i的信息集記為h_{i}屬于H_{i} 3.2.元素2:信念(belief) 自然地,在接受者不清楚發(fā)送者類型的情況下,通常要對發(fā)送者的類型有一個判定,才能進(jìn)行下一步的決策.這樣就十分類似于一個隨機(jī)決策模型.通常我們要引入概率的概念去理性的表述這樣的事情.因為接受者可以觀測到發(fā)送者的決策類型,但是不能觀測到發(fā)送者本身的類型,很自然的,我們會想到條件概率.那么這個belif不是隨便就能給的,自然要假定我們的參與者是理性的條件下,所以類似在不完全信息博弈的解法中一樣,引出了bayes法則. 發(fā)送者的信念->對對手的期望收益.(\mu_{i}) 在這個例子中: x=Pr(U|L);y=Pr(U|R) 接受者的信念->對發(fā)送者的類型的估計.(\alpha_{i}) r=Pr(I|L);q=Pr(I|R); 利用以上的概率,就可以去描述問題中的“不完全的信息”。但是隨之而來的問題是,我們的概率要怎么去計算。->bayes法則。 i.e. r=PrIL=Pr(L|I)Pr(I)Pr(L|I)PrI+Pr(L|II)Pr(II)=apap+b(1-p) q=PrIR=Pr(R|I)Pr(I)PrRIPrI+Pr(R|II)Pr(II)=(1-a)p(1-a)p+(1-b)(1-p) 但是有一個問題就是bayes法則對這樣條件概率的評估可能存在一定的問題就是無法表示那些概率為0的情況。說來抽象,我自己也不是很明白其中的一些含義(可能和測度有關(guān))。最后是用一致性解決這個問題。 3.3元素3:決策類型 有了以上兩個工具,看似已經(jīng)夠了,但是我們需要對問題進(jìn)行進(jìn)一步的簡化。這個一個信號博弈,有幾種類型的決策,搞清楚這幾種類型的決策對解決問題是很有必要的。 1.混合策略(Pooling Equilibria) 無論發(fā)送者是怎么樣的類型,都做同樣的決策。 2.分離策略(Separating Equilibria) 不同類型的發(fā)送者選擇不同的決策。 3.雜合策略(hybrid strategy) 一種類型的發(fā)送者選擇特定的決策,而另一種類型的發(fā)送者隨機(jī)的選擇決策。 4.完全混合策略 兩種類型的發(fā)送者都隨機(jī)地選擇決策。 4.求解博弈 對于我們這個例子,我們可以求解博弈。 具體求解見附件中,有興趣交流。 5.總結(jié):從自然走向理性。 什么是理性,是一種思維方式,不得不承認(rèn):人是只不過是一根會思想的葦草。帕斯卡爾是一名思想家,物理學(xué)家(大氣壓的單位Pa就是以他命名)。 理性是怎么樣的一種思維方式?就是量化的、客觀的、咬文嚼字的、利益優(yōu)先的、利己的、抽象的、概括的。 的確它是形而上的,就像數(shù)學(xué),形而上的叫邏輯的思維,宏觀的決策,就像運(yùn)籌帷幄決勝千里之外。而形而下的就是一些繁瑣的積分、導(dǎo)數(shù)的計算等等。對,思維是形而上的。思維能指導(dǎo)人,運(yùn)作人。 就像解決一個問題,首先說明一下問題這個概念,它是區(qū)別于特例的,問題是沒有具體的數(shù)字的。是種種特例的抽象形式。解決問題是形而上的,我們叫算法。解決特例是形而下的,我們叫做答案,針對特例的答案。理性的思維是追求算法。特例里面的數(shù)據(jù)變動一下,我們照樣能夠輕松解決,需要有這樣的習(xí)慣,可能前面花費(fèi)了大量的精力,只要能夠?qū)σ院蟮墓ぷ魈峁┯谰眯缘谋憷际侵档玫。這樣的習(xí)慣很重要。 具體點(diǎn)來講,理性的思維怎么運(yùn)用到這樣一個“不完全信息動態(tài)博弈”中呢。 分析問題,一個陌生的問題需要轉(zhuǎn)換成一個我們已經(jīng)熟悉的問題中去,這是一條捷徑。 (1)海薩尼轉(zhuǎn)換;以及引入的第一個元素:(2)后續(xù)博弈,都是運(yùn)用了這樣的思維去解決問題。 這樣問題就變成一個不完美的動態(tài)博弈。難點(diǎn)就在于接受者沒有獲得完全的信息,這樣就產(chǎn)生了主觀的評價。在理性的世界里是不喜歡主觀的東西的,通常要把主觀的東西用客觀的公式,參數(shù)去表示。 自然就想到了概率中的條件概率,又如何計算,bayes法則就呼之欲出了。從而有了不完全信息動態(tài)博弈的貝葉斯納什均衡。 (3)問題中還有一點(diǎn)就是引入了4種策略,混同的、分離的、混合的等,這四種策略看似實在暴力,其實有他的道理。想一想,如果我們沒頭沒腦地去解這樣一個博弈,想來不是很容易,而且均衡的意義難以解釋。其實也是一種思維的體現(xiàn),我們在求解泛函問題或者復(fù)雜的函數(shù)問題的時候,往往會選擇幾種特定的函數(shù)先去試一試,后來發(fā)現(xiàn)這幾種函數(shù)已經(jīng)能夠產(chǎn)生最優(yōu),當(dāng)然需要證明。那么我們就解決問題了。 這個問題也是的,只不過需要問題中的這4種策略囊括了發(fā)送者的所有可能。 |
收藏與分享 |

金蟲 (初入文壇)

金蟲 (小有名氣)
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 327求調(diào)劑 +6 | 汲亦昊 2026-03-29 | 6/300 |
|
|---|---|---|---|---|
|
[考研] 329求調(diào)劑 +10 | 鈕恩雪 2026-03-25 | 10/500 |
|
|
[考研] 一志愿鄭州大學(xué),080500學(xué)碩,總分317分求調(diào)劑 +8 | 舉個栗子oi 2026-03-24 | 9/450 |
|
|
[考研] 一志愿華北電力大學(xué)能動專碩,293,求調(diào)劑 +3 | 15537177284 2026-03-23 | 5/250 |
|
|
[考研] 一志愿北京工業(yè)大學(xué),324分求調(diào)劑 +4 | 零八# 2026-03-28 | 4/200 |
|
|
[考研] 材料與化工(0856)304求B區(qū)調(diào)劑 +8 | 邱gl 2026-03-27 | 8/400 |
|
|
[考研] 266分,求材料冶金能源化工等調(diào)劑 +7 | 哇呼哼呼哼 2026-03-27 | 9/450 |
|
|
[考研] 085405 考的11408求各位老師帶走 +3 | Qiu學(xué)ing 2026-03-28 | 3/150 |
|
|
[考研] 292求調(diào)劑 +14 | 鵝鵝鵝額額額額?/a> 2026-03-25 | 15/750 |
|
|
[考研] 材料求調(diào)劑 一志愿哈工大總分298分,前三科223分 +5 | dongfang59 2026-03-27 | 5/250 |
|
|
[考研] 07化學(xué)280分求調(diào)劑 +10 | 722865 2026-03-23 | 10/500 |
|
|
[考研] 322求調(diào)劑 +4 | 我真的很想學(xué)習(xí) 2026-03-23 | 4/200 |
|
|
[考研] 333求調(diào)劑 +3 | question挽風(fēng) 2026-03-23 | 3/150 |
|
|
[考研] 0703化學(xué)338求調(diào)劑! +6 | Zuhui0306 2026-03-26 | 7/350 |
|
|
[考研] 求調(diào)劑323材料與化工 +7 | 1124361 2026-03-24 | 7/350 |
|
|
[考研]
材料學(xué)碩,求調(diào)劑
6+5
|
糖葫蘆888ll 2026-03-22 | 10/500 |
|
|
[考研] 求調(diào)劑 一志愿 本科 北科大 化學(xué) 343 +6 | 13831862839 2026-03-24 | 7/350 |
|
|
[考研] 333求調(diào)劑 +6 | wfh030413@ 2026-03-23 | 6/300 |
|
|
[考研] 26考研-291分-廈門大學(xué)(085601)-柔性電子學(xué)院材料工程專業(yè)求調(diào)劑 +3 | min3 2026-03-24 | 4/200 |
|
|
[考研] 材料/農(nóng)業(yè)專業(yè),07/08開頭均可,過線就行 +3 | 呵唔哦豁 2026-03-23 | 4/200 |
|