| 3 | 1/1 | 返回列表 |
| 查看: 2545 | 回復(fù): 2 | ||||
daiben06金蟲(chóng) (初入文壇)
|
[交流]
關(guān)于信號(hào)博弈的一些總結(jié) 已有1人參與
|
|
信號(hào)博弈 Eric.lab 引: 信號(hào)博弈是不完全信息動(dòng)態(tài)博弈的一種表現(xiàn)形式,基本的求解方法與不完全信息動(dòng)態(tài)博弈中的貝葉斯nash均衡類似.但是要給予信號(hào)博弈貝葉斯納什均衡的幾個(gè)條件,從而形成了信號(hào)條件的概念. 1.定義: 是一種由一個(gè)發(fā)送者(S)和另一個(gè)接收者(R)所組成的動(dòng)態(tài)博弈。一開(kāi)始這個(gè)發(fā)送者有一個(gè)給定的類型(t),接著發(fā)送者會(huì)觀察這個(gè)沒(méi)有其他人(好比說(shuō)接收者)知道的類型,去從訊息堆 M ={m1, m2, m3,..., mj} 中選擇送出一個(gè)訊息(m),接著接收者會(huì)觀察這個(gè)訊息后從他可行的動(dòng)作中A = {a1, a2, a3,...., ak} 選一個(gè)作為反應(yīng)動(dòng)作(a),這里要注意的是接收者除了訊息之外其他都無(wú)法得知(如發(fā)送者的類型t),接著根據(jù)(t, m, a)的組合來(lái)決定雙方會(huì)獲得的報(bào)酬或回報(bào)。 例子: 見(jiàn)附件。 2.信號(hào)博弈(不完全信息動(dòng)態(tài)博弈) 問(wèn)題的難點(diǎn): (1)在不完全信息動(dòng)態(tài)博弈中,出現(xiàn)了類型的不同的問(wèn)題,這樣的問(wèn)題是經(jīng)典博弈論無(wú)法解決的.但是可以通過(guò)海薩尼轉(zhuǎn)換將一個(gè)不完全信息博弈,轉(zhuǎn)換成不完美但是完全信息的博弈.下面我們都將處理不完美動(dòng)態(tài)博弈. (2)對(duì)于一般的完全信息動(dòng)態(tài)博弈,我們可以采用完美子博弈nash均衡精煉nash均衡.然而,在不完全信息的博弈當(dāng)中,由于信息的缺失,我們通常難以尋找subgame. (3)由于類型的未知性,我們需要利用一定的理性方式,去描述這樣接受者對(duì)發(fā)送者類型的推測(cè)或者叫信念(belief). 3.引入元素解決方案 我們已經(jīng)講過(guò)利用海薩尼轉(zhuǎn)換,可以把一個(gè)不完全信息博弈轉(zhuǎn)換成完全但不完美信息博弈.所以我們的一個(gè)問(wèn)題解決了. 3.1.元素1:后續(xù)博弈(identifysubforms) 動(dòng)態(tài)博弈最基本的精煉nash均衡的方法就是尋找完美子博弈nash均衡.但是在信息集存在下,通常不能夠直接尋找到子博弈.所以我們需要引入更加廣義的子博弈的概念. 定義:subforms Condition 1)子樹(shù)只能從整個(gè)博弈中分離出來(lái).(2)信息集可以作為子樹(shù)的根(相對(duì)于子博弈的只能是單節(jié)點(diǎn)作為根)通常情況下,我們把參與者i的信息集記為h_{i}屬于H_{i} 3.2.元素2:信念(belief) 自然地,在接受者不清楚發(fā)送者類型的情況下,通常要對(duì)發(fā)送者的類型有一個(gè)判定,才能進(jìn)行下一步的決策.這樣就十分類似于一個(gè)隨機(jī)決策模型.通常我們要引入概率的概念去理性的表述這樣的事情.因?yàn)榻邮苷呖梢杂^測(cè)到發(fā)送者的決策類型,但是不能觀測(cè)到發(fā)送者本身的類型,很自然的,我們會(huì)想到條件概率.那么這個(gè)belif不是隨便就能給的,自然要假定我們的參與者是理性的條件下,所以類似在不完全信息博弈的解法中一樣,引出了bayes法則. 發(fā)送者的信念->對(duì)對(duì)手的期望收益.(\mu_{i}) 在這個(gè)例子中: x=Pr(U|L);y=Pr(U|R) 接受者的信念->對(duì)發(fā)送者的類型的估計(jì).(\alpha_{i}) r=Pr(I|L);q=Pr(I|R); 利用以上的概率,就可以去描述問(wèn)題中的“不完全的信息”。但是隨之而來(lái)的問(wèn)題是,我們的概率要怎么去計(jì)算。->bayes法則。 i.e. r=PrIL=Pr(L|I)Pr(I)Pr(L|I)PrI+Pr(L|II)Pr(II)=apap+b(1-p) q=PrIR=Pr(R|I)Pr(I)PrRIPrI+Pr(R|II)Pr(II)=(1-a)p(1-a)p+(1-b)(1-p) 但是有一個(gè)問(wèn)題就是bayes法則對(duì)這樣條件概率的評(píng)估可能存在一定的問(wèn)題就是無(wú)法表示那些概率為0的情況。說(shuō)來(lái)抽象,我自己也不是很明白其中的一些含義(可能和測(cè)度有關(guān))。最后是用一致性解決這個(gè)問(wèn)題。 3.3元素3:決策類型 有了以上兩個(gè)工具,看似已經(jīng)夠了,但是我們需要對(duì)問(wèn)題進(jìn)行進(jìn)一步的簡(jiǎn)化。這個(gè)一個(gè)信號(hào)博弈,有幾種類型的決策,搞清楚這幾種類型的決策對(duì)解決問(wèn)題是很有必要的。 1.混合策略(Pooling Equilibria) 無(wú)論發(fā)送者是怎么樣的類型,都做同樣的決策。 2.分離策略(Separating Equilibria) 不同類型的發(fā)送者選擇不同的決策。 3.雜合策略(hybrid strategy) 一種類型的發(fā)送者選擇特定的決策,而另一種類型的發(fā)送者隨機(jī)的選擇決策。 4.完全混合策略 兩種類型的發(fā)送者都隨機(jī)地選擇決策。 4.求解博弈 對(duì)于我們這個(gè)例子,我們可以求解博弈。 具體求解見(jiàn)附件中,有興趣交流。 5.總結(jié):從自然走向理性。 什么是理性,是一種思維方式,不得不承認(rèn):人是只不過(guò)是一根會(huì)思想的葦草。帕斯卡爾是一名思想家,物理學(xué)家(大氣壓的單位Pa就是以他命名)。 理性是怎么樣的一種思維方式?就是量化的、客觀的、咬文嚼字的、利益優(yōu)先的、利己的、抽象的、概括的。 的確它是形而上的,就像數(shù)學(xué),形而上的叫邏輯的思維,宏觀的決策,就像運(yùn)籌帷幄決勝千里之外。而形而下的就是一些繁瑣的積分、導(dǎo)數(shù)的計(jì)算等等。對(duì),思維是形而上的。思維能指導(dǎo)人,運(yùn)作人。 就像解決一個(gè)問(wèn)題,首先說(shuō)明一下問(wèn)題這個(gè)概念,它是區(qū)別于特例的,問(wèn)題是沒(méi)有具體的數(shù)字的。是種種特例的抽象形式。解決問(wèn)題是形而上的,我們叫算法。解決特例是形而下的,我們叫做答案,針對(duì)特例的答案。理性的思維是追求算法。特例里面的數(shù)據(jù)變動(dòng)一下,我們照樣能夠輕松解決,需要有這樣的習(xí)慣,可能前面花費(fèi)了大量的精力,只要能夠?qū)σ院蟮墓ぷ魈峁┯谰眯缘谋憷际侵档玫。這樣的習(xí)慣很重要。 具體點(diǎn)來(lái)講,理性的思維怎么運(yùn)用到這樣一個(gè)“不完全信息動(dòng)態(tài)博弈”中呢。 分析問(wèn)題,一個(gè)陌生的問(wèn)題需要轉(zhuǎn)換成一個(gè)我們已經(jīng)熟悉的問(wèn)題中去,這是一條捷徑。 (1)海薩尼轉(zhuǎn)換;以及引入的第一個(gè)元素:(2)后續(xù)博弈,都是運(yùn)用了這樣的思維去解決問(wèn)題。 這樣問(wèn)題就變成一個(gè)不完美的動(dòng)態(tài)博弈。難點(diǎn)就在于接受者沒(méi)有獲得完全的信息,這樣就產(chǎn)生了主觀的評(píng)價(jià)。在理性的世界里是不喜歡主觀的東西的,通常要把主觀的東西用客觀的公式,參數(shù)去表示。 自然就想到了概率中的條件概率,又如何計(jì)算,bayes法則就呼之欲出了。從而有了不完全信息動(dòng)態(tài)博弈的貝葉斯納什均衡。 (3)問(wèn)題中還有一點(diǎn)就是引入了4種策略,混同的、分離的、混合的等,這四種策略看似實(shí)在暴力,其實(shí)有他的道理。想一想,如果我們沒(méi)頭沒(méi)腦地去解這樣一個(gè)博弈,想來(lái)不是很容易,而且均衡的意義難以解釋。其實(shí)也是一種思維的體現(xiàn),我們?cè)谇蠼夥汉瘑?wèn)題或者復(fù)雜的函數(shù)問(wèn)題的時(shí)候,往往會(huì)選擇幾種特定的函數(shù)先去試一試,后來(lái)發(fā)現(xiàn)這幾種函數(shù)已經(jīng)能夠產(chǎn)生最優(yōu),當(dāng)然需要證明。那么我們就解決問(wèn)題了。 這個(gè)問(wèn)題也是的,只不過(guò)需要問(wèn)題中的這4種策略囊括了發(fā)送者的所有可能。 |
收藏與分享 |

金蟲(chóng) (小有名氣)
金蟲(chóng) (初入文壇)

| 3 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 289求調(diào)劑 +13 | 新時(shí)代材料 2026-03-27 | 13/650 |
|
|---|---|---|---|---|
|
[碩博家園] 求調(diào)劑 有機(jī)化學(xué)考研356分 +3 | Nadiums 2026-03-25 | 4/200 |
|
|
[考研] 070300化學(xué)354求調(diào)劑 +3 | 101次希望 2026-03-28 | 3/150 |
|
|
[考研] 本科雙非材料,跨考一志愿華電085801電氣,283求調(diào)劑,任何專業(yè)都可以 +6 | 芝士雪baoo 2026-03-28 | 7/350 |
|
|
[考研] 求調(diào)劑一志愿海大,0703化學(xué)學(xué)碩304分,有大創(chuàng)項(xiàng)目,四級(jí)已過(guò) +7 | 幸運(yùn)哩哩 2026-03-22 | 11/550 |
|
|
[考研] 本科新能源科學(xué)與工程,一志愿華理能動(dòng)285求調(diào)劑 +3 | AZMK 2026-03-27 | 5/250 |
|
|
[考研]
|
y7czhao 2026-03-26 | 10/500 |
|
|
[考研] 0703一志愿9,初試成績(jī):338,四六級(jí)已過(guò),有科研經(jīng)歷,求調(diào)劑! +4 | Zuhui0306 2026-03-25 | 4/200 |
|
|
[考研] 070300求調(diào)劑306分 +4 | 26要上岸 2026-03-27 | 4/200 |
|
|
[考研] 311求調(diào)劑 +3 | 希望上岸阿小楊 2026-03-23 | 3/150 |
|
|
[考研] 求調(diào)劑 +4 | 零八# 2026-03-27 | 4/200 |
|
|
[考研] 085600,材料與化工321分調(diào)劑 +4 | 大饞小子 2026-03-27 | 6/300 |
|
|
[考研] 一志愿鄭大085600,310分求調(diào)劑 +5 | 李瀟可 2026-03-26 | 5/250 |
|
|
[考研] 中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院-光纖傳感課題組招生-中國(guó)科學(xué)院大學(xué)、深圳理工大學(xué)聯(lián)培 +5 | YangTyu1 2026-03-26 | 5/250 |
|
|
[考研] 271求調(diào)劑 +6 | 生如夏花… 2026-03-22 | 6/300 |
|
|
[考研] 環(huán)境專碩324分求調(diào)劑推薦 +5 | 軒小寧—— 2026-03-26 | 5/250 |
|
|
[考研] 0854電子信息求調(diào)劑 324 +4 | Promise-jyl 2026-03-23 | 4/200 |
|
|
[考研] 340求調(diào)劑 +5 | 話梅糖111 2026-03-24 | 5/250 |
|
|
[考研] 材料專碩找調(diào)劑 +5 | 哈哈哈吼吼吼哈 2026-03-23 | 5/250 |
|
|
[考研] 一志愿南航材料專317分求調(diào)劑 +5 | 炸呀炸呀炸薯?xiàng)l 2026-03-23 | 5/250 |
|