版塊導(dǎo)航: 正在加載中...

應(yīng)《網(wǎng)絡(luò)安全法》要求，自2017年10月1日起，未進(jìn)行實(shí)名認(rèn)證將不得使用互聯(lián)網(wǎng)跟帖服務(wù)。為保障您的帳號(hào)能夠正常使用，請(qǐng)盡快對(duì)帳號(hào)進(jìn)行手機(jī)號(hào)驗(yàn)證，感謝您的理解與支持！

24小時(shí)熱門(mén)版塊排行榜

北京石油化工學(xué)院2026年研究生招生接收調(diào)劑公告

返回列表

daiben06

金蟲(chóng) (初入文壇)

應(yīng)助: 4 (幼兒園)
金幣: 580.3
帖子: 32
在線: 36.5小時(shí)
蟲(chóng)號(hào): 2575070
注冊(cè): 2013-07-31
性別: GG
專業(yè): 運(yùn)籌學(xué)

[交流] 關(guān)于信號(hào)博弈的一些總結(jié) 已有1人參與

信號(hào)博弈
Eric.lab

引:

信號(hào)博弈是不完全信息動(dòng)態(tài)博弈的一種表現(xiàn)形式,基本的求解方法與不完全信息動(dòng)態(tài)博弈中的貝葉斯nash均衡類似.但是要給予信號(hào)博弈貝葉斯納什均衡的幾個(gè)條件,從而形成了信號(hào)條件的概念.

1.定義:

是一種由一個(gè)發(fā)送者（S）和另一個(gè)接收者（R）所組成的動(dòng)態(tài)博弈。一開(kāi)始這個(gè)發(fā)送者有一個(gè)給定的類型（t），接著發(fā)送者會(huì)觀察這個(gè)沒(méi)有其他人（好比說(shuō)接收者）知道的類型，去從訊息堆 M ={m1, m2, m3,..., mj} 中選擇送出一個(gè)訊息（m），接著接收者會(huì)觀察這個(gè)訊息后從他可行的動(dòng)作中A = {a1, a2, a3,...., ak} 選一個(gè)作為反應(yīng)動(dòng)作（a），這里要注意的是接收者除了訊息之外其他都無(wú)法得知（如發(fā)送者的類型t），接著根據(jù)（t, m, a）的組合來(lái)決定雙方會(huì)獲得的報(bào)酬或回報(bào)。

例子:

見(jiàn)附件。

2.信號(hào)博弈(不完全信息動(dòng)態(tài)博弈)

問(wèn)題的難點(diǎn):

(1)在不完全信息動(dòng)態(tài)博弈中,出現(xiàn)了類型的不同的問(wèn)題,這樣的問(wèn)題是經(jīng)典博弈論無(wú)法解決的.但是可以通過(guò)海薩尼轉(zhuǎn)換將一個(gè)不完全信息博弈,轉(zhuǎn)換成不完美但是完全信息的博弈.下面我們都將處理不完美動(dòng)態(tài)博弈.

(2)對(duì)于一般的完全信息動(dòng)態(tài)博弈,我們可以采用完美子博弈nash均衡精煉nash均衡.然而,在不完全信息的博弈當(dāng)中,由于信息的缺失,我們通常難以尋找subgame.

(3)由于類型的未知性,我們需要利用一定的理性方式,去描述這樣接受者對(duì)發(fā)送者類型的推測(cè)或者叫信念(belief).

3.引入元素解決方案

我們已經(jīng)講過(guò)利用海薩尼轉(zhuǎn)換,可以把一個(gè)不完全信息博弈轉(zhuǎn)換成完全但不完美信息博弈.所以我們的一個(gè)問(wèn)題解決了.

3.1.元素1:后續(xù)博弈(identifysubforms)

動(dòng)態(tài)博弈最基本的精煉nash均衡的方法就是尋找完美子博弈nash均衡.但是在信息集存在下,通常不能夠直接尋找到子博弈.所以我們需要引入更加廣義的子博弈的概念.

定義:subforms

Condition

1)子樹(shù)只能從整個(gè)博弈中分離出來(lái).(2)信息集可以作為子樹(shù)的根(相對(duì)于子博弈的只能是單節(jié)點(diǎn)作為根)

通常情況下,我們把參與者i的信息集記為h_{i}屬于H_{i}

3.2.元素2:信念(belief)

自然地,在接受者不清楚發(fā)送者類型的情況下,通常要對(duì)發(fā)送者的類型有一個(gè)判定,才能進(jìn)行下一步的決策.這樣就十分類似于一個(gè)隨機(jī)決策模型.通常我們要引入概率的概念去理性的表述這樣的事情.因?yàn)榻邮苷呖梢杂^測(cè)到發(fā)送者的決策類型,但是不能觀測(cè)到發(fā)送者本身的類型,很自然的,我們會(huì)想到條件概率.那么這個(gè)belif不是隨便就能給的,自然要假定我們的參與者是理性的條件下,所以類似在不完全信息博弈的解法中一樣,引出了bayes法則.

發(fā)送者的信念->對(duì)對(duì)手的期望收益.(\mu_{i})

在這個(gè)例子中：

x=Pr(U|L);y=Pr(U|R)

接受者的信念->對(duì)發(fā)送者的類型的估計(jì).(\alpha_{i})

r=Pr(I|L);q=Pr(I|R);

利用以上的概率，就可以去描述問(wèn)題中的“不完全的信息”。但是隨之而來(lái)的問(wèn)題是，我們的概率要怎么去計(jì)算。->bayes法則。

i.e.

r=PrIL=Pr⁡(L|I)Pr⁡(I)Pr(L|I)PrI+Pr⁡(L|II)Pr⁡(II)=apap+b(1-p)

q=PrIR=Pr⁡(R|I)Pr⁡(I)PrRIPrI+Pr⁡(R|II)Pr⁡(II)=(1-a)p(1-a)p+(1-b)(1-p)

但是有一個(gè)問(wèn)題就是bayes法則對(duì)這樣條件概率的評(píng)估可能存在一定的問(wèn)題就是無(wú)法表示那些概率為0的情況。說(shuō)來(lái)抽象，我自己也不是很明白其中的一些含義（可能和測(cè)度有關(guān)）。最后是用一致性解決這個(gè)問(wèn)題。

3.3元素3：決策類型

有了以上兩個(gè)工具，看似已經(jīng)夠了，但是我們需要對(duì)問(wèn)題進(jìn)行進(jìn)一步的簡(jiǎn)化。這個(gè)一個(gè)信號(hào)博弈，有幾種類型的決策，搞清楚這幾種類型的決策對(duì)解決問(wèn)題是很有必要的。

1.混合策略(Pooling Equilibria)

無(wú)論發(fā)送者是怎么樣的類型，都做同樣的決策。

2.分離策略（Separating Equilibria）

不同類型的發(fā)送者選擇不同的決策。

3.雜合策略(hybrid strategy)

一種類型的發(fā)送者選擇特定的決策，而另一種類型的發(fā)送者隨機(jī)的選擇決策。

4.完全混合策略

兩種類型的發(fā)送者都隨機(jī)地選擇決策。

4.求解博弈

對(duì)于我們這個(gè)例子，我們可以求解博弈。

具體求解見(jiàn)附件中，有興趣交流。

5.總結(jié)：從自然走向理性。

什么是理性，是一種思維方式，不得不承認(rèn)：人是只不過(guò)是一根會(huì)思想的葦草。帕斯卡爾是一名思想家，物理學(xué)家（大氣壓的單位Pa就是以他命名）。

理性是怎么樣的一種思維方式？就是量化的、客觀的、咬文嚼字的、利益優(yōu)先的、利己的、抽象的、概括的。

的確它是形而上的，就像數(shù)學(xué)，形而上的叫邏輯的思維，宏觀的決策，就像運(yùn)籌帷幄決勝千里之外。而形而下的就是一些繁瑣的積分、導(dǎo)數(shù)的計(jì)算等等。對(duì)，思維是形而上的。思維能指導(dǎo)人，運(yùn)作人。

就像解決一個(gè)問(wèn)題，首先說(shuō)明一下問(wèn)題這個(gè)概念，它是區(qū)別于特例的，問(wèn)題是沒(méi)有具體的數(shù)字的。是種種特例的抽象形式。解決問(wèn)題是形而上的，我們叫算法。解決特例是形而下的，我們叫做答案，針對(duì)特例的答案。理性的思維是追求算法。特例里面的數(shù)據(jù)變動(dòng)一下，我們照樣能夠輕松解決，需要有這樣的習(xí)慣，可能前面花費(fèi)了大量的精力，只要能夠?qū)σ院蟮墓ぷ魈峁┯谰眯缘谋憷际侵档玫�。這樣的習(xí)慣很重要。

具體點(diǎn)來(lái)講，理性的思維怎么運(yùn)用到這樣一個(gè)“不完全信息動(dòng)態(tài)博弈”中呢。

分析問(wèn)題，一個(gè)陌生的問(wèn)題需要轉(zhuǎn)換成一個(gè)我們已經(jīng)熟悉的問(wèn)題中去，這是一條捷徑。

（1）海薩尼轉(zhuǎn)換；以及引入的第一個(gè)元素：（2）后續(xù)博弈，都是運(yùn)用了這樣的思維去解決問(wèn)題。

這樣問(wèn)題就變成一個(gè)不完美的動(dòng)態(tài)博弈。難點(diǎn)就在于接受者沒(méi)有獲得完全的信息，這樣就產(chǎn)生了主觀的評(píng)價(jià)。在理性的世界里是不喜歡主觀的東西的，通常要把主觀的東西用客觀的公式，參數(shù)去表示。

自然就想到了概率中的條件概率，又如何計(jì)算，bayes法則就呼之欲出了。從而有了不完全信息動(dòng)態(tài)博弈的貝葉斯納什均衡。

（3）問(wèn)題中還有一點(diǎn)就是引入了4種策略，混同的、分離的、混合的等，這四種策略看似實(shí)在暴力，其實(shí)有他的道理。想一想，如果我們沒(méi)頭沒(méi)腦地去解這樣一個(gè)博弈，想來(lái)不是很容易，而且均衡的意義難以解釋。其實(shí)也是一種思維的體現(xiàn)，我們?cè)谇蠼夥汉瘑?wèn)題或者復(fù)雜的函數(shù)問(wèn)題的時(shí)候，往往會(huì)選擇幾種特定的函數(shù)先去試一試，后來(lái)發(fā)現(xiàn)這幾種函數(shù)已經(jīng)能夠產(chǎn)生最優(yōu)，當(dāng)然需要證明。那么我們就解決問(wèn)題了。

這個(gè)問(wèn)題也是的，只不過(guò)需要問(wèn)題中的這4種策略囊括了發(fā)送者的所有可能。

回復(fù)此樓

» 本帖附件資源列表

歡迎監(jiān)督和反饋：小木蟲(chóng)僅提供交流平臺(tái)，不對(duì)該內(nèi)容負(fù)責(zé)。
本內(nèi)容由用戶自主發(fā)布，如果其內(nèi)容涉及到知識(shí)產(chǎn)權(quán)問(wèn)題，其責(zé)任在于用戶本人，如對(duì)版權(quán)有異議，請(qǐng)聯(lián)系郵箱：xiaomuchong@tal.com
附件 1 : 信號(hào)博弈.ppt

2013-08-04 18:36:36, 1.51 M

附件 2 : SEQ.pdf

2013-08-04 18:36:44, 98.47 K

附件 3 : pbe.pdf

2013-08-04 18:36:47, 136.08 K

gametheory~

1樓 2013-08-04 18:36:56

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

lcz_article

金蟲(chóng) (小有名氣)

應(yīng)助: 0 (幼兒園)
金幣: 781.1
帖子: 120
在線: 21.4小時(shí)
蟲(chóng)號(hào): 1626192
注冊(cè): 2012-02-19
專業(yè): 信號(hào)理論與信號(hào)處理

★
小木蟲(chóng): 金幣+0.5, 給個(gè)紅包，謝謝回帖

雖然不懂，但感覺(jué)總結(jié)的還不錯(cuò)哦

贊一下

回復(fù)此樓

2樓2013-08-05 08:41:12

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

daiben06

金蟲(chóng) (初入文壇)

應(yīng)助: 4 (幼兒園)
金幣: 580.3
帖子: 32
在線: 36.5小時(shí)
蟲(chóng)號(hào): 2575070
注冊(cè): 2013-07-31
性別: GG
專業(yè): 運(yùn)籌學(xué)

引用回帖:

2樓: Originally posted by lcz_article at 2013-08-05 08:41:12
雖然不懂，但感覺(jué)總結(jié)的還不錯(cuò)哦

多謝~您是研究信號(hào)理論的嗎，想請(qǐng)教您拉普拉斯變換和Z變換之間的關(guān)系和他們對(duì)信號(hào)處理的意義。不知道能否解釋一下~萬(wàn)分感謝~

贊一下

回復(fù)此樓

gametheory~

3樓2013-08-05 17:09:00

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

相關(guān)版塊跳轉(zhuǎn) 我要訂閱樓主 daiben06 的主題更新

返回列表

普通表情龍兔虎貓高級(jí)回復(fù) (可上傳附件)

最具人氣熱帖推薦 [查看全部]		作者	回/看	最后發(fā)表

[考研] 289求調(diào)劑 +13	新時(shí)代材料 2026-03-27	13/650	2026-03-29 01:16 by 544594351
[碩博家園] 求調(diào)劑有機(jī)化學(xué)考研356分 +3	Nadiums 2026-03-25	4/200	2026-03-29 00:50 by 544594351
[考研] 070300化學(xué)354求調(diào)劑 +3	101次希望 2026-03-28	3/150	2026-03-29 00:28 by 544594351
[考研] 本科雙非材料，跨考一志愿華電085801電氣，283求調(diào)劑，任何專業(yè)都可以 +6	芝士雪baoo 2026-03-28	7/350	2026-03-28 21:40 by zhq0425
[考研] 求調(diào)劑一志愿海大，0703化學(xué)學(xué)碩304分，有大創(chuàng)項(xiàng)目，四級(jí)已過(guò) +7	幸運(yùn)哩哩 2026-03-22	11/550	2026-03-28 20:27 by 唐沐兒
[考研] 本科新能源科學(xué)與工程，一志愿華理能動(dòng)285求調(diào)劑 +3	AZMK 2026-03-27	5/250	2026-03-28 16:19 by xxxsssccc
[考研] 一志愿廈門(mén)大學(xué)化學(xué)學(xué)碩307求調(diào)劑 +10	y7czhao 2026-03-26	10/500	2026-03-28 14:23 by 唐沐兒
[考研] 0703一志愿9，初試成績(jī)：338，四六級(jí)已過(guò)，有科研經(jīng)歷，求調(diào)劑！ +4	Zuhui0306 2026-03-25	4/200	2026-03-28 13:07 by 唐沐兒
[考研] 070300求調(diào)劑306分 +4	26要上岸 2026-03-27	4/200	2026-03-28 13:06 by 唐沐兒
[考研] 311求調(diào)劑 +3	希望上岸阿小楊 2026-03-23	3/150	2026-03-28 07:57 by 熱情沙漠
[考研] 求調(diào)劑 +4	零八# 2026-03-27	4/200	2026-03-27 18:07 by yu221
[考研] 085600，材料與化工321分調(diào)劑 +4	大饞小子 2026-03-27	6/300	2026-03-27 14:11 by 松花缸1201
[考研] 一志愿鄭大085600，310分求調(diào)劑 +5	李瀟可 2026-03-26	5/250	2026-03-27 11:14 by 不吃魚(yú)的貓
[考研] 中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院-光纖傳感課題組招生-中國(guó)科學(xué)院大學(xué)、深圳理工大學(xué)聯(lián)培 +5	YangTyu1 2026-03-26	5/250	2026-03-26 18:27 by 貓咪貓咪呀
[考研] 271求調(diào)劑 +6	生如夏花… 2026-03-22	6/300	2026-03-26 16:48 by 張凱十八號(hào)
[考研] 環(huán)境專碩324分求調(diào)劑推薦 +5	軒小寧—— 2026-03-26	5/250	2026-03-26 12:05 by i_cooler
[考研] 0854電子信息求調(diào)劑 324 +4	Promise-jyl 2026-03-23	4/200	2026-03-25 11:36 by Sugarlight
[考研] 340求調(diào)劑 +5	話梅糖111 2026-03-24	5/250	2026-03-25 06:53 by ilovexiaobin
[考研] 材料專碩找調(diào)劑 +5	哈哈哈吼吼吼哈 2026-03-23	5/250	2026-03-24 19:07 by 了了了了。。
[考研] 一志愿南航材料專317分求調(diào)劑 +5	炸呀炸呀炸薯?xiàng)l 2026-03-23	5/250	2026-03-24 16:52 by 星空星月

亭亭五月天在线观看,亭亭五月天在线观看,国产最新av一区二区,国产 高清 中文字幕,99re热久久亚洲综合精品成人,熟妇 一区二区三区,一级做a爰片性色毛片武则天,美女的骚穴视频播放,国产美女午夜免费视频

24小時(shí)熱門(mén)版塊排行榜

daiben06

[交流] 關(guān)于信號(hào)博弈的一些總結(jié) 已有1人參與

» 本帖附件資源列表

» 收錄本帖的淘帖專輯推薦

» 猜你喜歡

» 本主題相關(guān)價(jià)值貼推薦，對(duì)您同樣有幫助:

lcz_article

daiben06

亭亭五月天在线观看,亭亭五月天在线观看,国产最新av一区二区,国产高清中文字幕,99re热久久亚洲综合精品成人,熟妇一区二区三区,一级做a爰片性色毛片武则天,美女的骚穴视频播放,国产美女午夜免费视频

» 本主題相關(guān)價(jià)值貼推薦，對(duì)您同樣有幫助: