博弈是什么意思博弈的分類
博弈是什么意思博弈的分類
博弈本意是:下棋。引申義是:在一定條件下,遵守一定的規(guī)則,一個(gè)或幾個(gè)擁有絕對(duì)理性思維的人或團(tuán)隊(duì),從各自允許選擇的行為或策略進(jìn)行選擇并加以實(shí)施,并從中各自取得相應(yīng)結(jié)果或收益的過(guò)程。那么你對(duì)博弈了解多少呢?以下是由學(xué)習(xí)啦小編整理關(guān)于博弈是什么意思的內(nèi)容,希望大家喜歡!
博弈的簡(jiǎn)介
一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容:第一,博弈的參加者,即博弈過(guò)程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。
博弈的分類
從博弈的研究范式來(lái)劃分,可分為傳統(tǒng)博弈論和演化博弈論;從博弈的具體應(yīng)用來(lái)劃分,可分為靜態(tài)博弈和動(dòng)態(tài)博弈。靜態(tài)博弈是指在博弈中,兩個(gè)參與人同時(shí)選擇或兩人不同時(shí)選擇,但后行動(dòng)者并不知道先行動(dòng)者采取什么樣的具體行動(dòng)。對(duì)雙方來(lái)說(shuō),都容易形成混沌的行為重組,由于規(guī)則的嚴(yán)密與精細(xì),任何人因時(shí)間問(wèn)題、資金問(wèn)題、心理問(wèn)題等等,致使在多次均衡后直到不明不白地造成大輸,參與靜態(tài)博弈和動(dòng)態(tài)博弈的大部分都是這種人。動(dòng)態(tài)博弈是指在博弈中,兩個(gè)參與人有行動(dòng)的先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。
根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動(dòng),博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。
所謂合作性博弈是指參與者從自己的利益出發(fā)與其他參與者談判達(dá)成協(xié)議或形成聯(lián)盟,其結(jié)果對(duì)聯(lián)盟方均有利;而非合作性博弈是指參與者在行動(dòng)選擇時(shí)無(wú)法達(dá)成約束性的協(xié)議。人們分工與交換的經(jīng)濟(jì)活動(dòng)以及囚徒困境就是合作性的博弈,而公共資源悲劇都是非合作性的博弈。
從知識(shí)的擁有程度來(lái)看,博弈分為完全信息博弈和不完全信息博弈。信息是博弈論中重要的內(nèi)容。完全信息博弈指參與者對(duì)所有參與者的策略空間及策略組合下的支付有“完全的了解”,否則是不完全信息博弈。嚴(yán)格地講,完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的“公共知識(shí)”的博弈。對(duì)于不完全信息博弈,參與者所做的是努力使自己的期望支付或期望效用最大化。
以此博弈哲學(xué)語(yǔ)言也可體現(xiàn)出以下四種博弈分類:
完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈
其中策略性博弈應(yīng)屬于完全信息靜態(tài)博弈,而完全信息動(dòng)態(tài)博弈則包括擴(kuò)展性博弈和重復(fù)博弈等;不完全信息靜態(tài)博弈則是以貝葉斯均衡等理論完成對(duì)混合策略的重新解釋,不完全信息動(dòng)態(tài)博弈則是完美貝葉斯均衡為核心概念的信號(hào)博弈。
博弈論的介紹
博弈論又被稱為對(duì)策論(Game Theory)既是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。
博弈論主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。是研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。 博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略。生物學(xué)家使用博弈理論來(lái)理解和預(yù)測(cè)進(jìn)化論的某些結(jié)果。博弈論已經(jīng)成為經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)分析工具之一。在生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。基本概念中包括局中人、行動(dòng)、信息、策略、收益、均衡和結(jié)果等。其中局中人、策略和收益是最基本要素。局中人、行動(dòng)和結(jié)果被統(tǒng)稱為博弈規(guī)則。
博弈論畢竟是數(shù)學(xué),更確切地說(shuō)是運(yùn)籌學(xué)的一個(gè)分支,談經(jīng)論道自然少不了數(shù)學(xué)語(yǔ)言,外行人看來(lái)只是一大堆數(shù)學(xué)公式。好在博弈論關(guān)心的是日常經(jīng)濟(jì)生活問(wèn)題,所以不能不食人間煙火。其實(shí)這一理論是從棋弈、撲克和戰(zhàn)爭(zhēng)等帶有競(jìng)賽、對(duì)抗和決策性質(zhì)的問(wèn)題中借用的術(shù)語(yǔ),聽(tīng)上去有點(diǎn)玄奧,實(shí)際上卻具有重要現(xiàn)實(shí)意義。博弈論大師看經(jīng)濟(jì)社會(huì)問(wèn)題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來(lái),并不乏味。話說(shuō)有一天,一位富翁在家中被殺,財(cái)物被盜。警方在此案的偵破過(guò)程中,抓到兩個(gè)犯罪嫌疑人,斯卡爾菲絲和那庫(kù)爾斯,并從他們的住處搜出被害人家中丟失的財(cái)物。但是,他們矢口否認(rèn)曾殺過(guò)人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點(diǎn)兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個(gè)人單獨(dú)談話。檢察官說(shuō),“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個(gè)交易。如果你單獨(dú)坦白殺人的罪行,我只判你三個(gè)月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個(gè)月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。”斯卡爾菲絲和那庫(kù)爾斯該怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無(wú)法串供。所以,按照亞當(dāng)·斯密的理論,每一個(gè)人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因?yàn)樘拱捉淮梢云谕玫胶芏痰谋O(jiān)禁———3個(gè)月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對(duì)方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時(shí)坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對(duì)雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會(huì)出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因?yàn)?,每一方在選擇策略時(shí)都沒(méi)有“共謀”(串供),他們只是選擇對(duì)自己最有利的策略,而不考慮社會(huì)福利或任何其他對(duì)手的利益。也就是說(shuō),這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒(méi)有人會(huì)主動(dòng)改變自己的策略以便使自己獲得更大利益。“囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長(zhǎng)的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。“納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。不妨讓我們重溫一下這位經(jīng)濟(jì)學(xué)圣人在《國(guó)富論》中的名言:“通過(guò)追求(個(gè)人的)自身利益,他常常會(huì)比其實(shí)際上想做的那樣更有效地促進(jìn)社會(huì)利益。”從“納什均衡”我們引出了“看不見(jiàn)的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說(shuō),“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對(duì)你的方式來(lái)對(duì)別人,但只有他們也按同樣方式行事才行。也就是中國(guó)人說(shuō)的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。所以“納什均衡”是對(duì)馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說(shuō)是一場(chǎng)革命。
從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見(jiàn)慣的經(jīng)濟(jì)、社會(huì)、政治、國(guó)防、管理和日常生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。如價(jià)格戰(zhàn)、軍備競(jìng)賽、污染等等。一般的博弈問(wèn)題由三個(gè)要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一對(duì)局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個(gè)特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問(wèn)題都會(huì)遇到這三個(gè)要素。
看過(guò)“博弈的分類”的人還看了: