友情提示:本站提供全國400多所高等院校招收碩士、博士研究生入學考試歷年考研真題、考博真題、答案,部分學校更新至2012年,2013年;均提供收費下載。 下載流程: 考研真題 點擊“考研試卷””下載; 考博真題 點擊“考博試卷庫” 下載
博弈論是研究決策主體的行為發生直接相互作用時的決策以及這種決策的均衡,也就是說,當一個主體的選擇受到其他主體選擇的影響,而且反過來影響到其他主體選擇時的決策問題和均衡問題。
一個完整的博弈應當包括五個方面的內容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。
“囚徒困境”
“囚徒困境”是博弈論里最經典的例子之一。講的是兩個嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是"坦白從寬,抗拒從嚴",如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據不足各判1年。
在這個例子里,博弈的參加者就是兩個嫌疑犯A和B,他們每個人都有兩個策略即坦白和不坦白,判刑的年數就是他們的支付??赡艹霈F的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的結果。A和B均坦白是這個博弈的納什均衡。這是因為,假定A選擇坦白的話,B最好是選擇坦白,因為B坦白判8年而抵賴卻要判十年;假定A選擇抵賴的話,B最好還是選擇坦白,因為B坦白判不被判刑而抵賴確要被判刑1年。即是說,不管A坦白或抵賴,B的最佳選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的最佳選擇也是坦白。結果,兩個人都選擇了坦白,各判刑8年。在(坦白、坦白)這個組合中,A和B都不能通過單方面的改變行動增加自己的收益,于是誰也沒有動力游離這個組合,因此這個組合是納什均衡。
囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當然,A和B可以在被警察抓到之前訂立一個"攻守同盟",但是這可能不會有用,因為它不構成納什均衡,沒有人有積極性遵守這個協定。
關于完全理性的思考
囚徒困境博弈的一個假設是博弈方都是完全理性。完全理性來源于經濟學中的理性人假設,即博弈方都以個體利益最大化為目標,且有準確的判斷選擇能力,也不會“犯錯誤”。以個體利益最大為目標被稱為“個體理性”,有完美的分析判斷能力和不會犯選擇行為的錯誤稱為“完全理性”。完全理性包括追求最大利益的理性意識、分析推理能力、識別判斷能力、記憶能力和準確行為能力等多方面的完美性要求,其中任何一方面不完美就不屬于完全理性。我們可以看出,這是一個要求非常嚴格的假設。即便如此,完全理性仍在一個方面沒有做出規定(至少是沒有意識到或明確地規定出來),就是思維方式,也即是博弈方是以將問題分解的方式來思考問題呢,還是以系統的整體的方式來思考問題的。
免責聲明:本文系轉載自網絡,如有侵犯,請聯系我們立即刪除,另:本文僅代表作者個人觀點,與本網站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。