博弈論:每個人都能成為決策高手

第13章 囚犯困境:沒人願意坐以待斃

字體:16+-

囚犯困境的來源

囚犯困境又稱“囚徒困境”,是博弈論中最為經典的理論模型之一。該理論模型有著廣泛的現實應用,在管理學、經濟學、政治學和社會學等眾多學科中都有介紹和分析。但是,很少有人知道囚犯困境到底是怎麽來的,本章的內容就給大家揭開這個謎底。

“二戰”期間,美國的一批科學家和工程師參加軍事工作,把運籌學運用於作戰方麵,獲得優異成績,頗受朝野重視。戰後,為了繼續這項工作,美國成立了著名的蘭德公司。博弈論最初的那些大名鼎鼎的人物許多都與蘭德公司有關,如馮·諾依曼、摩根斯坦、塔克、納什、謝林等。

1950年2月,在蘭德公司工作的梅裏爾·弗勞特(Merrill Flood)和梅爾文·德萊歇(Melvin Dresher)做了一個有關利益分配的博弈實驗。他們找來了兩個好朋友,分別是加州大學洛杉磯分校的阿爾欽(A.Alchain)和蘭德公司的同事威廉斯(J.D.Wlliams),讓他們玩一個遊戲,具體內容如表13.1所列。

表13.1 阿爾欽與威廉斯

這個遊戲中每個參與者有兩個選項:合作或背叛。從該博弈給出的4種結果看,對雙方來說,都選擇合作是最好的結果。然而每個人從自身利益考慮後發現,無論對方是否合作,選擇背叛其實是對自己更好的選擇,即背叛是占優策略。實驗一共進行了100次的博弈,其中阿爾欽68次選擇了合作,威廉斯78次選擇了合作。

盡管實驗的結果在蘭德公司引起了廣泛的關注,但大家都隻覺得這是一個很有趣的實驗,它並沒有引起人們足夠的重視。後來,威廉斯把這個博弈實驗告訴了蘭德公司的顧問——數學家塔克(A.W.Tucker),這個博弈實驗給塔克留下了深刻的印象。

1950年5月,斯坦福大學心理學係請塔克給大家做一個有關博弈論方麵的報告。在報告時,塔克想到了威廉斯告訴他的那個博弈實驗,並把它喬裝打扮了一番,以便更符合聽眾的知識背景。這就是後來廣為流傳的“囚犯困境”。塔克後來寫信告訴威廉斯,在演講中,他是這樣說的:“兩個被指共同犯罪的罪犯被警察分別關押著。每個人都被告知:(1)如果一個人招供而另一個人不招供,前者將被授以獎金,後者將被處以罰金。(2)如果兩個人都招供,兩個人都要被處以罰金。(3)同時,兩個人都有充足的理由相信,如果兩個人都不招供,兩個人都將被無罪釋放。”