淘氣提示您:看後求收藏(奇妙書庫www.qmshu.tw),接著再看更方便。
每個人都是自私的;二、沒有任何權威干預每個人的決策。也就是說,個人可以完全按照自己利益最大化的企圖進行決策。在此前提下,合作要研究的問題是:第一、人為什麼要合作;第二、人什麼時候是合作的,什麼時候又是不合作的;第三、如何使別人與你合作。書包 網 。 想看書來
第3章 重複博弈:“一錘子買賣”與長期合作(6)
在研究的過程中,愛克斯羅得教授組織了一場計算機模擬競賽,競賽的思路非常簡單:任何想參加這個計算機競賽的人都扮演“囚徒困境”案例中一個囚犯的角色,他們開始玩“囚徒困境”的遊戲,每個人都要在合作與背叛之間做出選擇。關鍵問題在於,他們不只玩一遍這個遊戲,而是一遍一遍地玩上200次,這就是所謂的“重複的囚徒困境”,於是這就更逼真地反映了日常人際關係。這又是一個值得注意的條件,最簡單的囚徒困境模型說的是一次性博弈,正是這一點加劇了囚徒做出坦白的決心。
試驗的結果使愛克斯羅德大為吃驚,因為競賽的冠軍獲得者——多倫多大學的數學教授阿納託?拉波波特所採取的策略一點都不高深,而是非常簡單:一報還一報。也就是我們通常所說的“以其人之道,還治其人之身”。它的特點是:第一次對局採用合作的策略,以後每一步都緊緊跟隨對方上一步的策略,你上一次合作,我這一次就合作,你上一次不合作,我這一次就不合作。
為了進一步驗證第一輪遊戲得到的結論,愛克斯羅德邀請了更多的人再做一次遊戲。這時遊戲進入了第二輪。第二次愛克斯羅德徵集到了62個程式,同樣也附加上他自己的隨機程式,又進行了一次競賽。結果,第一名的仍是針鋒相對策略。
這個如此簡單的策略之所以反覆贏得競賽,是因為它奉行了針鋒相對的法則,說白了就是一報還一報,即“人不犯我,我不犯人;人若犯我,我必犯人”,但它堅持“有理、有利、有節”的尺度,並且用以下有規律可供遵循的行為將對手納入長期合作的軌道上來:
第一,善良的,即從不首先背叛;
第二,可激怒的,對於對方的背叛行為一定要報復,不能總是合作;
第三,寬容的,不能人家一次背叛,你就沒完沒了地報復,以後人家只要改為合作,你也要合作;
第四,易於察覺的,即邏輯清晰,使對手能夠很輕易地發現你採取策略的規律,並且領會你的意圖。
⊙愛克斯羅德比賽
羅伯特?愛克斯羅德1943年出生於芝加哥,曾就讀於芝加哥大學和耶魯大學,現在是密歇根大學政治學教授。
1980年,愛克斯羅德組織了一次關於囚徒困境的不同戰略的比賽。比賽包括一些簡單的戰略,如“針鋒相對”和總是犯錯誤,同時也包括一些比較複雜的戰略。他邀請了傑出的博弈理論學家制作了一些程式,透過計算機模擬的方式進行戰略之間的對抗。在其一份影響很大的報告中,他指出針鋒相對的戰略在一定範圍內是最優的,不存在一個完美的戰略優於其他的戰略。
而輸掉這個競賽的策略,總是在上述四個方面做得不夠好。比如競賽者的脾氣過於好,總是“以德報怨”,結果就被狡猾之徒反覆地佔便宜;有些競賽者不夠寬容,別人背叛一次他就不與對方再次合作,從而使合作關係永久性斷絕;還有一些競賽者太“精於算計”,總是試圖透過取巧來佔別人的便宜,這種人在與“好脾氣者”的博弈中雖然大佔便宜,但與“不寬容者”的博弈中往往搬起石頭砸自己的腳,而從最後的總分來看,他的“小聰明”總是得不償失。
歷史反覆證明了這一策略的正確性:1945年抗日戰爭勝利後,為避免內戰、爭取和平,中囯共產黨同國民黨政府在重慶進行了為期43天的和平談判,史稱“重慶談判”。談判之前,蔣介石就讓閻錫山入侵上黨地區,以此先發制人,扼守搶奪平津、獨佔華北的交通要道,保持長江與北方之間的陸上聯絡。當時國共之前的軍事摩 txt小說上傳分享
第3章 重複博弈:“一錘子買賣”與長期合作(7)
擦已經出現。8月25日,即毛澤東電覆蔣介石將親自赴重慶談判的當天,對即將返回上黨前線的劉伯承、*說說:“你們回到前方去,放手打就是了。不要擔心我在重慶的安全問題,你們打得越好,我越安全,談得越好。別的辦法是沒有的。”劉、鄧回到上黨,稍事休息,即在直屬機關幹部大會上作了上黨戰役的動員報告。指出:“我們立足於打,不放棄有利條件的談判。只有