淘氣提示您:看後求收藏(奇妙書庫www.qmshu.tw),接著再看更方便。
卻看見已經有個人端端正正地坐在正屋前東邊的長廊裡等候了,他走上前去舉燈一照,原來那個人是玉戭生。
這則頗具意味的故事出自明代學者宋濂的《宋文獻公全集》。宋濂在作品中評論道:“二人貧賤時,他們的盟誓是真誠良好的,等到當了官走上仕途,便立即改變了當初的志向,為什麼呢?是利害關係在心中鬥爭,地位權勢使他們在外部感到恐懼的緣故。”或許我們要問,地位和權勢是怎樣使他們感到恐懼的?或許博弈論中的“囚徒困境”理論可以給出合乎情理的解答。
1950年的一天,美國斯坦福大學客座教授、普林斯頓大學數學系主任阿爾伯特?塔克給一些心理學家做講演,為了避免使用繁雜的數學手段而能更加形象地說明博弈的過程,他提出了囚徒困境的理論模型。
塔克以下面這則小故事作為開始:
鮑勃和埃爾兩個竊賊在偷盜地點附近被警察抓獲,分別關押。每個竊賊必須選擇是否供認並指證同夥。如果二人都不供認,將被指控非法攜帶武器,入獄1年。如果二人都供認並指證同夥,將入獄10年。如果一人供認,一人不供認,則鑑於供認者與警方合作的表現,無罪釋放,其同夥將遭到嚴懲,判入獄20年。
第2章 囚徒困境:傻作精時精亦傻,輸為贏處贏還輸(2)
我們用收益矩陣分析囚徒困境的情況(如下表):
埃爾
供認 不供認
鮑伯 供認 10年,10年 0年,20年
不供認 20年,0年 1年,1年
收益矩陣可以這樣解釋:囚犯的戰略是供認或不供認,每個囚犯選擇其中一種戰略。豎列代表埃爾的戰略,橫行代表鮑勃的戰略。矩陣中的每組數字是兩個囚犯選擇不同戰略得到的相應結果,逗號左邊的數字為鮑勃的收益,右邊數字為埃爾的收益。以第一列為例,若兩囚犯都認罪,都被判入獄10年;若埃爾認罪,鮑勃不認罪,鮑勃入獄20年,埃爾獲釋。
那麼,到底應該如何解決這一博弈問題呢?如果二人都想入獄時間最短,什麼樣的戰略才是理性的呢?埃爾可能作如下思考:“有兩種可能性會發生:鮑勃認罪或保持沉默。假定鮑勃認罪,則我不認罪將入獄20年,認罪將入獄10年,所以該情況下最佳的選擇是認罪。相反,假定鮑勃不認罪,則我不認罪將入獄1年,認罪將獲得自由,認罪還是最佳選擇。總之,我應該認罪。”
⊙托馬斯?謝林的博弈收益矩陣
托馬斯?謝林教授對博弈論的重大貢獻之一就是首先用矩陣形式的表格表示兩個參與者的博弈所得。謝林教授曾經說過:“假如真有人問我有沒有對博弈論做出一點貢獻,我會回答有的。若問是什麼,我會說我發明了一個矩陣反映雙方得失的做法……我不認為這個發明可以申請專利,所以我免費贈送,不過除了我的學生,幾乎沒有人願意利用這個便利。現在,我也供給各位免費使用我發明的矩陣。”
上文中我們所用的用來表示囚徒困境的矩陣,就是謝林教授“免費”提供給我們的。
同樣,鮑勃也將按照相同的思維確定自己的行為選擇,其結果是兩人都認罪,被判入獄10年。然而,如果二人非理性行事,保持沉默,每人只會入獄1年。
由此可見,對於鮑伯來說,無論埃爾採取什麼策略,他坦白總是對自己有利的,兩相比較,坦白是他的優勢策略;對於埃爾同樣如此。因此,在這個博弈中,坦白是雙方的優勢策略,那麼,抵賴就是劣勢策略。
實際上,囚徒困境正是個人理性衝突與集體理性衝突的經典情形。正因為在囚徒困境中,每個人都根據自己的利益做出決策,但最後的結果卻是誰也撈不到好處。這種情形在生活中也會遇到,比如排隊購物時,如果大家都在排隊而只有一個人擠上前去插隊,他將得到好處;可是如果大家都蜂擁而上,將會出現混亂無序的局面,此時你只能跟著大家一起擠才有可能儘快買到你想要的東西,否則你將成為最後一個——也是最吃虧的一個。
學習了囚徒困境理論,我們在回過頭來看一下本文開頭的小故事,相信會有豁然開朗的感覺。首先,趙盾的權勢對玉戭生與三烏從臣而言是不可忽視的外在資源,趙盾是否賞識,將決定他們的仕途是否順利。這種情形之下,巴結趙盾與不巴結趙盾的選擇,就與二人的現實利益息息相關。對於二人而言,無論對方是否選擇巴結,自己只有選擇巴結才有可能升官。
因此我們不能說趨炎附勢是性格軟弱而導致的慣性