今個暑假回港,應邀到八間中學分享,包括有秉承中文大學新亞書院的精神,以弘揚中華文化為己任的新亞中學 。我特意選了博弈論與儒家思想的關係為題,跟新亞中學的同學探討。
大部分朋友第一次聽說「博弈論」,都是因為看了 A Beautiful Mind 這齣電影。(可參見拙作《我與納殊教授的緣分》。)電影中有一幕,講述約翰.納殊(John Nash)在酒吧見到一個金髮女生和幾個棕髮女生,忽發奇想:如果幾個男生去追求這些女生,會發生什麼事呢?
假設有兩個男生A、B,他們在這情況下的博弈可用以下模型分析,表格裏的數字代表兩人在不同結果下的效用(utility),效用愈高就愈高興。
由於只有一個金髮女生,如果兩個男生都去追她,便會兩敗俱傷,各得零蛋。如果一個男生追求金髮,另一個追求棕髮,便會雙雙得手,而追到金髮的相對較為幸福。如果兩人都追求棕髮,會各自追到一個棕髮女生(因為有多於一個棕髮),但因為多了競爭,所以效用比上一個情況略低。
面對這個博弈,人們會怎樣行動呢?納殊發明了著名的納殊均衡(Nash equilibrium)概念:一般而言,如果在某個策略組合中,沒有人可以通過單方面改變自己的策略而得益,那麼這個策略組合就是一個納殊均衡。(詳見拙作《什麼是博弈論?》。)
鷹鴿博弈:兩個均衡的選擇
其實,上面的「追女孩」博弈是一個「鷹鴿博弈」(hawk-dove game),有兩個純策略(pure strategy)的納殊均衡,分別是A採取「鷹派」行動(追金髮),B採取「鴿派」行動,以及調轉。例如當A追金髮,B追棕髮時,如果A單方面該追棕髮(而B的策略不變),A的效用便會從10減少到4,並不划算。類似地,讀者可驗證B也沒有單方面改變策略的動機。而且,其餘兩個純策略組合(即兩人都追金髮和兩人都追棕髮)都不是納殊均衡。(其實,這個博弈還有一個混合策略(mixed strategy)納殊均衡,即兩人各有6/11的概率追金髮女孩,5/11的概率追棕髮女孩。讀者可想想為什麼這是一個納殊均衡,但這個均衡對本文後續的討論並不重要。)
在兩個純策略的納殊均衡之中,實際發生的是哪一個呢?也就是說,哪個男生會追金髮、哪個男生會追棕髮呢?這就牽涉到我在《從Schelling Point看「一國兩制」》一文中介紹的「謝林點」(Schelling point)。
諾貝爾經濟學獎得主謝林(Thomas Schelling)問學生:你明天要跟一個陌生人在紐約市見面,沒有約定地點,也無法溝通,你會在去哪裏等他?在這個協調博弈(coordination game)裏,無論在地方見到面,都可「完成任務」,效用是一樣的,所以有無限個純策略納殊均衡:只要兩人剛好選了同一個地方就可以了。
然而,謝林發現大部分學生都說會到中央車站等那陌生人,因為這是一個特別明顯、突出的地點,雙方都推測對方會到中央車站嘗試碰頭,因而選擇這點作為協調的目標。
再舉一個例子:假設你和一個陌生人在以下這些數字中選出一個,不得互相溝通,兩人恰好選中同一個數字便有獎。你會選哪個數字呢?
–3.29, 5.98, 0, 1.95, –2.72, –4.36
多數人會選0,原因也可用謝林點解釋。你知道為什麼嗎?
問題是,在「追女孩」的博弈裏,兩個男生的角色似乎剛好對稱,故兩個純策略納殊均衡沒有一個是特別明顯、突出。他們怎麼知道應該實現哪個均衡呢?這是無法單靠數學來判斷的,而是要靠生活來判斷。正如馮.諾伊曼(John von Neumann)所說:「若人們不相信數學簡單,只因未意識到生活之複雜。」我們稍後會回到這點。
囚徒困境:合作共贏的挑戰
現在,我們看看另一個著名的二人博弈:「囚徒困境」(prisoner’s dilemma):兩名罪犯C、D落網,並被分開單獨審訊。如果兩人都招供,將各入獄8年。如果一人招供而另一人保持沉默,招供者將即時獲釋,而沉默者將被囚10年。如果兩人都堅不吐實,那麼便只需各入獄2年。如下表:
我在《囚徒困境的啓示》一文中對這個博弈作了詳細分析。簡單來說,無論對方做什麼,每個人的最佳應對策略都是招供。兩人都招供是這個博弈我的唯一納殊均衡。然而,在這個均衡下,兩人都入獄8年,遠遜於兩人都「合作」沉默的結果──各入獄2年──但後者卻不是納殊均衡!怎樣跳出這個困境,讓兩人都選擇合作,實現「雙贏」,是個非常活躍的研究範疇,也是人類社會自古以來的關鍵難題。
好了,說了那麼多,跟儒家思想又有什麼關係呢?
儒家規範:兩階段的激勵機制
其實,儒家的社會秩序,可以看成一個兩階段的博弈。這個模型不是從我的腦袋蹦出來的,而是參考了張維迎、艾智仁(Armen A. Alchian)等人的著作。如下圖:
人類社會的很多互動都需要互信、合作,相當於囚徒困境(「不合作」對應囚徒招供,出賣同伴;「合作」對應囚徒保持沉默,尋求雙贏)。另一方面,我們每天也遇到很多需要禮讓的情況,相當於鷹鴿博弈。取個最微觀的例子,兩個人同時走到一道門前面,如果兩人都選擇先走便會撞破頭,一人先走一人後走就能順利通過,兩人都後走則費時失事。(這裏,「先走」對應追女孩例子裏的「追金髮」,「後走」對應「追棕髮」。)當然,更宏觀的「禮讓」的基本邏輯也雷同。
儒家社會規範的精妙之處,在於用人們在第一階段囚徒困境中的表現,判斷其道德地位,製造出不對稱性(asymmetry),從而決定人們在第二階段的鷹鴿博弈中選擇哪個納殊均衡。孔子認為,君子應該「喻於義」,而非「喻於利」;「成人之美」,而非「成人之惡」,這對應着囚徒困境裏的合作行為。後來荀子提出「德必稱位」、「論德而定次」,則說明了君子的道德地位是禮法秩序的決定性因素。
具體來說,如果人們在第一階段的囚徒困境中選擇合作,便會被奉為君子,選擇不合作則會被視為庶人。在第二階段的鷹鴿博弈中,如果是一個君子碰着一個庶人,則在兩個納殊均衡(誰先走,誰後走)之中,較明顯的「謝林點」是君子先走,庶人後走。於是君子會在第二階段獲得較佳的結果,這又反過來鼓勵人們在第一階段選擇合作,以期在第二階段享有君子的好報。如此,人們在第一階段便有望擺脫囚徒困境兩敗俱傷的納殊均衡,轉而合作共贏了。
值得注意的是,雖然上述模型包含了一個等級制度,把人們分為「上級」的君子和「上級」的庶人,在第二階段有不同待遇,但決定每個人地位的因素終歸是他們在第一階段中的行為。只要在第一階段選擇做一個捨利取義的合作者,便可成為受人尊敬的君子。每個人都有晉身「上級」的機會,這大概就是孟子所說的「人人皆可為堯舜」吧!
(圖片:作者提供)