萊茵哈德·澤爾滕：經由有界理性打磨的完美均衡

文史 09-16

萊茵哈德·澤爾滕（1930-2016）

德國經濟學家，1994年諾貝爾經濟學獎得主

經由有界理性打磨的完美均衡

文|丁利

（中山大學法學院副教授）

博弈論大廈的設計者之一、德國著名經濟學家萊茵哈德?澤爾滕（Reinhard Selten），1930年10月10日出生於德國的不萊斯勞（「二戰」後劃屬波蘭），於2016年8月23日去世，享年86歲。

1951年，澤爾滕考入法蘭克福大學數學系，十年後獲得該系博士學位。1965年，澤爾滕應邀參加在以色列舉行的國際博弈論工作會議，會議主題是哈薩尼關於不完全信息博弈理論的處理，從此，澤爾滕開始了他和哈薩尼長達20多年的合作研究。他曾到哈薩尼所在的加州伯克利分校作訪問教授，後轉到比勒菲爾德大學，1984年起在波恩大學工作。1994年，因為對非合作博弈論的策略均衡的分析方面做出傑出貢獻，澤爾滕與納什、哈薩尼同獲諾貝爾經濟學獎。

萊茵哈德·澤爾滕：經由有界理性打磨的完美均衡

約翰·納什（1928-2015），著名經濟學家、博弈論創始人、電影《美麗心靈》男主角原型

對博弈論有規範性和描述性兩種不同理解。規範性博弈論探究理想化的完全理性在策略性互動中的性質與結果，是一種指導人們應該如何決策的理論；描述性博弈論則關注對可觀察行為的解釋和預見。在規範意義上，如果一種好的解理論蘊涵的合理行為模式，被推薦給高度理性的博弈者們，那麼它不應該被自我擊敗：與博弈理論家一樣聰明的他們應該沒有積極性偏離建議，給定同樣聰明的對手或夥伴們有類似的認知和行為選擇。這個自我實施性質意味著合理的行為模式一定是納什均衡。但是，有些博弈往往有多個策略均衡。那麼，是否任何均衡所指示的行為模式在博弈的進行中都是可信的，從而能被博弈者們遵守和預見？

澤爾滕1965年發表的《一個具有需求慣性的寡頭博弈模型》已成經典，其中提出了非常有價值的「子博弈完美均衡」解概念。原則上，任何一個社會互動過程，都可以用一個展開型博弈來表示；而在展開型博弈中，一個博弈者的行動策略相當於諸葛亮的一串錦囊，給出在任何可能機會處如何行動的指示，包括那些由於先前的行動選擇而用不上的錦囊。實際上，博弈論的對策性本質，要求博弈者必須分析種種假想情形下對手的知識、信念與行動及對其的合理應對。但許多展開型博弈的某些納什均衡，恰恰在一些假想情形（所謂非均衡路徑，即按照均衡模式中先前的行動策略去做就不會出現的場合）下給出不合理的行動指示，如不可置信的威脅和承諾。所謂子博弈，大致可以理解為一個博弈局勢中能夠單獨拿出來進行分析的某個局部。一個好的納什均衡，應該在每個子博弈上所對應的行為策略也構成這個子博弈的均衡。這個解概念，某種意義上是對現實世界中常用的逆向遞推思想的完美呈現：當我們進行事前思考時，應該對理性的人們在事中和事後會如何行動有恰當的預判，據此做出自己的決策。

萊茵哈德·澤爾滕：經由有界理性打磨的完美均衡

電影《蝙蝠俠：黑暗騎士》劇照，小丑與警察的博弈

1975年，澤爾滕又發表了著名論文《關於展開型博弈中均衡點的完美概念的再考察》，提出以「顫抖手完美均衡」著稱的解概念。一個好的解理論，對我們所考察的任一個特定的博弈所給出的行動指示，應具有一定的穩健性，在受輕微擾動的環境中保持不變。現實中的人們都是有界理性的，會由於各種原因做出看似不合理的舉動，譬如，手會顫抖。我們所考察的這個特定博弈可以看作是一系列攝動博弈的近似，每個攝動博弈中，博弈者至少以一定的小概率選擇任何行動；根據納什的博弈論基本定理，每個攝動博弈都有一個納什均衡；隨著攝動博弈系列趨向於特定博弈，這些攝動博弈的納什均衡就應該收斂於這個特定的行為模式。對於那些有社會科學含義的博弈，澤爾滕證明這樣的解總是存在。

澤爾滕的這兩項工作使他榮獲諾貝爾獎，也開創了非合作博弈論中關於解理論的均衡精鍊方面蔚為大觀的研究。所謂均衡精鍊，強調把那些不合乎「自我實施」思想的納什均衡排除掉，但還是保留了多重均衡的可能性。更具雄心的均衡篩選理論則要對任何博弈都找出惟一合理的納什均衡。1988年，他與哈薩尼合作完成《博弈中均衡篩選的一般理論》，其中核心的「追蹤程序」思想，包含了攝動和進化兩種要素。

萊茵哈德·澤爾滕：經由有界理性打磨的完美均衡

澤爾滕在演講

進化博弈的核心觀念之一，是梅納德?史密斯與普萊斯所提出的進化穩定策略，即好的策略組合不僅互為最優反應（構成納什均衡），還能對有一定比例突變的混合局面構成最優應對，從而把侵入的突變和其他策略排擠出去，使這種行為模式在一個長期過程中保持穩定。這是博弈論思想在生物學特別是進化論方面的絕妙運用。澤爾滕1980、1983和1988年的三篇文章對此做了極大的拓廣。

澤爾滕廣泛的學術興趣反應了博弈論巨大範圍的應用性。他在比勒菲爾德大學主持的主要項目之一，即是「行為科學中的博弈論」，參與者包括來自世界各地的經濟學家、動物學家、數學家、政治科學家、心理學家和哲學家等，而他也完全可以被視為實驗經濟學和行為經濟學的先驅。他主編的四卷本《博弈均衡模型》各卷題目分別為：進化與博弈動力學；方法，道德與市場；策略性談判；社會與政治互動。

萊茵哈德·澤爾滕：經由有界理性打磨的完美均衡

澤爾騰

這些工作使我們有很強的理由把博弈論看作社會物理學和社會科學的基本語言。博弈論在描述性意義上的合理性，很大程度上通過進化博弈論揭示出來。如果在解釋動植物甚至病毒、細菌等的行為模式上都能成功，怎麼就不能解釋更高理性的人類行為呢？問題的關鍵，只在於你對拿什麼刀砍什麼柴的權衡。

萊茵哈德·澤爾滕：經由有界理性打磨的完美均衡

兩位老人在對弈

澤爾滕強調的方法論上的二元論使我們知道，如果你追求一個近乎完美的指導高度理性人做出行動決策的規範理論，你就很難得到一個在有界理性的現實中對每時每地的任何行為都有很強解釋力和預見性的描述理論。因為，完美理性的表現只能是有限的，甚至是惟一的，而人們基於有界理性的「顫抖」和試錯方式卻千變萬化。但是，在一個相對穩定的環境中，被有界理性打磨出的穩定行為模式，一定是高度理性的完美均衡，正如澤爾滕看似平淡的學術人生所展現的完美人性，及其對人類理解自身的不朽貢獻。

刊於《財新周刊》2016年第36期。

請您繼續閱讀更多來自 財新文化 的精彩文章:

劉蘇里：希臘是我們繞不過去的坎兒

南·戈爾丁：三十年前的朋友圈

導演楊超：《長江圖》不是散文詩，而是科幻片

教師節特選分班記

錢永健：改造GFP，「死物學」變成「生物學」

TAG:財新文化 |

您可能感興趣

※安·蘭德：理性利己主義者的道德觀
※艾倫-麥克法蘭：脫歐真是英國人的理性選擇嗎？
※馬雲和王興的仇怨，阿里巴巴對美團的決策已經超理性範圍
※理性分析！近幾年成材率、工資說明14屆新秀完勝詹姆斯、韋德、安東尼一屆！
※諾貝爾文學獎獲得者威廉·戈爾丁：一場野蠻與文明的理性鬥爭
※理性而論，杜蘭特是否能複製詹姆斯成功的軌跡？
※道德與理性的逼仄——《狗鎮》
※理性對比，詹姆斯和科比誰的季後賽統治力更強？
※《海賊王》理性分析雷神艾尼路的實力：根本沒有吹的那麼玄！
※韓水法：啟蒙和理性
※拉斯維加斯槍擊案：歐美媒體稱「民主與理性的失敗」
※《海賊王》理性分析德島山治慘敗明哥，卻有意外收穫
※非理性中的理性——德生科技
※有理有據！美球迷圖文並茂理性對比歐文和小托馬斯的優劣勢！
※駕馭狂野慾望的理性之韁：阿姆斯特丹之旅
※巴薩向庫蒂尼奧的報價被曝光，分期不合理性讓利物浦感到侮辱
※C羅回應伊斯科阿森西奧太粘球：我理解隊友勇擔當還需要更理性
※巴薩向庫蒂尼奧的報價被曝光，分期+不合理性讓利物浦感到侮辱
※張銳：有限理性乃塞勒經濟學的神來之筆