當前位置:
首頁 > 最新 > 馮勝平:從博弈論角度看中美貿易衝突

馮勝平:從博弈論角度看中美貿易衝突

??

導語:合作還是背叛,是囚徒的困境,也是中美面臨的困境。雖然合作符合雙方的最大利益,但理性的計算和人類自私天性會使他們選擇背叛。囚徒困境清楚地證明:在非零和博弈中,聰明就是愚蠢,帕累托最優和納什均衡格格不入。

作者馮勝平,旅美獨立學人。

中美貿易戰開始,它的結局取決於雙方的博弈。最好的選擇,是雙方都採取針鋒相對策略,與人為善,合作共贏;最壞的選擇,是雙方都認定對手是魔鬼,最後心想事成,對手真的變成了魔鬼。

囚徒困境(Prisoner"s Dilemma)

??囚徒困境是博弈論中非零和博弈的一個經典案例,反映了個人最佳選擇並非團體最佳選擇。這是一個以損人開始,以害己告終,最後納什均衡僅落在非合作點上的博弈模型。荒唐,但不乏理性;計算,卻錯的離譜。用它來解讀中美之間正在發生的事情,有方法論上的指導意義。

??囚徒困境是1950年美國蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)提出的一個理論,後來由艾伯特·塔克(Albert Tucker)以囚徒方式闡述,命名為「囚徒困境」。它講的是兩個嫌疑犯作案後被捕,分別關在不同的屋子裡接受審訊。警察告訴他們,如果兩人沉默,由於缺乏證據,每人坐牢一年;若一人揭發,另一人沉默,揭發者立即獲釋,沉默者入獄十年;若互相揭發,兩人都判刑八年。於是,每個囚徒都面臨兩種選擇:合作或背叛。然而,不管同夥選擇什麼,每個囚徒的最優選擇都是背叛:如果同夥合作、自己背叛放出去,合作則判刑一年,背叛比合作好;雙方背叛各判八年,比自己合作、同夥背叛坐牢十年,背叛還是比合作好。結果,兩個嫌疑犯都會選擇背叛,各判刑八年。

??明明合作對兩人最有利,卻偏偏要選擇背叛——這樣做不是因為愚蠢,而恰恰是由於聰明——這就是「困境」所在。囚徒困境顯示,個人的理性常常導致集體的非理性,用紅樓夢中曹雪芹的話說,機關算盡太聰明,反誤了卿卿性命。

??合作還是背叛,是囚徒的困境,也是中美面臨的困境。雖然合作符合雙方的最大利益,但理性的計算和人類自私天性會使他們選擇背叛。囚徒困境清楚地證明:在非零和博弈中,聰明就是愚蠢,帕累托最優和納什均衡格格不入。

針鋒相對(Tit for Tat)

幾千年來,囚徒困境一直無解,直到一個簡單假設的出現。

??上世紀八十年代初,羅伯特·阿克塞爾羅德在《合作的進化》一書中,探索了經典囚徒困境情景的一個擴展,並把它稱作「重複的囚徒困境」。他假設,人際行為不是一次性,而是連續性的:故事中的囚徒八年後出獄,再次聯手作案,又被警察抓住並分別審訊。昨天的教訓記憶猶新,兩位囚徒會不會長點記心,做出與上次不同的選擇?阿克塞爾羅德發現,經過多輪重複博弈,囚徒背叛的傾向會被合作的動機所取代,通過自然選擇,一種利他的行為機制可能從最初純粹利己的考慮進化而來。

??為驗證他的假設,阿克塞爾羅德邀請全世界的學術同行設計計算機策略,採用巡迴賽的方式進行比賽,賽題是反覆出現的囚徒困境。參賽者只有兩種選擇,合作或者背叛。比賽最初設計為200輪,選手必須根據自己的判斷,反覆地在合作與背叛之間做出選擇。這是一場類似NBA球賽的比賽,總積分最高者獲勝。記分標準是:雙方合作,各得三分;雙方背叛,各得一分;一方背叛,一方合作,背叛者五分,合作者零分。

??在第一次參賽的15個程序中,最後勝出的是多倫多大學俄裔心理學家兼博弈論專家阿納托爾·拉波波特(Anatol Rapoport)教授的針鋒相對策略。它是所有參賽程序中最簡單的一個,只有四行BASIC語言。針鋒相對永遠以合作開始,然後一報還一報,「克隆」對手上一步的策略。

??第二次比賽有來自6個國家的63名選手參加。作為挑戰者,他們都研究過針鋒相對程序,精心設計了各種破解方案。如同打仗知道敵方的計劃,賭博知道莊家的底牌,挑戰者似乎穩操勝券。

??奇蹟發生,針鋒相對再次獲勝。如果說第一次針鋒相對打的是暗牌——沒人知道它的內容,第二次則是明牌。在提交第二次比賽的程序中,拉波波特教授沒有改一個字。最令人嘆服的是,63次與對手較量,針鋒相對沒有贏過一次,卻總積分領先,成為最大的贏家。

??一個誰也打不過的人,成了一個誰也打不過的人。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 連起開講 的精彩文章:

TAG:連起開講 |