每一步都是博弈，「世界」和「我們」並不是平等的對手

知識 03-06

從經濟學角度來看，「走一步看一步」是一個好建議嗎？

阿虎，資深多動症愛好者

我認為這個問題實際上涉及到個人認知能力與未來可預測性之間的關係，目前在決策理論中討論的非常多（不知道是我被自己洗腦了還是這個問題確實太重要了）。我嘗試簡單介紹一點點。

與「相機抉擇」（走一步看一步）對立的觀點暫且稱為「一以貫之」。我的觀點是，二者的優劣取決於你在大世界還是小世界。下面我將嘗試解釋我的觀點。

Savage 提出過一對概念「小世界」和「大世界」。在小世界中，我們可以提前列出所有的可能性並且基於此進行計劃，因此在小世界中，人們三思而後行（look before you leap）。一個小世界的例子就是打撲克，你可以窮盡所有的牌型，並且大概知道每種牌型出現的概率，因此可以進行計算和計劃。相反，在大世界中，我們可以列出很多未來的可能性但是我們無法保證自己是否窮盡的全部的可能，因為我們不知道是否還有超出我們的理解和想像的事物存在。大世界的例子在現實中數不勝數，高考、考研、談戀愛甚至職業選擇。在做決策時我們可以列出很多可能，但是我們不敢保證我們沒有忽視什麼，而且事實常常證明事情總是不按照我們想像中任何一種可能發展。所以 Savage 說，在大世界中，我們遇山開路遇水搭橋（Cross that bridge when you come to it）。

感謝陳茁給出了 Savage 的主觀期望效用理論，不過 Savage 一再強調他的模型只是適用於小世界。顯然，當你無法窮盡世界的無限可能時，你為每件可能所賦予的概率值都顯得不那麼靠譜。還有一點是，Savage 的模型是一個 as-if 邏輯，即是說如果你的選擇符合 7 條公理，那麼你就仿似再做一個期望效用最大化。此邏輯並沒有告訴你是否真的存在這麼一個輔助選擇的主觀概率，只是告訴研究者，無論這個人怎麼想，我們都用這樣一個方法可以刻畫他的選擇行為。因此它是工具，而非指導。或者，它是一個實證（positive）模型而非規範（normative）模型。

According to the Bayesian paradigm, as new discoveries are made and new information becomes available, the universe shrinks: with the arrival of new information, events replace the prior universal state space to become the posterior state space, or universe of discourse. This process of "destruction" reflects the impossibility, in the Bayesian framework, of expanding the state space and of updating the probabilities of null events, coupled with the fact that conditioning on new information renders null events that, a priori, were nonnull. Yet, experience and intuition alike contradict this view of the world. Becoming accustomed to possibilities that were once inconceivable is part of history and our own life experience. There is a sense, therefore, in which our universe expands as we become aware of new opportunities.

從這個角度來回看，Bayesian 主義所考慮的無知並不是真正的無知，而是小世界下的「不確知」：決策者知道全部可能但是不知道真實世界是哪一個。與之相對的是大世界下的無知，決策者既不知道真實世界是哪個，甚至不知道世界有多大。學術一點，因此我們要學習和更新的不僅僅是狀態空間上的分布（distribution on state space），更是狀態空間本身（state space per se）。更困難的是，兩個過程是同時進行的。據我所知，經濟學中，尤其是決策理論中在討論大世界下的學習理論的僅有 ambiguity 和 unawareness 兩個領域。

寫到這裡，實際上應該進一步談談經濟學理論是如何紮根於小世界理論以及這樣可能會有哪些偏差。不過，我想這個問題寫起來難免啰嗦，所以不妨留給大家。

現在，回到最初的問題，相機抉擇還是一以貫之？我認為答案是取決與決策問題更接近與大世界還是小世界。很多事情別人已經用經驗驗證了無數遍，我們可以幾乎將其看成一個小世界時，利用現有經驗找到最適合你的計劃然後一以貫之。這個例子實在是太多了，比如考試後才發現當初應該按計劃複習。但是也有很多事情沒有太多先例，比如科研，只能一邊做一邊思考一邊調整計劃。

如何在實際中區分大世界和小世界？這個問題我想沒有統一的答案，因為每個領域科學的進展都不相同。因此，我認為這是一個思考的起點，而非終點。

司馬懿，《穿越歷史聊經濟》作者

這個問題其實不一定要看作博弈，因為「世界」和「我」不是對等的對手。世界並不會有意識的和個人博弈——我承認確實有一些模型，我們可以把自然引入進來，給自然賦予一個屬性，比如總是在最小化風險之類，然後讓人和自然進行博弈求均衡。

但是就題主這個問題來說，看作動態規劃和看作動態博弈是等價的，因為自然的反應是可以預期的，並且我們不需要在乎「自然」的效用，我們只在乎自己的效用，那麼還是等價於你選擇一個行動，然後每個行動產生一個效用，你試圖在最大化總效用。

假如你認為人生只會進步，不會退步，區別只是進步大一點和小一點的話，那麼走一步，看一步是和預先老謀深算的盤算一番是一樣的，在這種情況下，人生就是一個帶正權重的有向無環圖，從出生到死亡。

每一步都是博弈，「世界」和「我們」並不是平等的對手

從出生開始，我們只需要看看我們周圍可以做的選擇，選效用最高的那一個，到了下一個目的地之後環顧四周，發現新的選擇，也發現新的可以達到目標的方法，然後看看周圍的選擇是不是比現在的好，如果是的話，就跳過去，如此反覆，可以保證我們選擇的是一條整體效用最高的路徑，這就是戴克斯特拉演算法。

這個演算法最大的特點就是可以走一步看一步，每一步都選擇最優的，最後必然能得出一個全局最優，他發明了一個術語叫做「鬆弛」，每一回合，通過自己新發現的路徑來檢測自己之前做的選擇是不是最優的，如果是的話，就保持不變，如果不是，就修正為新的路徑。

但是戴克斯特拉演算法有個最大的假設，就是沒有負效用的道路，這是不是符合人生的現實呢？看標準怎麼定義了，有人認為只要是經歷，都是財富，有人認為自己繞彎路回到了原點，那就是完全的浪費。

如果你認為人生是可能有死循環的，有負效用的，戴克斯特拉方法就失效了。這個時候就要採用貝爾曼 -- 福特演算法來找出最優路徑。

每一步都是博弈，「世界」和「我們」並不是平等的對手

很遺憾，在這種情況下，走一步看一步就無法保證最優解了。必須要打開上帝視角，預先對路徑上的每一條邊都進行鬆弛操作，反覆多次之後，每一個點所對應的最短距離都慢慢的變成了「正確」的最短距離，於是我們真正需要找的那個最短距離也就慢慢的浮現出來了。

所以啊，不同的人生態度對應不同的演算法，豁達一點的呢，認為人生就是風景，有進無退，那麼就直接戴克斯特拉演算法，走一步算一步，人生就已經是最完美的，無需過多的算計；但是如果你認為人生是充滿陷阱、機遇和挑戰的，存在著死循環和坑，那麼最好還是多盤算盤算，走一步看一步，沒準哪天就走到一個周圍全是負向量的「坑」裡面，多盤算盤算才能獲得更高的效用。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 知乎日報 的精彩文章:

※生孩子會影響女性收入嗎？來自丹麥的證據
※把一個小便池放在美術館裡，怎麼就變成「藝術」了？
※「我就是我，你不舒服是你的事，氣死你活該」
※用「跟我出去走走就好了」關心抑鬱患者，錯在哪兒了？
※《罪夜之奔》講的故事很強，塑造的人物更強

TAG:知乎日報 |

您可能感興趣

※一方是囂張領導，一方是難纏對手，三角博弈如何一家獨贏？張作霖是這麼乾的
※最好的愛情，就是一場博弈
※美國不會動手朝鮮也翻不了天，中美博弈才是終極對決！
※在戀愛這場博弈中，你為什麼總是被動的？
※印度屢對北京示好有何目的？真正的博弈竟在這一領域
※金一南少將：大國博弈手中須有棋子，光搞好關係對方不會放我一馬
※人和牛之間的較量，也同時是自殺的博弈，究竟誰輸誰贏
※現實生活中都是偽裝，在職場里你要找到你的博弈對象是誰
※愛情就是情緒的博弈誰讓對方付出的情緒多誰就佔據了主動地位
※皇帝下令殺樊噲，是權術的巔峰，而保他不死的，是官場博弈的高潮
※所謂愛情，不過是一場心理博弈
※這是金毛和撿屎官博弈的故事，也是一個無比悲傷的故事
※魔獸這些年，聯盟與部落間的博弈從未停止過，這究竟意味著什麼？
※高通VS蘋果——是蘋果的傲慢，還是利益的博弈？
※「這個世界本來就是零和博弈」
※這很LOL：這是一場高手之間的博弈
※解放軍少將：大國博弈如果一味退縮，帶來的絕不是和平而是災難！
※老闆與員工，不應該是對弈和博弈的關係！
※機器和人類的博弈，從來就不是零和遊戲