當前位置:
首頁 > 最新 > 大數據預測為什麼是烏托邦

大數據預測為什麼是烏托邦

在本文的討論之前,先來回顧一下拉普拉斯的決定論。

拉普拉斯的原話是這樣的:

「我們應當把宇宙的現狀看作它先前狀態的結果以及它的後繼狀態的原因。假定在某一時刻,有一種智慧能夠把握自然界所有的力以及組成自然界的一切事物的特定狀況——這種智慧博大精深足以對所掌握的資料進行分析——那麼,它就將宇宙間從最龐大的物體到最微小的原子的運動全都囊括於同樣的公式之中,對於它來說,沒有什麼是不確定的,未來,一如過去,都出現在它的眼前。」

拉普拉斯決定論的確立可以說是「笛卡兒分割」的必然結果。「笛卡爾哲學在關於物質界的全部理論上,是嚴格的決定論。活的有機體完全和死物一樣受物理定律支配;不再像亞里士多德哲學,需要有『隱德來希』(entelechy)或靈魂來解釋有機體的生長和動物的運動。」

拉普拉斯決定論的影響是極其深遠的。它意味著,未來在終級的意義上是可以預測的。

在這樣的決定論範式下,諸如「世界是物質的,物質是運動的,運動是有規律的,規律是可以認識的」之類的教條是成立的。因此如果存在一個超智慧的領袖,他能認識到規律並能「看」到人類的終極目標,那麼我們就可以由他來「頂層設計」人類社會的制度和道路,以快速實現那個終極目標。

然而,在這樣一種決定論範式指導下的實踐給二十世紀的世界帶來了災難性的後果。

痛定思痛,一部分放棄了「自上而下」(top-down)的決定論範式。而另一部人則依然痴心不改,他們把失敗的原因歸結為僅僅是因為那些「領袖們」的失誤。他們認為,如果隨著科學技術的發展能夠發明一種機器,它的智慧「博大精深足以對所掌握的資料進行分析」,那麼拉普拉斯所預言的「未來,一如過去,都出現在它的眼前」就是可能的。

現在,中國出了一個馬雲,他認為這樣的一種「機器」已經出現了,這就是基於大數據云計算等技術的人工智慧。馬雲認為,大數據時代的出現讓人類進入了萬物互聯的時代,取得對數據進行重新處理的能力也遠遠超過過去,對世界的認識將會提升到一個新的高度,大數據讓預判和計劃都成為了可能。因此,我們需要對計劃經濟和市場經濟進行重新定義,市場經濟不一定會比計劃經濟更好。

百足之蟲死而不僵,舊的思維範式總是會尋找機會「借屍還魂」的。

為了對馬雲的觀點有一個清醒的認識,我們還是從大數據談起。

何謂大數據?我個人曾經下過一個定義:所謂大數據,就是關於人的行為的一切數據。

在大數據分析的視野里,所有的數據就像道路上的腳印,雖然看上去很雜亂,但卻是「有跡可循」的。

靜態地看,大數據分析中的數據不是混合的(mixed),而是聚塊的(assorted):混雜的表面下隱藏著精細的結構。

動態地看,數據的「前後相隨」形成了「足跡」,大數據分析技術可以幫助我們辨識出無數不同的足跡,但是這些足跡不是相互獨立的而是相互影響相互關聯的,有些足跡會「殊途同歸」,而有些足跡則會「分道揚鑣」。

接下來的問題是,哪些足跡會「殊途同歸」,哪些足跡會「分道揚鑣」?

大數據的複雜性就在於這些足跡之間會發生意想不到的相互作用。大數據的「大」,不在於數據的多少,而在於相互作用,其背後折射出的則是人類行為互動中所呈現出的複雜性。所以「大數據」用更加學術化的術語來說,應該是「複雜的數據」。

既然說到「足跡」,那就來說一說與此相關的一個字,即「道」。道由「首」和「走」兩部分構成。這裡的「首」指的是「人腦」。這就意味著,道是人行走而形成的路。

因為人是社會化的動物,所以如果將大數據類比於「足跡」,那麼這些足跡之間就存在著相互作用。

相互作用,這是理解複雜性的關鍵!

十多年前的一天,正在杭州做學術訪問的范老師突然問我一個問題:「小慶啊,老子說的『三生萬物』的『三』到底指的是什麼?」記得我當時從「天下萬物生於有,有生於無」開始,強調這裡的「三」絕對不能用實體主義來解釋,因為這裡的「三」實際上是在「二」出現後而自然而然產生的相對相關性以及隨之展開的相互作用,即「三」既意味著「關係」(陰)也意味著「作用」(陽),所以「三生萬物」也可以說成「相互作用生萬物」,而這正是「一陰一陽之謂道」這七個字或者「有無相生」這四個字所想要告訴我們的。

市場經濟「看不見的手」正是行為主體之間周流不息無所不在的相互關係和相互作用,也正是老子「有生於無」的「無」。大數據只是行為主體所產生的「足跡」,是行為的結果,而不是行為之間的關係更不是相互作用的過程。大數據分析技術如同其他學科的分析工具一樣,有助於我們理解並推測行為主體之間的相互關係和相互作用,但並不能讓我們準確無誤地捕捉到它們。

自從博弈論誕生以來,人們的行為互動就有了一個很好的分析工具,並誕生了諸多的均衡概念。然而,即使是像三策略的鎚子剪刀布這樣的博弈,在演化的過程仍然會出現具有吸引性的異宿環,而它揭示了一類不同於混沌現象的確定性系統的不可預測性(Nowak,2006)。

說到確定性系統的不可預測性,就說到了混沌現象。

在確定性的系統中發現混沌,改變了人們過去一直認為宇宙是一個可以預測的系統的看法。用決定論的方程,找不到穩定的模式,得到的卻是隨機的結果,這徹底打破了拉普拉斯決定論的幻想。

混沌現象肇始於上世紀初數學家龐加萊提出的三體問題,這是天體力學中的基本力學模型。它是指三個質量、初始位置和初始速度都是任意的可視為質點的天體,在相互之間萬有引力的作用下的運動規律問題。

龐加萊最後證明了,這是一個混沌系統,任何微小的擾動都會造成不可預期的效果。

混沌系統的本質在於相互作用的非線性本質。

回到大數據。

假設行為主體是同質的完全理性的個體,因此可以將其視為物理學中的質點(因為質點和完全理性的個體的反應模式是一樣的,都是刺激-反應模式),於是,根據龐加萊所揭示的,即使是三人的互動也會產生非線性的混沌系統,更不用說無數個體的互動了。

混沌系統對初始條件是高度依賴的。

數據是人們行為留下的痕迹。不管我們的測量有多麼精確,這些數據都是對人的行為的一個近似記錄,它不可能是行為本身,更不可能通過數據能精確窺知行為主體的認知結構、偏好等主觀因素。即使技術發達到能夠讓我們對這些主觀因素做出足夠精確的估計,但畢竟也是近似值。混沌動力學告訴我們,不管初始條件多麼精確,只要是近似的,對於未來的預測就毫無價值。三體問題尚且會出現混沌現象,更不用無數個體互動的結果了。這就意味著,再詳盡的數據記錄對於我們預測無數行為主體之間互動的長期結果都是毫無價值的。

更加令人悲觀的是,行為主體不是完全理性的,他的偏好不是外生的給定的一致的穩定不變的,而是內生於相互作用的過程中。也就是說,人是「情境理性」的。

情境是在社會交往的過程中開顯的,它們只能被參與社會交往的主體所感受到,所以由此所形成的偏好是內生於社會交往過程的,並且會隨著社會交往的過程中不斷開顯的情境而演化。

即使是通過對單個行為主體的追蹤,我們運用大數據技術成功捕捉到了他過去直到現在的運行「軌跡」,我們也沒有辦法去預測其未來的軌跡。這是因為,我們無法預知什麼時候他的偏好會隨著不斷開顯的情境而發生改變甚至逆轉。

新古典經濟學的很多問題都可以歸結為求條件極值的數學問題。如果條件不變,目標函數不變,那麼只要最大值存在,所需要的就只是演算法。演算法有好有壞,好的演算法收斂的速度快,而壞的演算法收斂的速度慢甚至不收斂。大數據不過是提供了更多的信息,從某種角度上說不過是讓約束條件變得不同,從而縮小了最大值可能的存在範圍,進而可以加快收斂的速度而已。

然而,偏好是情境依賴的,這意味著目標函數是不斷在變化的。於是,求解經常變得不可能。

另外,實證研究表明,包括動物在內的行為主體都有「關鍵性的一大跳」這一適應性的行為。例如,動物在覓食的過程中,先是在局部區域做布朗運動式的隨機遊動,然後突然間長距離的遷徙。

不僅僅是個體會有「關鍵性的一大跳」,作為無數個體相互作用形成的宏觀現象也會有「關鍵性的一大跳」。例如,無數投資者同向交易的結果會造成股指單方面的暴跌或暴漲。

這「關鍵性的一大跳」使得傳統的統計學正態範式失效了,取而代之的是以冪律分布為代表的重尾範式——隨機變數的取值失去了控制而變成了「標度自由」(scale-free)。

有效市場理論所涉及到的隨機因素都是與正態分布有關,如布朗運動、白雜訊等,因而是可以控制的。而經濟物理學家的實證表明,實際上是與重尾分布有關,如列維飛行(Levy-Flight)等,因而常常會失去控制。

大數據分析表明,在自然界和人類社會中,絕大多數現象都是標度自由的。在統計學中,與正態變數不同,標度自由的隨機變數是不可預測的。

理性的行為是一致的,而非理性的行為是五花八門的。大數據本身可能就是人們非理性行為的產物,不知道這麼說能不能夠讓你對大數據的膜拜有所減弱。

想說的話很多,暫時寫到這裡。

簡而言之,大數據分析技術可以幫助我們理解市場,但是在終極的意義上並不能讓我們預測甚至控制市場,這就像我們可以建立方程但不一定能夠求解一樣。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 天竺居士 的精彩文章:

TAG:天竺居士 |