當前位置:
首頁 > 文史 > 財新薦書:大數據能把我們怎麼樣

財新薦書:大數據能把我們怎麼樣

財新薦書:大數據能把我們怎麼樣



大數據能把我們怎麼樣

人位勢越高,說話就越要小心。馬雲在最近一場論壇上說,基於大數據的發展,未來「計劃經濟將會越來越大」。這引起了一些爭議,自覺懂大數據的指責馬雲誤解了「大數據」,自覺懂經濟的指責馬雲誤解了「計劃經濟」,而自覺懂政治的指責大家都誤解了馬雲。


先正名。「data」這個詞在英文里有「作為論據的事實」這層含義,所以中文詞里有個對應的「據」字。「據」就是可以用來論證什麼東西的事實,字據、票據啥的。這個詞的翻譯其實是非常精到的。


但在口語里,這層意思薄弱甚至消失了。年底了,老闆問你要「銷售數據」,但他經常想要看的只是銷售數字而已,說起來,他更像是要number而不是data。事實上,當老闆想要銷售數據的時候,估計你至少得做個PPT,講一下各個數字之間的關係和背後的原因。你總要發現點什麼,做些解釋,否則難稱其為數據。這種解釋,又總是要歸到我們的日常經驗,才算有效。


這是數據的去脈,來龍也值得想一想。數據跟事實一樣,總得先有一些理解(對於數據,叫挖掘演算法),才能提煉出來。你看到一個事實,說男人進投票站投了薩達姆一票,這已經包含了許多背景知識,至少你已經了解了什麼叫投票,否則你看到的事實應該只是一個男人進來在一張紙片上勾勾畫畫,然後放進了一個大木箱。如果你了解更多,你掌握的事實可能是美國出兵在即,薩達姆逼百姓搞了個假選舉。聽說歐洲核子對撞機實驗一次會產生天量數據,但科學家們基本看不出太多頭緒,因為還不知道怎麼去提問,他們記下的,很多就類似於一個男人在大木箱前勾勾畫畫這樣的內容。這些,稱之為信息記錄或原始數據可能更合適。

財新薦書:大數據能把我們怎麼樣



《智能時代:大數據與智能革命重新定義未來》


吳軍 著


中信出版集團

2016年8月


吳軍博士曾任職google研究院,也擔任過騰訊的副總裁,他的《浪潮之巔》已經是IT史里的經典名著。


在本書中,他有一個重要觀點:大數據的重要性不應停留在統計、改進產品和銷售,或者提供決策支持上,而應該看到它(和摩爾定律、數學模型一起)導致了機器智能的產生。


不知道馬雲說「大數據會使計劃經濟越來越大」是指,利用掌握越來越多的經濟數據,讓一個決策中樞作出正確且比市場更有效的判斷;還是讓智能生長在大數據上,然後直接把決策權也交給它,當然,這兩者之間可能是聯繫的。前者的前景當然清晰可預見,但天花板也很明顯,一面是掌握數據和處理數據的成本會越來越高,直到經濟上不划算;另一面是混沌和複雜性,讓你永遠無法完全掌控局面。不過「越來越大」這種說法不算錯。如果計劃經濟指的是依賴機器的智能調度,整個經濟體系是按某個設定目標自動運行的,這還叫不叫經濟活動也是個問題,莫說「計劃經濟」了。


大數據的開山始祖舍恩伯格在《大數據時代》中,曾指出大數據時代需要三種思維變革:變隨機樣本為全體數據;變精確性為混雜性;變因果關係為相關關係。第一條最好理解,因為調查成本降低,計算能力飛躍嘛,以前做不了的事現在好多能做了。後兩個其實相關聯,吳軍在書中也特彆強調,智能時代會是強相關關係替代工業時代的因果關係,機器智能是不需要也領會不了人類的因果概念的,就像書里說的,「AlphaGo不知道自己在下棋,只有發明他的人知道」,它的核心計算邏輯只有概率。但是僅憑輸入一個目標,機器智能可以做好嗎?也許讓它往東100米可以,全民小康呢,幸福呢?

財新薦書:大數據能把我們怎麼樣



《上帝擲骰子嗎?混沌之新數學》


【英】伊恩·斯圖爾特 著 潘濤 譯

上海交通大學出版社


2016年5月


下棋的規則很明確,無論你如何不甘,李世石總是輸了。但是別的目標可就因人而異了,我就想要飽食終日,無所用心,得過且過,你該怎麼調整我?


科幻小說《三體》以三體問題為背景設定,三個有相互作用的質點尚不可解,何況幾十億各懷鬼胎,相互惦記著的人呢?反正把大家都算出來,再給一個最優解是不可能的。


大數據這個詞後面相伴相生的,其實是大計算能力。然而,總有一些事情,理論上就是不可計算的,這還沒說到男女那些事兒,說的還只是自然領域。


《上帝擲骰子嗎?》是混沌理論的奠基之作,已被翻譯成13種語言,此番是時隔20年之後中文再版。做純理論學科就有這個好處,隔了20年也不用擔心落伍的問題。


混沌學不是日常所說的混亂無序,也不是古文獻中指稱宇宙未辟、上下未形時的原始物質,它是在嚴密、精確的數學領域裡出現的一個新的數學客體,混沌是「完全由定律支配的無定律性態」。秩序既然可以通過自組織從無到有,再從有到無,一點也不奇怪。

財新薦書:大數據能把我們怎麼樣



《心智探奇:人類心智的起源與進化》


【美】史蒂芬?平克 著 郝耀偉 譯


浙江人民出版社


2016年3月


在龐大的數據和超強的計算能力面前,人類惟一能守住的也許就剩心智了。就大數據放棄了因果關係轉向相關關係而言,人類也許暫時不用擔心失守的事。


人是依靠意義來理解世界的,而相關關係放棄了這一點。太陽當頭照,石頭就發熱,對於相關關係,就到此為止了。對於人類,理解大概是要到輻射加熱,光波加劇分子震蕩,石頭升溫才告一段落,而周邊又有「物體的熱乃是由於他的分子運動所致」等一大片周邊知識。在相關關係的世界裡,所有的邏輯聯繫都是並列的,只有強度的區別,這麼累的思考和存儲方式,顯然只有電腦這種不差硬體的傢伙才能完成。


再進一步,我們利用大數據的方式很類似於偵探破案,總是先有一個小疑點,然後就這個疑點構築一套合理猜測,再按這個猜想的行為方式,在各個節點上去尋找證據,待證據鏈搜集齊備,案即告破。如果沒有那整套猜測,把作案時間、動機、兇器、手法等關鍵元素都嵌進去,根本不知道該從哪裡找證據。


從發現數據中的異樣,開始猜測形成邏輯,驗證,形成結論,我們認為是大數據幫我們找出了一個問題。但完成合乎邏輯的猜測和設計驗證過程這個步驟,仍然是由人完成的,無法想像一個只由相關關係哺育出來的「智能」如何完成這樣的跳躍。當然,我的無法想像很有可能只是我的計算機知識太差。


平克是當代了不起的思想家,在語言學、認知神經科學、人工智慧都很有建樹。他認為我們的心智有四項特殊能力:視覺感知、推理、情感和社會關係(其實還有語言,這在他另一本書《語言本能》中有專門論述),他試圖用自然選擇和心智計算來解釋這些能力的來源,在書里他完全是用反向工程的方式解剖人的心智,給人的心智一種完全自然主義的解釋,光這種卓越的努力本身,就值得認真閱讀。


雖然你我未必會贊同他的每一個步驟,但心智或人工智慧這樣尚未有正解又切身的話題,在與大師對話的過程里自己思索、反駁,正是樂趣所在。

財新薦書:大數據能把我們怎麼樣



《大數據和我們:如何更好地從後隱私經濟中獲益?》


【美】安德雷斯?韋思岸 著 胡小銳 李凱平 譯


中信出版集團


2016年11月


安德雷斯·韋思岸是亞馬遜的前首席科學家,此書是惟一專註於討論大數據與隱私的著作。作者的立場傾向於開放。


隱私權本身是有歷史性無疑,人類在村裡生活的時候,基本不想這個事。隱私概念是聚居到了城市之後逐漸形成的,既是陌生人,住得還近,沒點隱私怎麼行?這主要還是生活里的。紙媒誕生後,小報為了吸粉,八卦和假新聞橫行,於是名字、肖像、個人信息都得保護起來了。


但作者認為,人在互聯網裡生活,享受其便利,有些隱私就不得不放棄。你提交收入證明給銀行,為了換取貸款;你允許電商網站讀取你交易記錄,以便為你授信,這是自願交換。當然,你可以也應當要求法律嚴格限制對方對信息的使用。


事實上,如果數據的維度足夠豐富,這個完全可以構成個人的電子檔案,有幾項標準的打分,在社會中辦什麼事都用它好了。在大城市的陌生人社會,這也將是一個快速建立信任的機制,個人就像讓渡一部分政治權利給政府一樣,讓渡隱私給這個信任評價體系,會為社會降低信任成本,也就會大大降低交易成本。


可行嗎?不知道,聽上去還挺好,不過讓渡這事吧,你得先有不是。要是數據和隱私都歸那個計劃之手,也就沒讓渡這回事了。


刊於《財新周刊》2016年第47期。


請您繼續閱讀更多來自 財新文化 的精彩文章:

卡斯特羅人生謝幕
用細繩牽馭巴托克的巨象
暗戀十年桃花源
朱小棣:語中畫 域外音
劉震云:文學就是打撈被全人類忽略的那些東西

TAG:財新文化 |