當前位置:
首頁 > 最新 > 馬云:數據將成為能源,離開數據的創新都是瞎話

馬云:數據將成為能源,離開數據的創新都是瞎話

·文 | 阿貓&終極演算法·

今天推薦一本書叫做《終極演算法》,看這本書是為了解一些關於人工智慧的信息,這也是所有科技公司都在力爭的一塊終極領域,未來的發展趨勢。

馬雲說:「這個時代數據將成為主要能源,如果離開了數據,任何組織的創新都是一種瞎話。如果沒有數據,如果沒有對未來做準備,我覺得災難會非常之大。」

熱門的抖音、知乎、微博等,都是利用這些數據「演算法」來推送你最喜愛的內容和廣告。你搜索過籃球,他就會推送運動相關的信息,你分享過萌寵視頻,他就會推送可愛的視頻給你,你點贊過美女,他就會推送更多美女給你。掌握了越多人的數據幾乎無往不勝,就連最近的臉書數據醜聞都懷疑特朗普是利用了這些數據操控了選民。

零售商也會用到數據分析,他會用數據分析來決定供應。沃爾瑪是在該領域的先驅,他們早期發現就是,如果你買紙尿片很可能也會買啤酒。為什麼?對此解釋的說法之一是,媽媽讓爸爸去超市買紙尿片,出於情感補償,爸爸買了一箱啤酒。

知道了這一點後,沃爾瑪會把啤酒放在紙尿片的旁邊,這樣啤酒就會賣的更好。「啤酒和紙尿片」的規則已經在數據挖掘領域取得傳奇式的地位。

數據分析其實是歸納問題,用以前的經驗形成一個系統的數據去預測將來發生的事情。書中舉了約女孩出去的例子,假設前三次成功約女孩都是天氣暖和的時候,一次失敗是天氣冷的時候,我們可以歸納出在天氣暖和的時候約女孩就會成功。這也是所謂的「數據分析」,當然這些結果不是決定性的,我們只能推斷出發生的可能性有多大。

演算法:

演算法在我們生活無處不在,小至可以用來識別垃圾郵件,大至未來的自動駕駛汽車,都需要用到演算法來引導。

合取概念(conjunctive concept):

很多事情都不是單個因素來決定的,就像之前約女孩的例子,並不是天氣好一個因素決定,可能還有時間、約會方式、地點等等),假設我們考慮了全部因素,就能準確預測女孩的回答,這就是合取概念。

字典對詞語的定義也是合區概念,椅子有靠背、若干條腿等,任意一個特徵去掉都不能再稱之為椅子。

《安娜卡列尼娜》開篇時說的:「所有幸福的家庭都是相似的,每個不幸的家庭各有各的不幸。」對於個人來說,也是這樣的。為了感到幸福,你需要健康、愛、朋友、錢、你喜歡的工作等。把這些東西的任意一個拿走,痛苦都會隨之而來。

數據分析雖然非常牛逼,但也會有他的問題的存在。最中心的問題之一是過擬合,過擬合是指對比於可獲取的數據總量來說,一個荒謬的模型只要足夠複雜,是可以完美地適應數據。

人類也會有過擬合的現象,而且是我們的萬惡之源。一個小女孩可能會在商場里看到一個菲律賓人就脫口喊出:「看,媽媽,那是我們的小女傭。」小女孩並非有問題,而是因為在他短暫的人生閱歷里,她對見過的僅僅幾個菲律賓人進行了籠統的概括。

我們的信仰建立在自己的經歷之上,這會讓我們對世界的理解不完整而得出錯誤的結論。即便你很聰明,學識淵博,也無法免受過擬合的影響。

越年輕的人也越容易犯過擬合的錯誤,閱歷和經驗只能隨著年齡慢慢增長,而大量閱讀就是快速提升我們減少犯過擬合錯誤的方式之一。相反,看太多個例的電視劇和互聯網上不良的信息傳播「閱歷」也會增加,但不一定是客觀世界的真相。

亞里士多德說要使一個物體不斷運動,需要對其施加一個力,就犯了過擬合的錯誤。伽利略的天才之處在於,無須到外太空親眼見證,他憑直覺就知道,不受外力影響的物體會一直保持運動。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 阿貓讀書 的精彩文章:

有多少人賺到盆滿缽盈,就有多少人葬送在網路

TAG:阿貓讀書 |