當前位置:
首頁 > 最新 > 為什麼客觀世界的底層是數據

為什麼客觀世界的底層是數據

之前聊過,世界有三重現實:主觀現實、客觀現實、觀念現實(互為主體現實)。觀念現實的底層邏輯是故事。那麼客觀世界呢?很可能,是數據

老說底層邏輯、底層邏輯,什麼是底層?我覺得就是萬事萬物中所共通的東西,最下面、最基礎的、最本質東西。世界紛繁蕪雜,各種事情,如果一個一個看,各有各的道理,最後在腦子裡就是一團亂麻。而底層邏輯是他們共通的規律,從底層的角度去看,也許能看的清楚明白一點兒。

數據是客觀世界的底層邏輯,這麼牛掰的觀點,當然不是我說的,是我學來的。很多牛人論述過,但我覺得論的最透徹的,還是《未來簡史》(詳見第11章:信數據得永生)。

《未來簡史》這本書是有爭議的,不少專家認為尤瓦爾赫拉利沒什麼理論創新,只不過把各領域的研究成果抄襲過來並穿了起來。我就奇怪了,重新穿起來難道不是創新嗎?一件事情火了以後,必然毀譽參半,這是人性。所以別人怎麼說都不重要,最重要的是自己的獨立思考和判斷。我覺得他說的有道理,能幫助我更好的思考和理解世界,我就信了,就這麼簡單。

說回數據。為什麼說它是底層邏輯呢?因為世界上的萬事萬物,究其本質,都可以將其理解為數據。從小往大了舉例子哈。

比如眼前這本書,它的尺寸大小,它的顏色排版,它的文字內容,其實都是可以數據化的,都可以變成計算機中的和1去處理。

比如中午食堂的午餐,盛了一盤子,什麼都有,是數據么。食物的種類、質量、溫度、卡路里、營養成分、甚至分子構成……只要往細了分析,也是可以轉化成各種數據。

再往大,比如交管局,這個組織,可不可以數據化?我覺得是可以的,雖然很複雜,雖然很多我們還沒嘗試,但要是仔細摳,其實都是可以用數據去描述的。那麼交通管理這項工作職能呢?其實質就是每天路面上大量的信息數據涌過來,然後我們這個系統,去分析處理這些數據,相應的採取行動。這個過程本質上是數據處理的過程。

《未來簡史》里講得更牛B,說每個人都是一種生化演算法,都是一個數據處理單元,各種組織、各種國家就組成了更大數據處理網路。比如什麼計劃經濟、市場經濟,其本質區別是數據處理的方式不同(集中式還是分散式),所以在效率和效果上有了高下之分。

以前我們如果遇到一件棘手的事情,往往是定性的分析,然後說出一大推道理,靠道理靠感覺去組織大家幹事情。我們甚至會覺得如果定量分析,摳得太細,是格局太小,不懂政治和管理的藝術。隨著科技發展,測量、感應、統計、計算能力的跨越式發展,無數事實正在告訴我們:一切皆可量化

新的科技主義、數據主義就是在倡導這樣的觀念,就是一切事物、一切事情都可以數據化,並以數據化的方式去處理和解決。我一開始也狐疑,但是仔細想、慢慢想,真的想不到一個反例。各位也不妨試試看,看能不能想到一個事情是完全不可以被數據化的?

以上說數據是底層、是本質,說萬事萬物皆可數據化,其實還是停留在理念層面。那麼具體的技術層面,怎麼把事物數據化呢?這幾天看書聽課,了解到關於數據的一些技術知識,有種醍醐灌頂的感覺,分享一下。

人民大學王珊教授,是一位老教授,她講《資料庫系統概論》,講了資料庫技術的發展歷史。經歷幾代發展,直到現在,最成熟最好用的資料庫是什麼呢,關係資料庫。它怎麼表達數據呢,就是用一個個關係,而關係的具體形式就是,沒錯,就是我們耳熟能詳的表格。聽起來一點兒也不高大上,誰不會畫表格呀,上一代人就用,現在小孩兒也會。可就是這麼個玩意兒,經過時間和現實檢驗,能夠最有效的表達數據。

以前說起excel,覺得不就是個製表軟體嘛,跟word一樣,最基本的辦公軟體唄,很低端的感覺是吧。但據說excel的數據整理和分析功能很強大,只是我們不懂而已。我現在依舊不懂,但我想為什麼一個製表軟體有強大的數據分析功能呢,也許就是因為,表格這種形式是數據用以表述世界的最有力載體。

同理,我們說點高端的。

北大張志華教授,機器學習專家,早年在上海交通大學的時候講過一門課,絕大多內容我聽不懂,但關於數據本質那段兒我聽懂了。他說:「數據是什麼?數據就是矩陣。」

怎麼講呢,如果我們試圖用數據去表述並管理一個事物,比如說交管局的警力資源吧,當然也可以是別的,可大可小,任意去想。這個事兒有n個樣本(每個樣本是一個民警),每個樣本有p個特徵(年齡、學歷、身高、住址、獎懲……可以無限多),x是特徵值。那就可以寫成一個矩陣:

如果有新警進來,就增加n,如果覺得不夠細緻,就增加p。也就是說,通過這樣一個矩陣,理論上,我們就完全可以把警力資源描述清楚。

其他問題也一樣可以套用。比如人臉識別,n就代表一個個臉的樣本,p就是每張臉的各種特徵,x就是特徵數值。比如自然語言處理,n就是一個個語言文字樣本(一句話一段文字),p就是拆分的一個個單詞,x就是每個單詞出現的頻率。其他身邊的任何問題,如果有興趣的話,都可以矩陣的方式去數據化,挺有意思的。而且能看到,其本質和表格差不多。

萬事萬物變成數據、變成矩陣,有什麼用?

大家知道矩陣是個數學名詞,有個數學分支叫《線性代數》,專門就是研究矩陣計算的。大學裡學過,那時覺得,這是什麼破玩意兒,沒有任何用處,完全是數字遊戲,而且這麼難,根本學不會。我大學期間只有一門課程不及格,就是《線性代數》。現在知道有什麼用了,就是萬事萬物都可以變成矩陣,然後進行計算。這就厲害了,現在什麼機器學習、人工智慧、數據挖掘,最根本的都是對各種矩陣的加工和運算。

現實的本質是數據,數據的本質是矩陣,而矩陣可以運算。也就是說這個世界任何事情,理論上都將是可以運算的,任何難題也都是可以通過數據運算解決的。其實現在已經實現了很多很多,有的讓我們驚掉下巴,而未來恐怕只會走的更快更遠,掉下來的下巴會更多。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 小白大亮學習筆記 的精彩文章:

TAG:小白大亮學習筆記 |