從數據到知性 大數據的生存進化之路
這幾年,大數據突然成了商業社會上的弄潮兒。似乎,一夜之間,大數據就像明星一樣紅遍大江南北。以前,只有在數學、統計、計算機等專業領域談到的數據,現在已經「飛入尋常百姓家」。大數據的各種應用、研究與實踐紛紛出現,名之為大數據的公司也是雨後春筍般湧現。不過,對於普通人而言,用具體的例子可以更好地解釋它。
來源:百度圖片
數據是信息的表達,它的出現甚至比人更為久遠。在「宇宙大爆炸」的研究過程中,美國物理學家伽莫夫於1946年正式提出大爆炸理論,認為宇宙由大約140億年前發生的一次大爆炸形成。後來,哈勃通過望遠鏡觀測到「紅移現象」——就是星系正在遠離我們,表明宇宙正在膨脹。通過測量光譜中的特徵譜線的位置,可以推算出其以前的位置。由此,我們可以推算出宇宙的大致年齡。宇宙中的每個物體都帶有信息,而信息會通過數據來表達。人類的智慧在於可以通過收集數據去認識一切。假如數據在宇宙誕生時就隨之出現,那麼毫無疑問它的「年齡」比人類大得多。
《在科技想要什麼》里,美國科技哲學家凱文·凱利就提出了「科技也是有生命力的」的觀點。他認為,傳統上,人們只把植物、動物、原生生物、真菌、原細菌、真細菌稱為生命。如果重新審視「生命」,那麼科技或者技術可被稱為「第七種生命元素」。原因在於技術是生命的延伸,它的演進與生命的進化及其相似。那麼依照這樣的觀點,我們完全可以把數據稱為「第八種生命元素」。人每時每刻都會散發出信息,比如你的身體、你的行為甚至你的思想。通過工具,我們可以記錄下你每時每刻的呼吸、心跳等許多身體數據,甚至連行為、思想也可以通過一些方法測量出來。在《智慧社會》里,美國的全球大數據權威阿萊克斯·彭特蘭通過社會計量標牌來測量人們的行為。這個設備僅有卡片大小,配備了測量佩戴者運動的感測器、捕捉聲音的麥克風、檢測附近同類設備的藍牙,以及記錄面對面交流的紅外線感測器。這個東西功能異常強大,比如在打撲克時,這款設備10次有7次可以很準確地判斷某人是否作弊;佩戴設備的人能夠在5分鐘內預測談判中的贏家。
以前限於技術和發展程度的限制,人們對數據並不重視,也沒有認識到數據的價值。但是現在通過技術手段,我們完全可以收集人類的一切數據,並對數據進行整理、分析和總結,從中發現驅使人類行為的背後因素。也就是說,我們可以通過數據來觀察人類。
舉一個例子,就是谷歌流感搜索與預測系統。2009年出現了一種新的流感病毒——H1N1,迅速席捲全球。因為它結合了禽流感與豬流感的特點,傳染力很強,破壞力極大。更糟糕的是,目前還沒有對抗這種病毒的疫苗。美國政府要求醫生在發現新型流感病例時要及時告知疾控預防中心。然而從人們發現自己患病到醫院再到疾控中心,時間會拉長,然而短短的時間新型流感可能已經爆發。這對政府、社會和國家來說,將會帶來巨大的損失。但是,谷歌卻比政府做得更好。谷歌公司把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003年至2008年間季節性流感傳播時期的數據進行了比較,他們希望通過人們的搜索記錄來判斷這些人是否患上了流感。他們的預測結果和官方數據的相關性達到97%。因此,2009年流感爆發的時候,谷歌成了一個很有效、很及時的指示標。
Google的流感搜索與預測系統
現在,不管是企業還是公司,手裡都有巨量的數據。用於企業,海量的數據是企業未來的寶藏;用於社會,海量的數據可以為人們提供更好的生活和公共服務。以美國為例,在2014年,美國國稅局通過一個名為「Get transcript」的工具將納稅人的信息數據加以共享,納稅人可以通過它獲得他們自己最近三年的納稅記錄。個人納稅者可以藉此下載過去的納稅申報單,這使得居民進行抵押、學生貸款、商務貸款等活動與填寫納稅表變得更加便捷。
如今,大數據相比以前的簡單數據,有三個特點:數量大、種類多、速度快。數量上,2011年新生成的和複製的信息量估計超過了1.8ZB(澤位元組);而在2013年這一數字估計超過4ZB。要知道,1ZB等於1021 個位元組,相當於存儲323兆份列夫·托爾斯泰所著的1250頁的《戰爭與和平》所需的容量。種類上,從農業生產到餐飲再到醫療保健,任何行業都會產生越來越多的數據。速度上,數據的產生更是以指數級增長,數據的產生和更新不斷加速。我們可以推知,數據的更迭會加速,就像人類的發展一樣。假如把幾百萬的歷史比作一小時,那麼人類的輝煌卻產生在最後幾分鐘。不得不驚嘆,信息、技術和數據的變化遠遠超出了人類。以百度為例,它有一個全國遷徙動態地圖,隨時可從網上看到人們遷入和遷出的省份和城市。通過人們的手機搜索記錄,百度可知道人們現在的位置和要去的地方。所有的數據經過收集和匯總,就能變成有價值的東西了。
百度的全國遷徙圖
北京地區人們的通勤圖
大數據到底會如何進化?這是值得讓人深思的。原始的數據就是一些簡單的數值、記號等,通過大量的收集相關數據,並進而分類,原始的數據就變成對人們有用的信息了。再通過對信息進行整理、賦予內涵,發現其中的規律性,就變成一種有用的知識了。有用的知識能夠為為人們提供一種行動方案,這樣知識就成為知性的。由此,我們可見一條清晰的數據生存進化之路:「數據——信息——知識——知性」。如果說,以前,世界的原始動力是上帝,那麼,21世紀,驅動世界運轉就是數據了。






TAG:天極網 |
※大數據時代下,數據感知在數據質量管理系統中的應用
※八大不為人知的性愛數據
※數據大潮之下,數據中心技術快速演進
※大數據和人工智慧浪潮下的未來進化
※大數據的局限性
※數據人生:阿里數據大咖的20年數據之旅
※大數據時代要有大數據思維
※艾漫數據藉助大數據,打通影視產業鏈上下游
※應精化互聯網大數據,過於澎漲的視聽大數據風口
※大數據時代的下一幕:從數據驅動到信息驅動
※能對決策產生影響的數據分析才是有意義的數據分析
※兩個數據決定宇宙生命存在,數據變化一點就不可能有生命存在!
※大數據顯示:華為的品牌流失和流入都是最強的
※從三大行業看大數據應用的三重境界:數據、分析、成果
※與大數據有關的一些術語
※中國大健康數據,這個數據誰整理出來的
※大數據行業人士必知10大數據思維原理
※數據大爆炸 中國仍待打破數據孤島
※染髮五大元素與數據