人人都在講的大數據和人工智慧到底是什麼？

最新 05-30

授人以魚不如授人以漁，授人以術不如授人以道。

以史為鑒，可以知興替。

—

數據是人類文明的基石

首先，數據不僅僅是「數字」，它的範疇要大得多。

互聯網上的文字、圖片、視頻；醫院裡的醫學影像等檔案；公司和工廠里的各種圖紙；出土文物上的文字、圖標；甚至是人類活動本身、天體運行的軌跡、宇宙中基本粒子的數量……

以上這些都是數據。

圖片來源：pinterest.com

可以說，數據是人類文明的基石，人類對它的認識也反應了文明的程度。

數據是客觀存在的，它的最大作用在於承載信息，而信息是關於世界、人和事物的描述。

對數據和信息進行處理後，人類就可以獲得知識。

然而，並非所有的數據都承載了有意義的信息，它們經常混雜著無意義的數據和偽造的數據。

圖片來源：pinterest.com

因此，我們需要處理數據，過濾掉沒有用的雜訊和刪除有害的數據，從而挖掘出數據背後的信息。

—

大數據思維

數據和所想獲得的信息之間的聯繫通常是間接的，它需要通過不同數據之間的相關性才能體現出來。

某交友網站通過調查並統計用戶首次約會問的問題及成功率，利用數據之間的相關性，可以給出「提高成功率的可提的最佳問題」的建議。

Google通過統計用戶在不同時間點對某個電視節目的搜索量，將搜索量和收視率聯繫起來。

甚至，數據之間的相關性還可以用來預測疾病。

Google 和疾病控制和預防中心的工程師從2007年到2008年一起合作研究了流行病傳播和各地區搜索量變化的關係，訓練了一個線性回歸模型預測2007年和2008年冬季流感傳播的趨勢和地點，並且將機器預測的結果和疾病控制與預防中心公布的數據進行對比，發現準確率高達97%以上。

我們可以發現，大數據是一種全新的思維方式。

我們從小到大從課本上學的各種定理、公理、定律以及各種公式，是自17世紀以來一直指導我們日常做事行為的最重要思維方式——機械思維，其核心思想可概括為：

世界變化的規律是確定的。

規律不僅是可以被認識的，而且可以用簡單的公式或者語言描述清楚。

這些規律應該是放之四海而皆準的，可以應用到各種未知領域指導實踐。

圖片來源：pinterest.com

工業革命，就是機械思維的結果。

我們老祖宗在科技方面的成就也絲毫不遜色，就是方法論不行，沒有歐幾里得、斯托密、牛頓等偉人帶來的機械思維，以至於沒有趕上工業革命這班車，哪怕在洋務運動中還是堅持「中學為體、西學為用」的落後思想。後來的結局大家都知道了。

但是，在信息時代，機械思維的局限性越來越明顯：

並非所有規律都可以用簡單的原理描述。

找到新的因果關係已經變得非常困難，簡單的都已經被發現了。

世界本身就存在著很大的不確定性。

大數據因為具有數據量大、多維度和完備性的特點，它的本質就是利用信息消除不確定性，解決問題從尋找因果關係變為探尋強相關關係。

能夠從因果關係找到答案、原因固然好，但對於複雜問題，其難度非常大，除了物質條件、人們的努力，還要靠運氣。

牛頓和愛因斯坦都是運氣很好的人。但大部分時候我們並沒有靈感和運氣，因此我們可以利用大數據思維，從大量的數據中直接找到答案。

—

大數據導致了機器智能的產生

計算機要解決需要人類智能的問題，如語音識別、機器翻譯、與人類下象棋、自動回答問題等，核心就是變智能問題為數據問題。

然而，人類走到這一步並非一帆風順，而是先走了十幾年的彎路。

圖片來源：pinterest.com

剛開始，人工智慧方法首先是了解人類是如何產生智能的，然後讓計算機按照人的思路去做。

產生這樣的思考方向很簡單，因為這是根據直覺最容易想到的辦法。

就拿自然語言處理來說，當時的科學家普遍認為，要讓機器完成翻譯或者語音識別等只有人類才能做的事情，就必須先讓計算機理解自然語言，那麼首先要做好兩件事，即分析語句和獲取語義。

圖片來源：pinterest.com

但採用這種方法，人工智慧就有明顯的局限性。舉個例子：

The box was in the pen.

這句話讓人頗為費解。原來，在英語中，pen（鋼筆）還有另外一個不太常用的意思——小孩玩耍的圍欄。

但是，計算機用語法分析無法判斷pen在哪一句話中應該作為圍欄，在哪一句話中應該是鋼筆。

事實上，人對這兩句話的理解並非來自語法分析和語義本身，而是來自他們的常識或者說關於世界的知識，這個問題計算機無法解決。

由於採用以上方法，20世界60年代末，計算機科學的其它分支都發展得十分迅速，但是人工智慧研究卻開展不下去了。

直到20世紀70年代，康奈爾大學的弗雷德·賈里尼克教授在IBM做學術休假時採用數據驅動和超級計算方法嘗試機器智能的另一條發展道路，他領導的IBM華生實驗室花了4年時間就開發了一個基於統計方法的語音識別系統。

其基本方法就是為自然語言這種上下文相關的特性建立數學模型——統計語言模型（Statistical Language Model），找到數學模型之後，下一步就是用統計的方法「訓練出」模型的參數，也就是機器學習。

在這個過程中，需要使用大量的數據，同時要有足夠的計算能力，當時只有IBM具備這些條件。

該系統的識別率從過去的70%左右提高到了90%以上，同時規模從幾百詞上升到兩萬多詞。

至此，人工智慧有了本質的飛躍。

Fred Jelinek，1932—2010

2005年，之前在機器翻譯領域從來沒有技術積累、不為人知的Google，其基於統計方法的翻譯系統在NIST測評上全面超過基於規則方法的SysTran翻譯系統，一躍成為該領域的領頭羊。

進入21世紀後，由於互聯網的出現使得可用的數據量劇增，數據驅動方法的優勢越來越明顯，最終完成了從量變到質變的飛躍。

總之，計算機獲得智能的方法不是和我們人一樣靠推理，而更多的是利用大數據，從數據中學習獲得信息和知識。

這一場由大數據引發的改變世界的革命已經悄然發生，決定今後20年經濟發展的是大數據和由之而來的智能革命。

—

這是最好的時代，也是最壞的時代

歷史上影響力可以和正在進行的智能革命相比的，一共有三次。

18世紀末始於英國的工業革命。

19世紀下半葉始於美國和德國的第二次工業革命。

「二戰」後以摩爾定律為標準的信息革命。

18世紀的工業革命，是人類歷史上空前的偉大事件，任何其它歷史事件在人類的文明史上的重要性都不能和它相比。它使得人類過的好了，活的長了，有自信和尊嚴了。

雖然從歷史來看，這場偉大的變革帶來的好處遠遠大於負面影響，但是在當時，它帶給社會的動蕩時巨大的。

工業革命中只有工廠主、發明家或者使用蒸汽機開拓製造新行業的人受益，靠一技之長的工匠紛紛破產，他們從中產階級淪為赤貧。

從18世界末到19世紀上半葉，是英國貧富分化嚴重、社會矛盾重重的半個多世紀。

英國人花了大約兩代人的時間消化工業革命帶來的負面影響。解決辦法就是資本輸出，開拓全球殖民地，推行自由貿易。

第二次工業革命的核心是電的使用。和工業革命時期的英國一樣，美國下層社會的生活非常悲慘，同時，美國南方的傳統經濟被北方的大工業徹底碾碎了，並沒有因為第二次工業革命而受益。

19世紀末美國的工人運動，後面是警察在鎮壓

雖然沒有英國那麼好的運氣，有那麼多未開發的殖民地在等著他們，好在美國有它天然的地理優勢，有廣袤的中西部處女地等待開發，從某種程度上解決了產能的問題。但貧富差距非常嚴重。

「二戰」後的信息時代是人類歷史上的第二個創造財富的高峰年代，出生了喬布斯、比爾蓋茨、邁克爾戴爾、拉里佩奇等人，但是美國大眾的生活質量並沒有很大的改變。

另外，以蘇聯為核心的東歐集團、超過10億人的穆斯林地區、大部分歐洲國家、整個南美洲，對於信息革命的貢獻微乎其微。它們雖然能夠享受到信息革命的產品，卻沒有享受到信息革命帶來的經濟增長（中國情況特殊）。

從全世界的範圍看，消化掉信息革命的衝擊波或許還需更長的時間。

然而現在大數據和機器智能革命已經來敲門了。

與之前的三次重大技術革命一樣，智能革命對社會的衝擊將是巨大的，它會影響到上至國家、中到企業、下至個人的命運。

從目前的發展來看，智能革命對社會的衝擊甚至可能超過過去幾次技術革命。

由於全球化，全世界已經沒有空白的市場可以開拓了，消化掉技術革命的影響要比工業革命時難的多。

智能革命所要替代的事人類最值得自豪的部分——大腦。智能革命中，計算機所取代的不僅僅是那些簡單重複性的勞動，還包括醫生、律師、新聞記者和金融分析師等過去被認為是非常需要腦力的工作。

在智能時代，受益的將是參與智能機器的研發和製造等新行業的人，如進入蘋果、Google、BAT等工作的人。

但這隻會佔到勞動力很小的一部分。

圖片來源：pinterest.com

2%的人將控制未來，成為他們或被淘汰。

結語：

看到這裡，大家肯定按捺不住想問，如何成為那2%？

其實我也不清楚具體答案，但是或許可以提供一個思路。

If 你正從事大數據和人工智慧行業：

Print（「恭喜你入對行！努力積累等待起飛！」）

Else:

If 你覺得自己還可一戰，激情滿滿：

Print(「甚是佩服！鄙人的時間管理一文，希望對您有用，充電充起來！」)

Else：

Print(「大號廢了沒關係，趕緊小號養起來，搶佔先機！沒媳婦的先找媳婦去～「)

Print (「沒關係，傻人自有傻福，難得糊塗，享受現在，也是一種生活！」)

以上純屬皮一下～

至於我自己，打算做兩手準備。

第一手，默默做王尼瑪背後的女人。

第二手，讓娃學好語數外，從小開始學Python。

這波操作，6不6？

如果大家有更好的辦法，歡迎留言區踴躍發言！

Reference

1.吳軍.智能時代：大數據與智能革命重新定義未來[M].北京：中信出版社，2016.

2.吳軍.數學之美[M].北京：人民郵電出版社，2015.

3.JamesT.McClave, P. George Benson, Terry Sincich.商務與經濟統計學[M].北京：人民大學出版社，2015.

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 司馬安安 的精彩文章:

TAG:司馬安安 |