你文字里的焦慮，它一眼就能看出來

最新 07-13

不知從哪一天起，當你撥通一則客服電話，電話那頭不再是一個真實的接線員為你服務，而是機器人。它可以根據你提供的關鍵詞，輕而易舉地幫你完成密碼重置，個人信息更新，甚至進行有針對性的推銷。

當然，這只是機器學習在實際生活中一個再普通不過的應用。這門學科在其興起的短短四五年內，已經悄無聲息地滲透進了我們的家裡、學校、辦公室等許許多多個角落。

幾乎每個人都或多或少聽過這個名詞。但它究竟是什麼？它又能幫我們做什麼？a16z 著名投資人 Benedict Evans 在文章中分享了自己的看法。

什麼是機器學習？

顯然用「人工智慧」一個詞來概括是不夠的。

換一種方式理解，我們大概知道神經網路長什麼樣子。

兩個關鍵詞——規律性的模式和數據。

機器學習，本質上就是在大量的數據中尋找這樣的規律和結構。

而這些數據，往往看上去是沒有顯著規律可言的。

原先，計算機可做不了這事。或者說，讓人們把這項任務用程序告訴計算機，都是很困難的。但是，隨著科技的進步和人類的不斷探索，「機器學習」時代還是到來了。

打開人工智慧世界的大門

與其說什麼高大上的駭人聽聞的詞，比如「數據就是金子」，「人工智慧會取代所有工作「，還不如仔細思考一下，什麼是自動化，什麼是關係資料庫。

一句話概括，關係資料庫改變了數據結構。

在 1970 年關係資料庫出現前，假設想讓電腦告訴我們，所有買過我們產品且住在這個城市的客戶，我們需要專門搭建一個項目來解答這個問題。當時資料庫只是一個記錄系統，你問個問題沒法直接得到答案。

但是關係資料庫呢，就能做到交叉查詢。

它催生了一系列資料庫的創新應用，和許多基於此的幾十億美元公司。

關係資料庫給了我們甲骨文公司（Oracle , 全球最大企業級軟體公司）。它同時讓SAP（System Applications and Products，企業管理解決方案）及其同行給全球範圍內的企業提供了供應鏈支持，比如蘋果公司和星巴克。

值得注意的是，雖然關係資料庫本身具有規模效應，但是裝在不同籃子里的雞蛋還是在不同籃子里。舉個例子，公司 B 從同一供應商處買了公司 A 買過的資料庫軟體，軟體並不會因為 A 買過而變得更好。

同樣地，機器學習所看重的數據也是分籃子的。更多的手寫數據使手寫識別器變得更好了；但這並不能幫助改進燃氣輪機。一個特定領域裡的數據不可替代。

常見的誤解

人們往往對機器學習有個誤解，認為機器學習是單一的、通用的。

每一波自動化的浪潮中，我們都想像我們在創造一些和人一樣智能的或幫助人的東西。在 20 世紀五十年代，我們想像人形機器人在廚房裡走動，做家務。

事實上，我們沒有得到機器人僕人。

我們得到了洗衣機。

洗衣機是機器，但它們並不「聰明」。它們不知道什麼是水，什麼是衣服。此外，即使在洗滌領域裡，它們也不是通用的。你不能把餐具放在洗衣機里，也不能把衣服放在洗碗機里。它們只是另一種自動化，在概念上與傳送帶或取放機器沒有什麼不同。

同樣，機器學習讓我們可以解決以前計算機無法解決的問題，但每個問題都需要不同的實現方法，不同的數據，以及不同的推廣渠道。它們中的每一個都是自動化的。每一個都相當於一台洗衣機。

機器學習能幫我們做什麼

首先，機器學習可以分析我們已有的數據、提供更好的結果。舉個例子，僅由三位工程師使用谷歌開源工具構建的系統，成功優化了一家零售公司的顧客採購系統，並將該公司的效益提升了50%。

其次，機器學習還可以從已有數據中挖掘新的信息。例如，機器學習可以通過關鍵詞搜索，幫你找到傳達「憤怒」、「不安」等情緒的郵件。

除此以外，機器學習還開闢了新的數據類型進行分析。電腦可以「看到」了，就像他們可以「閱讀」一樣。圖像感測器（和麥克風）成為一種全新的輸入機制。

吳恩達（華裔計算機科學家）認為，機器學習能夠做一切人在不到一秒的時間內能做的事。但我更喜歡另一個比喻，它給你無限數量的十歲的孩子。

五年前，如果你給計算機提供一堆照片，那麼它只能按照尺寸將它們排序。但是一個十歲的孩子可以把他們分成男人和女人，一個十五歲的孩子可以劃分他們哪些有吸引力，一個實習生可能會說「哦，這張真的很有趣」。

今天，憑藉機器學習，計算機將相當於一個十歲，也許十五歲的孩子。它可能永遠不會到實習生的級別，但如果你有一百萬個十五歲的孩子在幫助你分析數據，你能做的事情就比現在多得多了。

也就是說，機器學習不需要匹配專家或數十年的經驗判斷。相反，我們只要求它能做到「接聽所有的電話並找到憤怒的那些」、「閱讀所有電子郵件，找到焦慮的那些」、「看看十萬張照片，找到那些很酷（或至少不尋常）的人」。

這個比喻還告訴我們，在一些領域，機器學習不僅能夠做人們能夠做的，還能夠做人們不能做的。舉 AlphaGo 的例子，它只不過明白了下棋規則，剩下的策略由它自己在和自己下棋中不斷總結、摸索。練習的次數可能超過一個人一生能下的數量。

所以，有什麼領域是窄到規則我們可以直接告訴機器，卻又深到看遍其中的所有數據能夠給我們帶來的新發現呢？

我花了很多時間在和大公司們聊他們的技術需求，那些對於機器學習來說都很容易做到，比如優化分析問題和圖像音頻識別。還有自動駕駛汽車和虛擬現實----是機器學習的技術分析了車子周圍有什麼，人類駕駛員一般會怎麼做；戴上眼鏡應該看到什麼。

它還可以幫我們做什麼？還有哪些我們不知道的應用？這些，都留給我們在未來的 5 到 10 年間去探索吧。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 真格基金 的精彩文章: