你文字里的焦慮,它一眼就能看出來
不知從哪一天起,當你撥通一則客服電話,電話那頭不再是一個真實的接線員為你服務,而是機器人。它可以根據你提供的關鍵詞,輕而易舉地幫你完成密碼重置,個人信息更新,甚至進行有針對性的推銷。
當然,這只是機器學習在實際生活中一個再普通不過的應用。這門學科在其興起的短短四五年內,已經悄無聲息地滲透進了我們的家裡、學校、辦公室等許許多多個角落。
幾乎每個人都或多或少聽過這個名詞。但它究竟是什麼?它又能幫我們做什麼?a16z 著名投資人 Benedict Evans 在文章中分享了自己的看法。
什麼是機器學習?
顯然用「人工智慧」一個詞來概括是不夠的。
換一種方式理解,我們大概知道神經網路長什麼樣子。
兩個關鍵詞——規律性的模式和數據。
機器學習,本質上就是在大量的數據中尋找這樣的規律和結構。
而這些數據,往往看上去是沒有顯著規律可言的。
原先,計算機可做不了這事。或者說,讓人們把這項任務用程序告訴計算機,都是很困難的。但是,隨著科技的進步和人類的不斷探索,「機器學習」時代還是到來了。
打開人工智慧世界的大門
與其說什麼高大上的駭人聽聞的詞,比如「數據就是金子」,「人工智慧會取代所有工作「, 還不如仔細思考一下,什麼是自動化,什麼是關係資料庫。
一句話概括,關係資料庫改變了數據結構。
在 1970 年關係資料庫出現前,假設想讓電腦告訴我們,所有買過我們產品且住在這個城市的客戶,我們需要專門搭建一個項目來解答這個問題。當時資料庫只是一個記錄系統,你問個問題沒法直接得到答案。
但是關係資料庫呢,就能做到交叉查詢。
它催生了一系列資料庫的創新應用,和許多基於此的幾十億美元公司。
關係資料庫給了我們甲骨文公司(Oracle , 全球最大企業級軟體公司)。它同時讓SAP(System Applications and Products, 企業管理解決方案)及其同行給全球範圍內的企業提供了供應鏈支持,比如蘋果公司和星巴克。
值得注意的是,雖然關係資料庫本身具有規模效應,但是裝在不同籃子里的雞蛋還是在不同籃子里。舉個例子,公司 B 從同一供應商處買了公司 A 買過的資料庫軟體,軟體並不會因為 A 買過而變得更好。
同樣地,機器學習所看重的數據也是分籃子的。更多的手寫數據使手寫識別器變得更好了;但這並不能幫助改進燃氣輪機。一個特定領域裡的數據不可替代。
常見的誤解
人們往往對機器學習有個誤解,認為機器學習是單一的、通用的。
每一波自動化的浪潮中,我們都想像我們在創造一些和人一樣智能的或幫助人的東西。在 20 世紀五十年代,我們想像人形機器人在廚房裡走動,做家務。
事實上,我們沒有得到機器人僕人。
我們得到了洗衣機。
洗衣機是機器,但它們並不「聰明」。它們不知道什麼是水,什麼是衣服。此外,即使在洗滌領域裡,它們也不是通用的。你不能把餐具放在洗衣機里,也不能把衣服放在洗碗機里。它們只是另一種自動化,在概念上與傳送帶或取放機器沒有什麼不同。
同樣,機器學習讓我們可以解決以前計算機無法解決的問題,但每個問題都需要不同的實現方法,不同的數據,以及不同的推廣渠道。它們中的每一個都是自動化的。每一個都相當於一台洗衣機。
機器學習能幫我們做什麼
首先,機器學習可以分析我們已有的數據、提供更好的結果。舉個例子,僅由三位工程師使用谷歌開源工具構建的系統,成功優化了一家零售公司的顧客採購系統,並將該公司的效益提升了50%。
其次,機器學習還可以從已有數據中挖掘新的信息。例如,機器學習可以通過關鍵詞搜索,幫你找到傳達「憤怒」、「不安」等情緒的郵件。
除此以外,機器學習還開闢了新的數據類型進行分析。電腦可以「看到」了,就像他們可以「閱讀」一樣。圖像感測器(和麥克風)成為一種全新的輸入機制。
吳恩達(華裔計算機科學家)認為,機器學習能夠做一切人在不到一秒的時間內能做的事。但我更喜歡另一個比喻,它給你無限數量的十歲的孩子。
五年前,如果你給計算機提供一堆照片,那麼它只能按照尺寸將它們排序。但是一個十歲的孩子可以把他們分成男人和女人,一個十五歲的孩子可以劃分他們哪些有吸引力,一個實習生可能會說「哦,這張真的很有趣」。
今天,憑藉機器學習,計算機將相當於一個十歲,也許十五歲的孩子。它可能永遠不會到實習生的級別,但如果你有一百萬個十五歲的孩子在幫助你分析數據,你能做的事情就比現在多得多了。
也就是說,機器學習不需要匹配專家或數十年的經驗判斷。相反,我們只要求它能做到「接聽所有的電話並找到憤怒的那些」、「閱讀所有電子郵件,找到焦慮的那些」、「看看十萬張照片,找到那些很酷(或至少不尋常)的人」。
這個比喻還告訴我們,在一些領域,機器學習不僅能夠做人們能夠做的,還能夠做人們不能做的。舉 AlphaGo 的例子,它只不過明白了下棋規則,剩下的策略由它自己在和自己下棋中不斷總結、摸索。練習的次數可能超過一個人一生能下的數量。
所以,有什麼領域是窄到規則我們可以直接告訴機器,卻又深到看遍其中的所有數據能夠給我們帶來的新發現呢?
我花了很多時間在和大公司們聊他們的技術需求,那些對於機器學習來說都很容易做到,比如優化分析問題和圖像音頻識別。還有自動駕駛汽車和虛擬現實----是機器學習的技術分析了車子周圍有什麼,人類駕駛員一般會怎麼做;戴上眼鏡應該看到什麼。
它還可以幫我們做什麼?還有哪些我們不知道的應用?這些,都留給我們在未來的 5 到 10 年間去探索吧。
TAG:真格基金 |