學習機器學習:這10年我們能在各自的領域做點什麼?
機器學習在這幾年都非常熱,被冠以人工智慧 AI 之名,非常吸引眼球。大家都在談論或思考它到底意味著什麼,會給我們帶來什麼樣的影響?
為什麼要學習和了解機器學習?
Benedict Evans認為,最終幾乎所有的東西都會有機器學習,到那時人們對機器學習已經是習以為常、見怪不怪了。到這一步還有多久呢?10-15年。
這不禁讓人思考:這10年,我們能利用這個契機在各自的領域做點什麼呢?正如以往的各種技術浪潮興起時,比如工業革命、電力革命、互聯網、移動互聯網,還有作者在文中說到的關係資料庫技術等,那時各領域的創新者們都是如何響應的呢?
如果希望10年後能在自己的領域有所影響力的,利用機器學習應該是一個好的機會。跟自己相關的是學習領域,所以如何利用機器學習來提升學習的效率,是這一年多來在探索的命題。
假若10年機器學習技術真的對人類的學習方式、方法及效率帶了本質的改變,希望其中能有一點自己的貢獻。
下面是學習 Benedict Evans 這篇文章記的筆記以及自己的一點思考。
討論機器學習務實方式
機器學習又被稱作「人工智慧 (AI)」。這個名字有好有不好。好的方面是,很容易抓眼球,獲得大家(包括投資人)的注意力。不好的是,容易跑偏。大家容易想像成一種具有通用智能的東西。
作者舉了很好的例子:
在自動化的每一波浪潮中,我們都想像我們正在創造一些擬人化的東西或具有通用智能的東西。在上世紀20、30年代,我們想像鋼鐵俠拿著鎚子在工廠里走來走去,在50年代,我們想像人形機器人在廚房裡走來走去做家務。但我們沒有機器人僕人,我們有用來清洗的機器。
所以「人工智慧將接管所有的工作」 「數據是新的石油」 類似的話題都過於高屋建瓴,對深入理解機器學習並無益處。
更務實且有助於理解和解決問題的方式應該是:機器學習可以看作是另一種意義上的自動化,在概念上跟傳送帶或取放機並沒有什麼不同。它每次只能解決一個單一問題,每個問題都需要不同的實現方式、不同的數據、不同的路徑,而且往往需要不同的公司。洗碗機洗碗,洗衣機洗衣服,機器學習跟它們一樣,都是自動化的一部分。
找到機器學習應用場景的兩套工具
作者在文中提供了兩個思維角度,來尋找具體產品中機器學習的應用場景。
工具一:從數據和要解決的問題的類型上來思考,主要有三類:
(1)如果你有相關數據,機器學習可以提供更好的結果(數據分析)
比如:Instacar 公司建立了一個系統,來優化個人購物者在超市中的路線,結果是相關超市有50%的提升。這是由三名工程師利用谷歌的開源工具 Keras 和 Tensorflow 建立的。
(2)機器學習可以對已有數據提出新的問題(數據挖掘)
比如:就像正在找線索的律師,可以通過尋找有關「憤怒的」或「焦慮的」以及其他異常的線索,帶來新的發現。
(3)機器學習可以用來直接分析音頻、圖像或視頻數據,以前無法做到。這意味著圖像感測器和麥克風變成了一種全新的輸入機制(增加可分析數據類型)
比如:一家為汽車公司提供座椅的公司,在一個便宜的DSP晶元上安裝了一個神經網路,並配有一個便宜的智能手機圖像感測器,用來檢測面料是否有褶皺。
作者還特意指出,這個識別面料是否有褶皺,跟識別一張圖是否是貓並不是同一個問題。我想他的意思應該是,用於工業界和實際產品中技術,並不需要像識別一張照片是否是貓這種認知層面的技術。能低成本地解決環節中任何一個哪怕是細小的問題,都是好的。至於能不能叫「人工智慧」又有什麼關係,它的本質是將以前無法自動化的任務給自動化了。
工具二:自動化的感覺(上面講的這種自動化)
這個似乎有點虛無渺茫。你要想像這種自動化是一種低層次的自動化,並不需要像有20年經驗的專家那樣。
作者打了一個比方,還挺有意思的。他說有了機器學習這個工具,就像是給了你無數個可以用的實習生,或者是10歲的孩子。
5年前,機器能區分只能是照片的大小。一位10歲的孩子,可以分出男女。一位15歲的青少年可以分出酷或者不酷。一位實習生則能區分出有趣的人或無趣的人。現在的機器學習,已經可以達到10歲孩子甚至是15歲青少年的能力,但也許永遠達不到實習生的水平。
那麼問題來了:在這種情況下,如果你有一百萬15歲青少年(即機器學習)來幫忙看照片,你會怎麼做呢?同理,你會怎麼通過他們來聽電話,來識別圖片,來監測信用卡轉賬信息呢?
(也許可以想一想再看答案...)
我們可以要求「他們」 聽完所有的電話,找出其中聽起來有些生氣的那些;讀完所有的郵件找到顯得「焦慮」的那些;看完所有照片,找出酷的(至少是『有點怪』)的,而在這之後的事情可以交給人來處理。所以,機器學習並不需要成為專家本身。
而這本質上就自動化一直在做的事,就像是 Excel 和 Photoshop 一直在為我們做的事情一樣。
將一個重複多次的獨立任務自動化,這同樣是機器學習要做的。
當然上面這個比喻也有不適用的時候,比如機器在有的領域會超越人類,比如圍棋。AlphaGo 就是一個很好的例子。但是這種領域足夠狹窄,有具體且有限的規則,機器通過規則推演可以看到全部數據,而人類反而做不到的情況,是非常少見的。所以絕大多數的機器學習應用,還是上面說的「自動化」。
最後,結合自己的一點實際經驗,說一說自己的體會,主要有兩個方面。
第一,先摘低垂的果實
「低垂的果實」 是從萬維鋼的得到專欄《精英日課》聽來的譯法,英文是low hanging fruit,指的是相對不需要費太大力氣就能獲得的。
不是所有的人或公司都要追求10倍創新,那些讓希望賦予機器認知能力的事情可以由大公司來做。對於一個直接面向用戶的產品來說,什麼能提升體驗、能創造新的用戶價值,就用什麼。不為所謂「人工智慧」之名所累,一切以解決問題和提升效率為優先,是更務實的態度。
第二,機器學習在用戶量級大的系統解決方案型產品中更能發揮出效能
一是因為機器學習是靠數據驅動,用戶量級大,收集的數據多,訓練和迭代模型都更有利。另一個原因是,因為機器學習優化的可能是整個體系的一個環節,其效能需要在多次重複使用中發揮出來。這種回報後置要求,一在獲得成效前要有長遠眼光,二在取得成效後,需要系統將其效能放大。
比如,一個自適應的英語水平測評做得非常精準,但人們不一定願意持續為測評付費。更好的情況是,測評後面還有一整體套提升英語水平的付費課程。
總之,機器學習是一個我們不想也不能忽視的趨勢。它已經被應用於各行各業的各個環節,也將被應用於更多的場景,以此來提升效率。
所以這10年,我們都可以在各自的領域做點什麼呢?這是一個好問題。
(全文完)
彙報:
記寫字計劃的第51篇,走在了向百篇進發的路上,感謝陪伴。
常聽到有人說,現在機器翻譯這麼厲害,以後可能更厲害,我們還要不要花時間學英文?個人的感覺和看法是,如果在獲取英文信息這方面有需求,自己會讀英文還是一項挺實用的技能。除非哪天實現了「天下大同」 所有的信息能被無差別的翻譯成各國語言。
為什麼有時光有翻譯還不行呢?
因為沒有精準的表達,只看譯文容易錯過好文章或好觀點。這不是說譯者水平不夠,而是投入產出比的問題。畢竟不是經典文學名著,因此不可能投入太多的精力去理解和推敲。
這對於一般瀏覽信息的人影響不大。但對於真正需要看這篇文章的人來說,可能會有很大損失。
就以 Benedict Evans 這篇文章為例,其實中文譯文已經看了兩三篇,當自己需要把整個事情跟他人解釋清楚時,會發現譯文中其實有很多沒說明白,甚至有些小錯誤。這時再找到原文,發現作者其實說得非常簡潔明了。
另外,以獲取信息為目的的譯文一般比較無趣且翻譯腔重。連我自己翻譯的文章也是如此,雖然已經在儘力增強可讀性。
另外,三周前的端午節假期去了香港。這是第一次出境旅行,有很多跟以往旅行所不同的體驗。按照「一周一城」的慣例是要當日更文的,因為行程很緊湊,都來不及成文。不過還是隨手記下來很多隻言片語的感悟,所以可以期待某天會有一篇關於香港的更文。
真誠的靈魂相遇會有光
一起來
探索世界和可能性


※Opanga網路公司利用機器學習演算法來改善網路流量擁堵
※機器學習重塑供應鏈管理的10個途徑
TAG:機器學習 |