機器學習開發者會因谷歌AutoML失業嗎？

最新 02-10

虎嗅註：2月6日，谷歌Think With Google大會在北京舉辦，谷歌AI中國中心總裁、谷歌雲AI研發主管李佳與記者聊了聊有關AutoML的話題，比如關於AI 在教育和醫療的落地的情況，中國有沒有具體案例和推進的進度等等等。

正式發布Cloud AutoML後的半個月，谷歌AI中國中心總裁、谷歌雲AI研發主管李佳亮相谷歌在北京舉辦的Think With Google創想大會。接受採訪時，李佳分享了谷歌雲AI團隊的工作、 AutoML研發過程中最大難點、如何將研究與產品結合起來形成良性循環等數十個最為關注的話題。

2月6日，谷歌Think With Google大會在北京舉辦，旨在向廣告客戶及其他機構介紹最新研發技術，細分行業思考、產品打磨落地等熱點以及幫助開發者解決問題、探索新機會。

過去短短几年，面向企業的AI從一個萌芽想法變成商業利器，李佳認為縮短科技創新最佳途徑就是研究先行，深入了解細分領域的需求，個性化打磨產品使之成為一個良性循環，而谷歌AI雲就是其中最關鍵的加速器。

AI賦能的精髓在於所有人都使用它，在過去短短兩個月時間，AutoML的註冊用戶已經超過1萬家，其中包括企業、學校、創業公司、研究組織等等。一個簡單的例子，倫敦動物學會利用AutoML自動標註圖片追蹤野生動物種群以學習更多關於它們的分布信息，更好地理解人類對這些物種的影響。

以下為對話內容：

問：關於AI 在教育和醫療的落地的情況，中國有沒有具體案例和推進的進度？

李佳：現在中國 AI 中心的關注點還是在基礎研究上面，但在教育方面有很多有意思的問題還需要大家去探討，比如說教育理念的對話，學生和老師如何去交流，由於雙方的角色不一樣，知識水平不一樣，對對話內容的交流和理解也不同，所以我們很關注這方面教育的研究，但目前還沒有具體落地的進展。

問：AutoML現在服務的企業都是什麼樣類型？哪一些行業最集中在用？有何反饋？

李佳：AutoML 目前註冊的用戶背景很廣泛，我們看到有很多有意思的案例，就像剛才提到的倫敦動物學學會它用來保護野生動物，還有像零售業也有很多對此感興趣的，還有用來保護環境的，比如去檢測哪裡有垃圾？哪裡有礦泉水瓶子之類的，像這種很有創造力的案例還是很多的，而且有很多我們以前也沒有見到過。當然雲上面也有不少用戶在做醫療，有些醫療企業對這些功能也很感興趣。

問：您剛加入的時候已經在研究或者準備AutoML了，但是卻等到今年1月才發布，是不是過程中有遇到什麼困難？最重要的一個或者最具挑戰性的技術難點是什麼？

李佳：我們剛加入的時候做的一個事情實際上是看到底哪些機器學習和 AI 的應用會比較受歡迎。AutoML 實際上已經研究了有一段時間。大家也看到，包括我們在發布的博客裡面也列出了很多文章。

一般來說研究先行，而且我們還和很多團隊，包括 Google Brain，包括 Research，都有緊密合作。我覺得最大的難點在於，大家都覺得研究技術做的好，自然產品就有人用，但是在實際生活當中，特別是在企業 AI 這個方面，對產品的打磨和考量，是要與用戶的需求相結合的，我覺得這兩點的結合最關鍵。可能攻克了這一點以後，後面就會順利很多。

比如說在 AutoML 產品裡面，它最先進的技術是learning to learn這一塊，我們得到的效果也是最好的。但是同時我們會考量到learning to learn技術在計算方面的資源需要，我們實際上最後推出產品的時候是有兩個特點，一個是非常簡單的遷移學習（transfer learning），很多的客戶他們可以在一分鐘或者幾分鐘之內就能得到他們的結果。第二個是learning to learn與其他相結合的，這個更加的先進，而且他們的性能也會好很多，但是目前需要一天來達到產品級的效果。

雖然聽起來一天時間是比較長的，但是我們可以想想原來，剛剛我在演講裡面也列出來了，在傳統意義上，大家去做一個機器學習定製的演算法和產品的話，他這個周期是非常長的，包括你要去招募機器學習的一些專家，包括要去設計機器學習的演算法、收集數據，實際上通常要花費數個月或者數年。AutoML 實際上現在自動生成的模型已經比專家設計的模型在圖片分類上效果要更好，所以這樣比起來產品開發的周期是大大縮小了，企業的花銷也是大大的縮小了。

問：在 CV 跟語言結合的方面，Google 有哪一些探索？您認為 CV 的研究在圖象識別這類的感知領域進化到圖像描述以及回答認知領域還需要哪些突破？

李佳：在 CV 和語言方面，我自己進行了一些比較淺的工作，包括去年我們在 CVPR 有對圖片描述的工作，用強化學習來做圖片的描述，這些我覺得大家現在做的都還比較初期，因為這個問題確實非常的難，其中幾個重要的問題需要去探索的就是怎麼樣把我們的知識和感知結合到一起。

因為現在最有效的這些演算法，讓大家都聽性能有多好，但是人去理解一個圖片或者一個場景的時候，我們通常都帶著自己的知識和背景，也不需要那麼大量的數據來做訓練，其實領域裡面也有一些很早的先行者在探索這方面的工作，但是我覺得真正要突破它還是需要一定的時間。

問：Cloud AutoML 會不會成為 AI 中心的核心產品？您能否分享一下AI 中國中心的發展規劃？

李佳：我們 AI 中國中心主要的關注點還是在基礎研究上，目前中國中心我們想聚集最好的AI的人才和國內很多的優秀的 AI 人才一塊來推動基礎研究的發展，而且希望影響力是全球性的，剛才我也提到了 AI 本身是沒有國界的，所以我們希望最後 AI 的技術大家都能夠用的到。

AutoML 是今年我們在 Cloud AI 團隊重點的一個產品，它確實是我們想用於普及 AI 的一個很好的工具。剛才我在演講當中也提到了想用 AI 的用戶分為幾種：

第一種是對 AI 非常熟悉的，這些人他們可以用 TensorFlow 去開發，他們可以用 Cloud，或者大家提供一些工具，自己就能夠把這個機器學習開發做的非常的好。

第二種是 API 的用戶，這些用戶通常沒有自己的數據，他需要一些比較通用的或是描述性的東西，比如他只需要提供一張照片馬上就能達到結果，或者是給他提供一個音頻片段，他就可以得到一段轉錄，根本不需要花時間開發自己的模型，這是對很多大量的用戶非常方便的，包括翻譯之類的，我們剛才看到很多的用戶他們也是 Google 翻譯的 API 用戶。

第三種是他們有一些想法和數據，想要定製自己的模型，但是他們不知道自己怎麼去做。AutoML 能夠把這個門檻降低，讓他們不需要再去招募大量的機器學習的人才，也不需要花大量的時間去標註他們的訓練數據，就直接可以得到自己定製的東西。

還有一種在演講裡面沒有提到，其實有很多的傳統行業他來找我們談AI合作的時候，通常他們都是說 AI 我們覺得是一個非常重要的方向，我們不想錯過這個方向，但是我們不知道要做什麼？我們不知道拿它來怎麼做？

我們通常都是把他們跟我們的高級解決方案實驗室（Advanced Solution Lab）進行密切的合作，在我們高級解決方案實驗室（AdvancedSolution Lab）可以邀請我們的客戶到 Google 來，我們教他們怎麼用機器學習，怎麼用深度學習，深度的密切合作，去了解行業領袖他們需要解決什麼樣的問題，Google 的工程師會跟他們深度的合作，幫他們開發這些演算法。所以實際上AI整個產業，他的範圍非常的廣，我們需要開發各種不一樣的產品來幫助我們各種各樣的用戶都能夠從 AI 當中受益。

問：現在雲市場的競爭非常激烈，您覺得 Google雲最大的優勢是什麼，以及未來三到五年如何來保持這樣的優勢呢？

李佳：最大的優勢是 AI，Google是一個 AI first 的公司，我們現在幾乎所有的產品都是 AI 賦能，其實是十幾年的產品的迭代以及對 AI 的理解，所以把我們帶到了這一步。在雲上面，我們想把很多很好的科技分享給更多的用戶，讓他們能夠創造很多更好的產品，所以雲目前是一個 AI 很好發揮的機會，AI 也是雲很好的一個優勢，我們非常想用 AI 作為戰略方向，來幫助普及 AI 的使用。

問：目前已經知道 AutoML 可以替代很多機器學習開發者的工作，但如果現在一個企業想使用 AutoML，那麼他還需要這方面的開發者嗎？如果需要開發者，他們做的任務會發生哪些變化？

李佳：這是一個很好的問題，但有一點我想糾正一下，AutoML 他是為開發者所打造的一個產品。目前來看，全球可能有100萬人有能力去開發機器學習的演算法，而根據我們的統計全球有大概2100萬的開發者可以使用這些 API 或者像 AutoML 這樣的產品。

實際上，我們發展 AutoML 就是把使用機器學習的門檻降低了，能夠讓更多的開發者或者對機器學習了解不多的人，更好的把產品發展起來，更好的把AI的技術運用起來，因為我們始終認為當所有人都可以使用 AI 的時候，它才是最有力量的。而現在是存在這樣的技術門檻，我們就是想把這個技術門檻降低，讓更多的人能使用的上。

由於有了像 AutoML 這樣的產品，或者將來會出現的各種各樣的 AI 產品，我看到的是會有更多的人能夠把這個技術能用起來，能夠創造去更多的機會。所以我反倒覺得這樣可能機會會變的更多，到那個時候就有更多懂行業、懂產品的人，能夠把他們的特長發揮到極致。

問：去年有兩個比較轟動的事件，一個是Facebook 的虛假新聞，另一個是 Google YouTube 里一個叫做艾沙門的事件。有一些兒童影片看起來色彩很鮮艷，但是裡面的內容其實比較暴力，不太適合兒童觀看。比較有意思的是 Facebook 、Google 以及今日頭條，他們目前選擇的方式是上線到近萬名的人工來審核這些內容。我的問題是：我們的機器學習演算法能夠在哪一些方式上改進這些機器審核，不再讓技術型的企業變成勞動密集型的產業。

李佳：實際上這種 Adversarial（對抗性）的行為是最難做的。因為機器的演算法是人設計的，他只是根據人的設定去進行工作。另外一邊是一些惡意去干擾機器演算法的人。目前來看，這還是一個非常活躍的研究領域，Google 內部成立了一個專門的團隊從研究的角度來解決類似偏見、隱私這類的問題。

另外一方面，確實也反映 AI 實際上處在一個非常初期的狀態，我們希望有更多的聰明人，把他們的聰明和才智用在好的方面，去創造更多正面的價值，而不是用來進行一些很惡意的行為。因為AI 其實只是一個工具，就像繩子一樣，你可以用它來做好的事情，也可以用它來做壞的事情，我們希望有更多的正面的人去做更多的正面的事。

問：是像殺毒軟體一樣，有惡意的攻擊，殺毒軟體就來進行應對？

李佳：有一點像這樣，我希望研究能夠進展到一定的程度，這樣能夠使人工方面和研究方面的任務都可以有所緩解。

問：李佳老師您好，最近AI晶元的話題比較火熱，就像雲伺服器晶元跟端智能晶元，而 Google 也有TPU晶元，您覺得AI晶元的熱潮是一種短時間？還是會長時間影響AI產業？

李佳：我覺得晶元代表的是算力，在我半年前的演講裡面提過，人工智慧有幾個支柱，包括：數據、演算法、算力以及人才。所以算力也是給我們帶來了很多的新的機會，包括像 learning to learn（學會學習）這種做 Neural ArchitectureSearch 的演算法，如果沒有大量的算力支撐，是無法辦到的。以前都是靠專家自己通過大量的調試，通過多年的經驗才能做到這樣的效果，現在因為算力的進步，我們看到了這些新的機會出現，所以晶元的進步對於 AI 來說一直都是一個非常正面的支持。

問：今天分享了很多AI+行業的話題，比如說教育以及醫療的，我想知道這些具體行業的選取標準是什麼？是 Google 的一個興趣？還是看到一些技術已經成熟了，可以能夠更好的進行結合，或者說這類的領域的需求度比較高？

李佳：我認為，做產品的話，通常是會關注用戶的需求和技術的發展去進行結合。而做研究就需要更大膽一些，我們會看到哪一領域出現的一些重要的問題，但是目前還沒有辦法來解決。我們就會選擇這些方面來進行探索，比如說像醫療這種很難啃的領域，實際上它也是需要更多的人來助力把這些事情做好。

問：當某一個零售行業要使用 AutoML 來做一個 AI 模型的時候，他在什麼場景下用？因為我知道現在做零售要 AI 軟硬體結合，AutoML 可能只是軟體方面，那硬體方面呢，需要如何與其他的硬體供應商進行配合？

李佳：零售方面大家都在考慮線上線下、軟硬結合的模式。就如我剛提到的例子，他是專門針對在商品圖片上面的分類。比如說在迪斯尼里，如果你需要找一個米老鼠或者是想找一個艾莎的照片，他們需要定製的模型才能夠實現你的需求。當然如果我們提到這種無人店，他對於機器學習和洞察力這樣的需求就更多了。

*文章為作者獨立觀點，不代表虎嗅網立場

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器學習 的精彩文章:

※機器學習、深度學習、神經網路、深度神經網路之間有何區別？
※AMD第二代Ryzen四月見 Vega轉攻機器學習和集顯

TAG:機器學習 |