對話Matt Zeiler: 也許Clarifai可以上演大衛和歌利亞的故事

科技 02-11

機器之心原創

機器之心（海外）編輯部

Matthew Zeiler，Clarifai 創始人兼首席執行官，機器學習博士，應用人工智慧（AI）領域的思想領袖先驅。Matt 在計算機視覺領域的開創性研究，與著名機器學習專家 Geoff Hinton 和 Yann LeCun 一起，將圖像識別行業從理論推向了現實世界。自 2013 年啟動 Clarifai 以來，Matt 將其屢獲殊榮的研究發展為開發人員友好型產品，使企業能夠快速無縫地將 AI 集成到他們的工作流程和客戶體驗中。今天，Clarifai 已成為領先的 AI 公司，並且「被廣泛認為是機器學習中擁擠、喧囂領域最有前途的初創公司之一。」（福布斯）

在這篇文章中，機器之心 (Synced) 與 Clarifai 創始人兼首席執行官 Matt Zeiler 開展了關於計算機視覺領域的最新進展以及展望 Clarifai 未來的談話。

（以下為對話原文，機器之心做了不改變原意的整理。）

根據您對過去一年的觀察，您覺得計算機視覺領域的趨勢是什麼？

大概始於 2017 年，到 2018 年，我認為在圖像生成方面出現了很多有趣的成果。我們看到了模型生成的非常逼真的內容，它的價值在於基於非常少的信息實現自動生成場景渲染。比如你可能只有分割掩碼，說這個區域有一條路，那裡有一輛車，那裡有一棵樹，然後模型可以渲染出很逼真的目標實例。你甚至可以將渲染圖像用作訓練數據，這是非常令人興奮的。因為你可以生成一堆數據，然後用它來教一個新的 AI 模型如何識別事物。

我們 Clarifai 非常熱衷的另一件事是在邊緣設備上運行這些 AI 模型，無論是在 iOS 或安卓設備或物聯網攝像頭，還是內部伺服器等移動設備上。無論客戶想要在哪裡運行 AI，我們都希望能夠實現。我們也觀察到了在 AI 領域中的其他人進行著類似的動作，他們圍繞壓縮模型進行了大量研究，使 AI 模型變得更高效，以便在以上這些類型的新處理器上運行。

在 2019 年，您對視覺識別技術和其相關應用的發展有何期望？

首先，邊緣計算將變得非常非常重要。到目前為止，人們一直在使用內置於設備中的 CPU 和 GPU。但是進入下一年，將會開始出現更多可用的專用硬體。我們實際上正在研究如何在為 AI 構建的特定專用硬體上運行應用，這些硬體只有非常低的功耗，並且實現了非常快的處理速度。

另外是，更聰明地將不同的數據類型融合在一起，不僅僅在圖像或視頻的像素上應用計算機視覺技術，而是將其與相關的其它類型數據融合在一起。如果你想搜索不同顏色的襯衫，顏色會是附加信號；或不同的袖長，這又是另一個附加信號；或者不同的價格範圍等。我們能否以整體的方式理解所有這些不同類型的數據，以便人們更好地理解和提取數據的價值？我認為這是我們所期待看到的趨勢。

您能總結一下 2018 年 Clarifai 的進步或突破嗎？

我們做了關於將計算邊緣化的一些工作。我們現在提供 iOS、安卓和內部的 SDK，因此我們可以在幾乎任何設備上運行，它們都能連接到我們的雲。我們的用戶界面可以管理客戶的數據和訓練模型，然後客戶就可以在任何需要的地方運行它們，這對客戶來說是一個巨大的增值。作為一個平台，它們可以無縫協同工作。

此外，我們已經啟動了一些構建目標檢測模型的工作，在上周推出了最新版本的人臉檢測模型。我們現在能看到的這些巨大飛躍，是因為我們正在收集越來越多的訓練數據和演算法，使模型變得非常準確。

與計算機視覺領域的其他核心企業相比，特別是在視覺搜索市場和圖像識別市場，您認為 Clarifai 的相對優勢是什麼？

讓平台變得無縫銜接實際上是一個小公司的一大優勢，不同的產品團隊實際上是彼此相鄰的。雖然我們的競爭對手比如谷歌、微軟、亞馬遜，它們非常龐大，因此很難協調來構建無縫銜接的平台。我們可以直接面向客戶解決他們想要在業務中遇到的問題，完成整個 pipeline 上的所有工作，包括收集更多訓練數據、標記數據、訓練模型，將模型部署到他們需要運行的任何地方，還可以隨著時間的推移對其進行迭代和改進。

2019 年 Clarifai 的主要關注點和計劃是什麼？

我認為有三個。一個是邊緣智能化，我喜歡稱之為 Smart X：智能家居、智能企業和智能商店等，這是一項物理世界中的計劃。

另一個是數字化洞察。在過去五年中，這是我們關注的重點：了解消費者的生活照片、旅行照片、地產信息等內容。我們將在搜索產品上加倍努力，真正從大量數字內容中獲取洞察力，將其切分並從中提取信息和價值。

最後一個是推動平台的採用。多年來，我們先從一刀切的模型開始，為旅行、婚禮、食品等這些特定的場景建立了一些應用模型。在我們開放平台以允許自定義分類模型後，用戶粘性確實得到了增長，開發人員和用戶的數量也得到了增長。因此，我們將在平台中啟動更多自定義，並開放更多平台。

一直以來，Clarifai 在計算機視覺領域的技術實力得到廣泛認可。去年，Clarifai 推出了增強型通用模型，這是你們迄今為止最智能、最多樣化、最強大的模型。您打算如何在現有技術和產品上進行創新？

這是我們通用模型公共版本的第五次迭代。我們正在收集越來越多的來自各種不同來源的訓練數據。其中一個非常重要的來源是我們實際的 API 流量，我們正在進行一些研究，以便能夠利用未標註的流量。它們是一些圖像或視頻，我們希望能夠對其進行自動學習，讓通用模型的下一個版本可以自己學習。有很多研究讓我感到非常興奮，因為人工智慧的聖杯其一是半監督或無監督學習，即不需要人類干預。我們現在從中獲得了一些非常有趣的研究結果，顯示出無需人類干涉即可出現的性能改進。

在技術上，Clarifai 需要克服哪些挑戰才能實現更好的性能？

總體上有兩個，數據方面的挑戰和演算法方面的挑戰。我認為演算法方面不太重要，說實話，因為研究界在發布新想法方面非常強大，而且這些想法大多數是演算法，因為正在進行的研究是針對固定大小的數據集。ImageNet 非常受歡迎，還有 COCO。這些類型的數據集非常適合研究社區，因為他們可以提出新的演算法思想，我們從中受益。演算法出現後，我們將它們放入我們的技術堆棧中並對其進行迭代，然後添加自己的想法使它們變得更好。這得益於整個研究社區和我們的研究團隊。

然後數據方面，我認為必須進行大量創新，以使用更少的數據也可以實現優秀性能。我們做的一件事是分類自定義訓練，允許新用戶進入一個平台，並且不需要一百萬張圖像就能從中獲得好處。訓練僅需少量數據，而且訓練不需要像平常那樣花費數周時間，只需幾秒鐘。對於人們來說，為他們自己的應用程序構建 AI 會是一個更快、更容易的過程。我們在數據方面和工程方面進行了大量研究才使其變得非常快，我認為這就是 Clarifai 能有獨特創新的原因。

您最近關注的技術有哪些？哪些工業應用方向是您最重視的呢？

我們已經考慮了許多關於區塊鏈和分散式網路以及隱私保護的問題，我認為這些非常重要，因為我們正在致力於邊緣計算。另外還有很多核心基本問題需要解決，才能使 Clarifai 這樣的產品真正有用。

其次，我一直很喜歡消費類電子產品，幾周前我們剛剛在拉斯維加斯的消費電子展 (CES) 上展示了我們在 Smart X 計劃中的一些新成果，例如實時運行安全攝像頭和運用熱點地圖識別人們在商店中的走動區域等。

您認為未來還有哪些其他新的技術方向是需要探索的呢？

五年前，我在紐約大學攻讀博士學位後創辦了 Clarifai，而我當時的博士學位是百分之百專註於圖像理解的。如今我們已經擴展到視頻方面，而從長遠來看，我還想擴展到音頻、文本和其他類型的數據。我認為開始做我之前提到的「對整體的理解」非常重要，這就是我看到的 Clarifai 的未來發展方向。

2018 年，AI 和計算機視覺技術侵犯人權和獲取私人信息的問題得到了人們的普遍關注，同時數據偏見仍然是困擾 AI 研究人員的挑戰之一。請問這對您的業務有何影響呢？

我認為其中非常重要的一點是人工智慧將在多個維度超越人類能力，如準確性、速度、可處理的數據規模以及作出更好和無偏見的判斷方面。圍繞人臉識別的許多爭論涉及執法等應用，例如運行帶偏見的分類器可能會導致判斷錯誤。

但你必須考慮到，今天在人類系統中每個人都有自己的偏見。他們感到疲倦，感到飢餓，感到壓力, 然而這些都不會發生在機器上。所以，隨著時間的推移，隨著我們收集越來越多的訓練數據，像 Clarifai 這樣專註於訓練模型的公司可以使模型做到與專家一樣無偏見，我們將把這些模型帶入真實世界，這與任何一個隨機選擇的執法人員相比，會產生更好的判斷力。從長遠來看，人工智慧會變得更好。我認為很多人不了解人工智慧在公共社會中的角色和意義，一旦你理解了，就能更好更容易地明白人工智慧應用的價值。

Clarifai 是否有中國合作夥伴或客戶呢？

有的，我們在中國有一些使用我們 API 的客戶。其中黃油相機（ByButter）就是其中比較大的一家客戶。實際上我從未與他們交談過，但從我的理解來看，他們是像 Instagram 那樣的應用程序，這個應用程序叫「ButterCam」。

對於這些消費者應用程序，有兩件事是我們可以幫助解決的。一個是組織內容上，在用戶上傳和創建內容時對其進行標記，以便其他用戶可以找到它；另一個重要的應用是內容節制。每當有用戶上傳內容時，你需要過濾掉類似裸體、毒品和武器這樣的東西，這些是我們可以幫助像 ByButter 這樣的公司做的事情。

你對三年後的 Clarifai 有何期待？

我們正在嘗試建立領先的人工智慧平台（正如我前面提到的那樣），擴展到其他數據類型，在邊緣設備上運行大量計算，並且真正面對強大的競爭對手——那些技術巨頭們。我們認為小型和初創公司有很多獨特的優勢，我們百分之百專註於人工智慧，而不像那些同時擁有零售店和其他一百個部門的大公司。

我想也許我們可以上演大衛和歌利亞的故事（David and Goliath），小麻雀也有大力量。