當前位置:
首頁 > 最新 > 阿里A.I.Labs王剛:找到合適的應用場景是實現AI商業化的關鍵

阿里A.I.Labs王剛:找到合適的應用場景是實現AI商業化的關鍵

原標題:阿里A.I. Labs王剛:找到合適的應用場景是實現AI商業化的關鍵

編者按:由中國人工智慧學會、阿里巴巴以&螞蟻金服聯合主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智慧大會(CCAI 2017)將於7月22-23日正式召開,屆時,阿里人工智慧實驗室傑出科學家王剛博士將分享人工智慧應用的前沿趨勢。在此之前,我們採訪了王剛。

在剛剛過去的6月份,阿里人工智慧實驗室迎來了成立一周年的紀念日。這是一個比阿里iDST還神秘的部門,業界鮮有人知道它的存在,直到日前實驗室首款終端產品天貓精靈X1的發布,這支神秘之師才正式成為鎂光燈下的焦點。

王剛博士今年3月加入阿里人工智慧實驗室,在此之前,他在南洋理工大學擔任副教授(終身教授),專註於深度學習的研究,是眾多轉投工業界的學術專家之一;加入阿里人工智慧實驗室後,他負責的是機器學習、自然語言理解,和計算機視覺等技術的研究以及落地。

阿里巴巴人工智慧實驗室研究員、傑出科學家 王剛

在王剛博士看來,即便身處學術界,在做學術研究的同時,也需要挖掘技術的經濟價值。事實上,早在南洋理工大學期間,王剛博士和其研究團隊就研發出了多款人工智慧商業化產品。「在學術界的時候我就對技術的商業化和落地非常感興趣。」王剛回憶道。但他深知,人工智慧產品要實現商業化必須要了解用戶,要找到合適的應用場景,同時要有好的用戶體驗也離不開數據的支撐,這些都是高校最匱乏的資源,這也是他選擇邁進工業界的主要原因。

採訪正文

加入阿里之前,您一直在學術領域,是什麼讓你選擇從學術界向工業界的角色轉變呢?

王剛:以前在學術界的時候我就對技術的商業化和落地非常感興趣,因為我覺得,我們做工程學科的研究人員,除了發論文,也應該要強調這種技術的經濟價值,讓技術轉化為產品。這和基礎學科的研究人員還是不太一樣的,他們更多的是探索未知的知識,而工程學科應該要為經濟和產品服務的。

所以我在南洋理工大學任教的時候就花了很多時間在做高新技術產業化的事情,比如2011年我帶領團隊做的時尚衣服搜索系統(CHIC Finder),這個產品上線比拍立淘還要早。當時我們做了很大的努力把這個產品推到市場上,但是我發現在學校很難有市場影響力。即使技術做得很好也不能很快的被用戶所知道。所以我就開始思考,是不是應該換一個平台做我感興趣的事情。

另一方面,人工智慧技術在近年取得了很大的進展。以前大家認為不能做的很多任務,現在我們都能夠用人工智慧技術來實現了。人工智慧已經處於一個從學術界到大眾爆發的一個零界點。基於這樣的考慮,我選擇加入了阿里巴巴。因為它了解消費者需要什麼,也知道如何把技術用最好的形式呈現給消費者。在這樣一個平台上去做人工智慧技術落地的事情,更容易獲得成功。

在南洋理工大學,您和您的團隊取得了哪些研究成果?

王剛:先說學術方面,我們在人工智慧最頂尖的期刊和會議上發了將近有一百篇文章,例如CVPR/ICCV/TPAMI等。這些文章在推進深度學習和計算機視覺研究上都做了較大貢獻。例如,我們改進了深度神經網路的設計機理:讓神經網路能根據具體應用場景更靈活,更高效地去處理複雜信息,從而提高學習的效果和效率,增加泛化能力。另外我們在語義理解和行為分析等前沿問題上也取得了較大進展,並建立了標準的資料庫為學術界和工業界所使用。

學術研究之外,我們還研發了很多商業化系統。除了剛才提到的圖像搜索系統,我們還做了藥片識別系統:護士發葯的時候可能會把葯發錯,這樣的失誤非常危險,而這個系統能夠根據藥品的表面的特徵,再通過攝像頭,識別出分發的藥片是否準確。另外我們還做過輔助駕駛系統,它能夠自動檢測前面的車輛、車距以及兩邊的車道。這三個系統都已經成功商業化了,目前已經轉讓給相關的公司進行進一步的產品的開發。

加入阿里之後您的工作有什麼變化?和之前在學術界最大的區別是什麼?

王剛:從加入阿里到現在,我主要的工作帶領演算法團隊實現人工智慧技術在天貓精靈X1智能音響上的落地,工作內容和在南洋理工大學期間的學術研究的區別還是挺大的。在學術界,我們考慮的主要是技術的前沿性以及潛力;但是把前沿技術轉化為產品,要考慮技術的魯棒性和可擴展性,也有很多技術細節需要去打磨。很慶幸我們有很多非常優秀的同事,他們在演算法和工程上的能力都很強,所以我們能克服落地過程中的很多困難,從而推出天貓精靈這樣在未來能改變人機交互方式的極具潛力的人工智慧產品。

雖然最近兩年人工智慧很火,但是有一個比較現實的一個問題:無論是學術機構,包括一些企業現在大多都還是處於研究的階段,您認為人工智慧實現商業化最大的挑戰是什麼?

王剛:無論是在學術界還是工業界,人工智慧最近的發展非常迅速。也可以看到在人工智慧商業化這個事情上,我們還是取得了非常大的進展的。像前文提到的我們已經發布的天貓精靈,能讓人機交互更自然,更輕鬆,更容易,這背後就是大量的人工智慧技術在支持。但是很多人工智慧機構確實遇到了商業化的難題,一個比較大的原因就是沒有找到合適的應用場景。細化一下,又有幾個可能的原因,例如不了解用戶真正的需求,不知道現在的技術的能力界限:能做什麼和不能做什麼,不知道怎麼用合適的產品形式把技術包裝起來。所以實現人工智慧商業化需要同時有優秀的產品團隊和技術團隊,兩者是缺一不可的。

人工智慧在技術上有哪些挑戰呢?

王剛:我們可以看到現在還是需要大量的訓練樣本去訓練深度學習系統。不過在很多領域我們很難找到這麼多的訓練數據。要想人工智慧取得進一步的發展,就需要去解決訓練樣本比較小(小數據),或者是沒有訓練樣本的問題。如果能把這個問題解決好,那麼人工智慧大規模的應用就到來了。我們實驗室在這個前沿性的問題上也進行了很多的探索。

實驗室已經發布了首款產品——天貓精靈X1,能否介紹一下這款產品的核心技術?

王剛:這是一款大眾消費級的語音終端產品,產品包含了很多人工智慧的核心技術,例如自動語音識別,自然語言理解,對話生成,TTS,知識圖譜,還有個性化的決策和執行等。

阿里人工智慧實驗室專註消費級產品,您認為雲上的人工智慧和終端人工智慧如何協同工作?

王剛:消費者只會在乎產品給他們的最終的智能的體驗,而不會特別關注人工智慧是在端上實現還是雲上實現的。所以我們做消費級智能終端也是很關注云端協作的。因為如果我們只依賴終端,就存在一個問題:終端的計算能力一般都比較弱,這就導致返回的結果可能不準確;另外,終端只植入本地的信息,它不知道其他的端的信息,其智能的判斷也不會特別完美。當然,在終端實現人工智慧也有優點,就是它沒有延遲,因為它不需要把數據傳到雲端:當數據是大量視頻流量數據時,傳輸到雲端就成為了瓶頸。

反之,雲端實現人工智慧會產生傳輸上的延遲,但是它又具有更強的處理能力,也能夠接觸到更多的信息。

因此,找到二者結合的平衡點才是關鍵。怎麼優化,怎麼能夠做好這樣的配置,取決於我們的應用場景。

關於這個月的CCAI大會,您對哪些話題比較感興趣?

王剛:這次大會應該會分享很多人工智慧落地的案例,我對這樣的話題比較感興趣。通過這些案例,我們可以知道人工智慧在目前這個階段在哪些領域創造了驚喜。這些人工智慧落地的經驗也會給我們自己產品的研髮帶來很多啟發。另外我也希望能看到在演算法方面的進展。

關於 CCAI

中國人工智慧大會(CCAI),由中國人工智慧學會發起,目前已成功舉辦兩屆,是中國國內級別最高、規模最大的人工智慧大會。秉承前兩屆大會宗旨,由中國人工智慧學會、阿里巴巴集團 & 螞蟻金服主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智慧大會(CCAI 2017)將於 7 月 22-23 日在杭州召開。

作為中國國內高規格、規模空前的人工智慧大會,本次大會由中國科學院院士、中國人工智慧學會副理事長譚鐵牛,阿里巴巴技術委員會主席王堅,香港科技大學計算機系主任、AAAI Fellow 楊強,螞蟻金服副總裁、首席數據科學家漆遠,南京大學教授、AAAI Fellow 周志華共同甄選出在人工智慧領域本年度海內外最值得關注的學術與研發進展,匯聚了超過 40 位頂級人工智慧專家,帶來 9 場權威主題報告,以及「語言智能與應用論壇」、「智能金融論壇」、「人工智慧科學與藝術論壇」、「人工智慧青年論壇」4 大專題論壇,屆時將有超過 2000 位人工智慧專業人士參與。

目前,大會8 折優惠門票正在火熱發售中,掃描火速搶票。

責任編輯:

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 安卓網 的精彩文章:

扎心了!3020毫安被稱續航最好手機,你會考慮嗎?
聯想Moto G5s Plus手機曝光 配備雙攝像頭
新浪動漫進軍北美市場,探路洛杉磯AX動漫展!
拍照新標杆海信新機H10來襲,2000萬大像素十級美顏
全球掉價最快的手機,一年半的時間,5000掉到1000

TAG:安卓網 |

您可能感興趣

這些資源你肯定需要!超全的GAN PyTorch+Keras實現集合
ASP.NET Core Web API下事件驅動型架構的實現(三):基於RabbitMQ的事件匯流排
FAIR聯合INRIA提出DensePose-RCNN,更好地實現人體姿態估計
AION創始人 Matthew Spoke:將碎片化的區塊鏈都結合起來,實現跨鏈交易
netty整合springMVC,實現高效的HTTP服務請求
DeepMind提出SPIRAL:使用強化對抗學習,實現會用畫筆的智能體
商湯聯合提出基於FPGA的快速Winograd演算法:實現FPGA之上最優的CNN表現與能耗
GAN的Keras 實現案例集合——Keras-GAN
用PyTorch實現Mask R-CNN
Redis-BitMap 「數據結構」可以實現對位的操作
小米Face ID供應商Mantis Vision:虛擬會議場景很快就會實現
阿里雲Overlay的SDN 實踐:架構設計與產品實現
Spring AOP 的實現機制
【專訪】小米Face ID供應商Mantis Vision:虛擬會議場景很快就會實現
流式處理:使用 Apache Kafka的Streams API 實現 Rabobank 的實時財務告警
FAIR最新視覺論文集錦:FPN,RetinaNet,Mask 和 Mask-X RCNN(含代碼實現)
與AMD合作,Premiere原生支持Radeon Pro SSG,實現更高效視頻製作
使用 AlignedReID 來實現行人重識別的具體應用指南
用TensorFlow 實現的模型集合
曾與阿里巴巴合作的iStaging宣布VR Marker應用實現街景運用