「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

新聞 07-25

【新智元招聘】AI 盛夏，星艦啟航。《新一代人工智慧發展規劃》發布之際，新智元也正式入駐融科資訊中心 B 座，整裝待發。天時地利，星辰大海，我們召喚你——新船員的加入！COO、總編、主筆、內容運營、客戶總監、客戶經理、視覺總監（兼職） 7 大職位招聘全新啟動。點擊文末閱讀原文查看詳情。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

智能終端與哪些技術息息相關？新一代的人機交互技術在其中扮演什麼角色？語音交互技術的挑戰何在？人工智慧下一階段的發展趨勢如何？智能家居中控應該給用戶提供什麼價值？把語音識別、麥克風陣列等各家的技術串在一起，就能做出理想的智能音箱了嗎？近期中國能否推出一種在市場上能夠形成主導地位的、或者至少被消費者所廣泛接受的音箱？

為了嘗試解答這些問題，新智元在和安卓綠色聯盟、中科院自動化所合辦的 6 月百人會閉門論壇上，邀請了多位學術和產業界專家，從技術、應用、難點、價值、商業模式、前景展望等多方面就人機交互與終端智慧化議題展開探討，力求使與會者對新一代人機交互的發展脈絡和趨勢有一個全方位的把握，並獲得一定啟發。

參與討論的專家包括（按專家發言順序排序，下文同）：

張寶峰，華為 CBG 軟體工程部 VP，終端智慧工程部部長

陶建華，中科院自動化所模式識別國家重點實驗室副主任

趙峰，海爾家電產業集團副總裁兼 CTO

孫富春，清華大學智能技術與系統國家重點實驗室副主任

黃偉，雲知聲聯合創始人兼 CEO

丁衣，物靈聯合創始人

程驫，微軟亞太研發集團創新孵化總監

百人會由新智元創始人楊靜女士擔任主持人。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

楊靜女士曾任法國陽獅集團實力傳播 (Zenith Media)媒體購買及諮詢副總監（2002-2010）、中國經濟網經營顧問（2010-2014）。2014年策劃主持了「奇點臨近」、「演算法帝國」、「大數據時代的社會人與機器人」等系列人工智慧、大數據主題研討會。2015年3月與機械工業出版社聯合主辦「新智能時代論壇」，受邀擔任2015年5月中國科協年會智能社會科技專家論壇、2015年機器人世界盃產業峰會、世界機器人大會「人工智慧開啟機器人新紀元」分論壇主持人。2015年9月創辦新智元，2016年3月出版專著《新智元機器+人類=超智能時代》，2016年10月聯合主辦世界人工智慧大會，並出版《中國人工智慧產業發展報告》。

在楊靜女士致歡迎辭後，華為 CBG 軟體工程部三方測試部部長、安卓綠色聯盟代表趙虹也致了熱情洋溢的歡迎辭。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

張寶峰：AI 嚇尿指數與終端智慧化未來的三大痛點

張寶峰，華為 CBG 軟體工程部 VP，終端智慧工程部部長，負責終端AI軟體的開發和交付。曾擔任華為諾亞方舟實驗室副主任，負責數據科學領域的中長期技術研究工作，研究方向為數據挖掘、機器學習和人工智慧。中國核高基專家組成員和中國 CCF 大數據專家委員會成員。

張寶峰 1998 年加入華為，在信息科技領域有超18年的工作經驗，有豐富的國際/國家標準組織活動經驗，曾任國際電信聯盟13研究組固定移動融合課題的報告人，中國通信標準化協會網路與交換技術工作委員會副組長。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

在 6 月百人會上，張寶峰詳解了終端智慧化未來的三大需求——理解用戶，主動服務，終生學習，以及三大痛點——端側智能，產品線實測，深度學習。他說：「對於手機終端智慧化的未來，我談談我的認知和理解，大家可以看看，哪些東西是對的，哪些是錯的。」也許，他的認知和理解，正是理解終端智慧化產業方向的一把鑰匙。這篇講話 + PPT 分享，可以點擊《 AI 嚇尿指數與終端智慧化未來的三大痛點》查看。

陶建華：語音交互技術會是移動終端很重要的接入手段之一

陶建華，博士，研究員，博士生導師。國家傑出青年基金獲得者。現任中科院自動化所模式識別國家重點實驗室副主任。1993年和1996年分別獲得南京大學電子系學士和碩士學位，2001年獲清華大學計算機系博士學位。他目前還擔任IEEE Trans. on Affective Computing Steering Committee Member、ISCA SIG-CSLP副主席、HUMAINE學會執行理事、中國計算機學會常務理事、中國人工智慧學會理事、中國中文信息學會理事、中國聲學學會理事、中重中文信息學會語言資源建設與管理工作委員會秘書長等職務。先後負責和參與國家級項目（863重點、國家自然科學基金、發改委、科技部國際合作）20餘項，多次擔任國家自然科學基金和863等國家項目會評專家。在SCI或EI期刊或會議上發表論文150餘篇，申請國內發明專利15項，國際專利1項，編著學術著作2部。研究成果多次在國內外重要學術會議上獲獎，兩次獲得北京市科技進步二等獎。在國內外著名的學術會議上擔任程序委員會委員或主席，包括ICPR，ACII，ICMI，IUS，ISCSLP，NCMMSC等等。他目前還擔任Journal on Multimodal User Interface 和International Journal on Synthetic Emotions編委。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

人工智慧 2.0 五大核心技術

在人工智慧這個大概念下，還有很多方向可以探索。

簡單回顧一下人工智慧的發展歷史，人工智慧技術歷史有過幾次高潮，也有過幾次低谷。2010 年以後，人工智慧技術跟深度神經網路結合，確實給我們帶來很大的機遇。尤其是近幾年，業內提的人工智慧 2.0 包含什麼樣的內涵？人工智慧 2.0 是基於重大變化的信息新環境和發展新目標的新一代人工智慧，包括新環境、新目標、可升級的新技術，研究對象也發生了很多變化。這裡面最重要的一點，大數據智能、跨媒體智能、自主智能、人機混合增強智能、群體智能，是未來發展很重要的工作，這些構成了人工智慧 2.0 五大核心技術。」

注意力機制、記憶能力、遷移學習、強化學習、半監督無監督學習是未來人工智慧技術發展的主要關注方向。現在我們主要看到的都是深度神經網路方法。我們認為在人工智慧技術未來的發展過程當中，很多新型的學習方法依然會得到很多關注，比如通用人工智慧技術，現在過去想都不敢想，現在可以初步進行一些探索。在有限的短時間內解決這個問題是很難的，但是可以進行初步的探索。

把問題展開來看，針對大數據的智能，是目前大家普遍比較關注的。尤其是在國家的戰略布局當中，把雲計算和大數據都作為一個獨立的方向來進行布局。這個相關工作很容易理解，尤其支撐著像智慧交通、智慧城市一系列的應用。

跨媒體智能是人工智慧技術方面新的研究內容。現在互聯網多媒體的數據越來越多。終端和雲端之間，很難說具體的界限在哪裡，越來越做更深層次的融合。文本、圖象、語音、視頻交互屬性將緊密混合在一起，構成跨媒體的特性。如何用語義相通的內容，把這個人不同的跨媒體信息更緊密地融合，這個是未來人工智慧當中需要著重解決的跨媒體智能的問題。這在互聯網應用，以及很多安全領域當中，都有很多的應用。

還有人機混合增強智能。未來人機之間的界限慢慢開始出現模糊。人機混合增強智能，一方可以增強人的本身能力，另一方面可以讓人和機器之間通過緊密配合實現更為高級的智能體。

群體智能方面，多種不同的智能體混合在一起，構建更高層面的群體智能，這方面將會成為新的關注點。

自主智能系統涉及到智能技術，有很多的工作需要去做。

從三大層面看人工智慧 2.0 大體的發展脈絡

人工智慧技術在人工智慧 2.0 中大體的發展脈絡，我們分成三個大的層面來看，一個是基礎支撐層面，第二是關鍵技術層面，第三是應用場景層面。

在基礎知識層面，包括構建的一切跟人工智慧技術相關的智能感測器、晶元，包括人工智慧方面，無論是深度學習的加速晶元，還是感知晶元——感知晶元是把常見的感知演算法固化到晶元裡面去，還有數據的資源以及軟體支撐的平台軟體系統構成的基礎支撐體系。

關鍵技術包括機器學習，機器學習裡面包括深度學習，我們現在認為深度學習已經是傳統的方法了。同時這裡面還包括了強化學習、對抗學習等等一切工作，還包括其它像視覺、語音、圖像、人機交互、大數據、雲計算等等關鍵技術的支撐。

在應用領域，可以看到，人工智慧不斷向不同的領域進行滲透，它的應用包括機器人、智能駕駛、無人機還有一系列可穿戴式設備的智能終端，最近普遍比較關注的是智慧醫療、智慧安防、智能金融、智能工業等等，人工智慧技術有可能會產生一些比較大的或者突破性的應用點。

智能終端相關技術——增強現實技術、三維聲場技術、語音交互技術

智能終端體現的形式非常多樣性，過去幾年時間，我們除了常見的、隨身攜帶的手機、PAD 之外，還有頭盔或者智能眼鏡。智能終端過去一段時間裡面國內外出貨量非常之大，市場非常大。從整個智能終端看，這幾年隨著智能技術的發展，已經呈現出爆發性的發展趨勢。新型的穿戴式智能終端正在快速發展，並且改變人們的生活。

增強現實技術

在智能終端裡面，有一些蠻有意思的應用，比如增強現實技術。目前我們認為，它在智能終端裡面，可能會成為重要應用之一。這個目的是什麼？我通過不同的穿戴式智能終端或者手機的智能終端，通過攝像頭的方式或者通過語音的方式，採集到周圍場景，疊加相應的信息。相應的信息構成對周圍場景不同的解釋，更有甚者可能利用這樣的場景圖片信息進行定位。大家覺得定位需要圖片信息嗎？通過 GPS 就可以了。其實可以在室內或者 GPS 不能覆蓋的地方，同樣可以通過圖片的方式進行定位。增強現實技術未來在終端裡面有很大的發展空間。

三維聲場生成技術

還有一個有意思的針對移動終端的工作，叫做三維聲場生成技術。我們過去用終端，經常有很多人騎自行車或走路時塞個耳機，聽的音樂都是立體聲，但是實際上說的立體聲並不是真正意義上的立體聲，只是左耳和右耳通過音量大小的控制來協調音效的表達，我們也把這種叫做立體聲，實際上它只是解決了一個平面聲場的問題。有沒有可能在聽音樂或者看影視節目的時候能夠產生真正的三維聲場，而且用一副耳機而不是環繞立體聲系統。環繞立體聲系統是在一個環境裡面布置了很多揚聲器，能夠產生這樣的效果，我就用一副耳機能否實現這樣的效果？這個也是蠻有意思的工作，這個工作我們已經做了相當不錯的 demo，可以把音樂、人聲根據人的360度範圍、包括上下左右前後都有比較好的區分，聽者感覺起來，是前面就在前面，是後面就在後面，跟普通的立體聲感覺很不一樣。

語音交互技術

過去我們一直都說，語音交互技術會是移動終端很重要的接入手段之一，我們現在主流的交互手段無外乎幾種方式，觸摸、鍵盤輸入、手寫、語音。語音交互這幾年發生了很多技術上的變化，語音技術無論從它的識別率還是周圍環境聲場對降噪的性能上，都達到非常好的能力，語音技術的接入越來越市場化。過去大家做語音降噪的時候，比較好的做法是，手機當中經常用多麥克風系統，能夠達到比較有效的硬體降噪。現在用深度學習的方法，完全可以用單麥克風就可以做到比較好的聲音降噪，人工智慧技術的發展解決了過去很多的問題，使得語音交互的技術變得越來越魯棒。

即便如此，我們還是有很多的工作沒有進一步去完成，今天提出來供大家思考。最典型的是三維聲場問題，三維聲場模擬人的耳朵，人的耳朵都是有耳廓的，耳廓絕對不是擺設，正是因為耳廓的存在才知道這個聲音是從前面來還是從後面來。三維聲場通過耳機構建了耳廓的模型，因人而異，每個人不一樣，個性化沒有得到很好的解決。

另外，在語音交互方面，剛才已經提到了，語音識別合成技術使得語音交互性能獲得很大的提高，仔細來看，這裡面還是有很多工作。說話人的聲音不能太自由，現在已經比過去稍微強了一點。雖然目前的語音識別系統能做到不錯的程度，但是被識別的聲音不能過於口語化；第二，個性化處理依然不夠強。多語言混合的語音識別也是一個很重要的難點。

從移動終端和人工智慧技術相結合角度的側面來看，人工智慧和移動終端實際包含的方面比較多。在這裡面，我們做了一定的初步探索，新的工作完全結合了深度學習以及大語料庫相結合的技術，才能把人機交互過程當中，人的更深層次的參數信息表徵出來或者生成出來，這裡面還有很多工作需要進一步去努力。

時間原因，不一一展開，今天的報告就到這裡。移動終端所做的工作，無論是增強現實、個性化三維聲場、情感語音交互，還是精確三維視覺交互融合在一起，都是未來移動終端發展蠻有意思的應用場景，不能說移動終端都必須具備這樣一些技術，但這的確是蠻有意思的應用場景。這裡面包括很多的工作，比如數據介面方面的工作。移動的終端，利用剛才所提到的語音交互、視覺交互，可以在智能家居和移動辦公場景方面產生很多用途。

孫富春：人工智慧是不是改變世界的「第三個蘋果」？

孫富春，清華大學計算機科學與技術系教授，博士生導師，清華大學校學術委員會委員，計算機科學與技術系學術委員會主任，智能技術與系統國家重點實驗室常務副主任。兼任擔任國家863計劃專家組成員，國家自然基金委重大研究計劃「視聽覺信息的認知計算」指導專家組成員，中國人工智慧學會認知系統與信息處理專業委員會主任，中國自動化學會認知計算與系統專業委員會主任，國際刊物《IEEE Trans. on Fuzzy Systems》，《IEEE Trans. on Systems, Man and Cybernetics: Systems》《Mechatronics》和《International Journal of Control, Automation, and Systems (IJCAS)》副主編或領域主編，國際刊物《Robotics and Autonumous Systems》和《International Journal of Computational Intelligence Systems》編委，國內刊物《中國科學：F輯》和《自動化學報》編委。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

人工智慧是不是改變世界的「第三個蘋果」？

尊敬的各位嘉賓，大家好！很感謝新智元給我這個交流機會，今天的題目是認知時代的人工智慧和機器人。大家將 2015 年定義成機器人的元年，後來我們又看到，有人說人工智慧的元年是 2016 年，這裡面 IBM 公司提出 2016 年是認知時代的開始。

未來五年裡面，影響人類社會最顯著的五個技術是什麼？2016 年是視覺、觸覺、嗅覺、味覺和聽覺。我們清華從六年前開始做視覺處理和聽覺方面的工作了。前幾天華為提出觸感時代。觸感是非常重要的，尤其在機器人的操作過程里。

網上購物時，物品的照片總有一個角度看是最好的。東西拿到手，發現它質地等各方面並不是太好，這就需要觸覺幫助。我們需要視覺來說話，更多是語義的理解。前面講到的可解釋，視覺是最重要的部分，人就是視覺的大腦。另外，還有聽覺和味覺。母親如何在小孩的聲音中聽出小孩的訴求？不到1 歲的小孩還不會講話，他語言表達的意思是如何被母親理解的？另外還有嗅覺，能夠聞出疾病等等方面。

過去人和家用電器也好，和物品之間是一個單向關係，好用不好用我自己試，加了智能化以後，形成智能機器，本身就具有認知能力，可以跟你交互，不光人理解機器，機器也要理解人。

昨天在天津電視台採訪龔克校長，我點評了一下，說認知時代的教育是雙向的，過去都是單向的，教育部制定大綱，如何學生考試不合格就不能畢業。智能化時代，大綱定的怎麼樣，幾十萬乃至幾百萬的學生學的情況的大數據分析可以評判出這個大綱定的對不對、好不好？認知時代的很多東西開始具有了智能，現在可以觸手可及，過去到餐廳吃飯停不了車，那你得在車裡等著，現在不用了，車就放在那兒，車載電子系統可以自動檢測到哪裡有車位，泊車自動過去。美女看到別人提的非常漂亮的包，可以打開網上搜索查找，這個包是哪兒的，質量怎麼樣。特別重要的一點，我去年在澳大利亞國立大學訪學，他們在盲人身上做了第一個人造視網膜實驗，盲人通過人造視網膜技術看到了物體的黑影。還有安防領域，每一個人從離開家到單位，進入北京地區的一類和二類攝像機，基本都會記錄在案，北京已經做到了車牌識別，你的車開到什麼地方天網系統應該都能檢測到的。前幾年，我們承擔了日本一家公司的多攝像機跟蹤課題，研製的系統可以跟蹤公司的員工，甚至把他們一年當中在大樓里的運動軌跡記錄下來，作為評判他的工作表現的一個指標。

為了戰爭很重要的是一個特點就是平台具有認知能力。如美國的蜂群無人機，他們使用的是非常小型化無人機，小型無人機的集結需要很強的通信和識別技術。

美國做的下一代新概念作戰武器，有非常強的認知能力。美國人工智慧主要是大公司在推動。其實「智能」這個詞是中國最早提出來的，荀子講「能有所合、謂之能，」認知能力是人固有的；「知有所合，謂之智」通過社會實踐，產生智慧，創新也是人固有的本能，人有所合，在社會實踐中產生才華，用認知能力去改造變革社會，這就是智能。

人工智慧的思想基礎很重要。怎麼判別機器有智能，我不多說了。第二個重要的是物質基礎，一個是計算機，一個是網路。最近 5G 的推出也為人工智慧下一步的發展奠定非常重要的基礎，人的記憶，特別是基於經驗的雲端學習沒有網路是不行的，包括美國的無人機之間的高速通信技術。如果按照一千美元的計算能力來講，那麼2040 年計算機超過人類。如果按照生物產品，每個記憶單元裡面所提供的浮點運算能力來講，機器很快就會超過人類。

人工智慧是不是改變世界的「第三個蘋果」？亞當和夏娃是改變世界的第一個蘋果，砸在牛頓頭上的蘋果是改變世界的第二個蘋果，圖靈桌子上的蘋果是改變社會的第三個蘋果。未來時代顯著的特點是人和機器共存，機器有智能，有認知能力，可以跟你交互，只有到這個時代，第三個蘋果的時代，人和機器的關係才是雙向的，過去都是單向的。

人工智慧下一階段的發展是是神經機制驅動的腦認知

人工智慧下一階段的發展是是神經機制驅動的腦認知。人是視覺大腦，從眼睛感知到最後 V1 區，直到 V4 區。

現在深度學習都是一層一層的，層與層之間沒有反向連接，視皮層裡面，同層之間有反向連接，利用這個機理改造深度學習網路就會出現大家意想不到的東西。我們實驗室的相關工作在四個數據集上做出比較好的結果。

強化學習。谷歌收購了 DeepMind，後來做了 AlphaGo，用的是深度學習和強化學習的原理估值採用的單次評判和估值網路的綜合評分。

另外，腦科學研究離不開儀器，美國哈佛大學使用的電子顯微鏡能做30納米的切片成像，老鼠在做遊戲的時候，通過掃描可以把切片做出來，看到神經元的放電，識別它的編碼。這些儀器對腦科學乃至未來人工智慧發展很重要。

最近這兩天超限學習比較熱。我做博士論文的時候，普遍認為神經網路是多層的，神經元的隱層參數是要學的。2013 年和 2015 年解剖學發現，這些隱層參數是人和動物與生俱來的，不用學。後來黃廣斌教授等人在這個基礎上，通過隨機產生的辦法設置隱層參數，提出了超限學習機方法，就是超限學習。這兩年這個工作在和多核學習、深度學習結合。

機器人的發展。過去機器人更多的是研究機器人的骨骼，現在的機器人不光要研究骨骼，還要有感測，肌肉驅動，以及有像人一樣的大腦，這樣的機器人稱為認知機器人，不光需要研究它的運動學、動力學的關係，還要研究感知信息怎麼感測的，多模態信息如何表徵與融合，如何讓肌肉運動產生各種複雜的操作。

人和機器的結合，類生命體機器人是很重要的概念，在細胞分子層面來研究類生命體材料，將來可能是癌症的剋星，將來可能在血管裡面攻克癌症。

2016 年 4 月份，機器人伴侶推出，引發了很多問題。

我們課題組也在做腦控機器人，通過腦控制的機器人可以在場外運動。

這是我們做的第三代皮膚狀態機器手。在今年的新加坡國際機器人與自動化大會上做了大會特邀報告，我們現在對人工皮膚的理解不是做一塊皮貼到受傷。而是像人手的手指一樣有表皮，還有真皮。表皮是電子式的，可以測量紋理、滑覺，真皮測量正壓力。在視觸覺編碼，包括他們的融合方面，也做了很多工作。

機器人發展依賴人工智慧的發展，人工智慧離不開生命科學和腦科學的發展，這三個之間已經形成了一個閉環。

機器人恰恰是展示人工智慧的載體，堪稱是黃金搭檔。情感和思考的能力，下一代機器人上都會有所體現，而推動它的就是人工智慧。過去有一個機器三原則，人工智慧發展到今天的時候，已經產生了某種恐懼，去年美國一百多名科學家在一起討論人工智慧未來發展，其中有一條很重要，人工智慧將來是不是會傷害人類？人工智慧必須有一個目標函數，要同人類社會的發展一起進化。

IBM 公司提出了人工智慧三原則：第一，和人工智慧系統建立互信關係，它要信任人；第二，透明度，了解人工智慧系統由什麼組成，究竟用什麼樣的參數學習；第三，人工智慧平台與行業內人員合作。這是未來很重要的方面。

人工智慧發展過程里，最可怕的是機器人產生自我意識，對意識的理解現在有各種各樣的觀點如記憶、量子糾纏和感知包。

人工智慧應該是機器人的靈魂，機器人是機器+人，人用什麼體現？人工智慧。隨著人工智慧的發展，機器也在不斷發展。人和機器人是兩個系統，人是生命系統，機器人叫人工系統，人工系統和生命系統在發展過程裡面總是在互相借鑒。人工系統是一個重要的實驗平台。兩個系統不斷發展，互相借鑒，總有一天會交互，交會的地方也許機器產生以我意識的時候。

弱人工智慧以大數據和深度學習為基礎，代表型的如 AlphaGo，缺點是高能耗和高資源，高度專業化，功能單一，AlphaGo 只能下圍棋，不能下象棋，它是就事論事面向特定場景、特定條件下的智能，不具有擴展性。

強人工智慧，具有人類思維特點的通用人工智慧。人在不完全信息下會推理會判斷，毛主席四渡赤水的時候，不像現在有很多的觀測工具和決策工具。毛主席當時四渡赤水為什麼那麼成功？首先他利用的根據對方指揮官指揮的行為特點，他的行為；第二他合理利用電報獲得局部信息，才成功指揮了四渡赤水。

商湯科技自主研發的深度學習框架 Parrots，在 ImageNet 的分類任務上做到了1207層，用了 26 個 GPU，難道還要做三千層五千層，用 200 個GPU嗎？肯定不是。深度學習也會犯錯誤，把熊貓識別錯了，但是人沒有這樣的問題。這中間很重要的問題就是結構信息，這些東西怎麼去挖掘？人有這方面的能力，這有待於腦科學的發展。

人工智慧產業，未來演算法產業和晶元產業很重要。

謝謝大家！

黃偉：麥克風陣列用 A，語音識別用 B，自然語音理解用 C，最後的產品就是一個笑話

黃偉博士：中科大博士，上海交大博士後，畢業後任職摩托羅拉中國研究中心資深研究員，期間開發出了世界第一款手機聲紋認證系統。後出任盛大創新院核心高管，並創建了語音分院。2013 年底加入國內人工智慧引領企業雲知聲任職首席執行官，負責雲知聲發展戰略和運營管理戰略規劃。自1999年起參與項目研究至今已獲得涉及醫療、管理信息系統、自然科學、語音、遊戲等多個領域的產品成就，例如在2002到 2004 年間參與美國國家標準技術署說話人識別評測（NIST SRE）項目獲SRE主任務第一名，並獲得當年最高的「金星獎」，也是現如今唯一一位能夠在 NIST 評測中連續兩年做 keynote speaker 的華人。獲 MIT TR35 2007 年度提名，2009 年獲上海市十佳科技創業領軍人才。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

今年人工智慧和去年不太一樣。去年，無論是媒體還是市場，大家更多關注的還是在PR 層面，經常會看到各個大小公司稱自己在某某評測上拿到 NO.1。今年大家基本不會再講這樣的故事，可能更多關注的是他的技術能夠創造哪些用戶價值以及商業價值。今天和前兩次人工智慧不太一樣，當時受限於條件，在很多方面能力不足，今天的人工智慧無論在聽覺、視覺，包括醫療、金融等場景下，已經表現出碾壓人的能力。三年後，全球範圍之內，人工智慧產業可能會達到千億美金的規模，中國市場是成長最快的。

智能家居中控應該給用戶提供什麼價值？

智能家居是人工智慧領域很重要的一個場景。智能家居包含的面非常廣，在房地產領域也是一樣，號稱跟智能相關的房地產項目，從2002 到 2016 年只有 16 個，去年一年和智能化相關的對外項目就接近了 60 個。

我們講到智能家居，不能忽視類似 echo 這樣的產品。它們天然具有智能中控的形態，而且毫無疑問，它們非常有可能成為家電環境里用戶信息的入口。對於這種趨勢，不同人可能有不同的觀點。一個觀點認為，用戶習慣不存在，中國很少有家庭喜歡聽音樂；另外一個觀點是說，我幹嗎通過音箱控制家電？我可以用手機控制。不過想想看，當你回到家，打開手機APP開關燈這個行為不傻嗎？

今天這種產品的量還不大，我第一份工作在摩托羅拉，我在摩托羅拉的六年見證了摩托羅拉和諾基亞如何從巨頭下滑，又見證了蘋果如何從不太大的公司成長為今天地球上市值最高的公司。

2007 年蘋果推出第一代手機的時候，全球銷量一百多萬台，去年 Echo 的銷量是五百多萬台。蘋果是怎麼把摩托羅拉和諾基亞顛覆掉的？很重要的一點是多點觸控，這種完全不一樣的交互形態，從最底層把摩托羅拉和諾基亞顛覆掉。

我需要通過音箱來聽音樂嗎？爭論的焦點不在這裡，是不是音箱不重要，只能說也許當時亞馬遜有音樂資源，所以選擇了音箱這種產品形態來承載它的雲端服務，比如Alexa。蘋果和谷歌用 APP 替換 URL 一樣，Alexa 用 skill 替換掉 APP，我相信這是趨勢，在座的人三年之後會看到它的實現。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

谷歌有Google Home，蘋果在今年發布了HomePod，國內也有跟進的公司。蘋手機果之所以成功是在用戶體驗上超越了以前的按鍵手機，APP之所以成功是體驗上超過了以前的 URL。智能中控應該給用戶提供什麼價值？它具備控制連接家裡智能設備的能力，這是最基本的，當不能連接不能控制的時候，再講其它的智能完全是空中樓閣。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

能夠成為家裡正常生活的助理，提供必要的基本的服務，有一些娛樂陪伴的功能，不光是工具化，還能擬人化，這是智能家居中控需要具備的幾個要點。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

智能音箱的技術挑戰

用什麼樣的交互能力來傳達這些價值？怎麼能夠讓用戶通過超越以前體驗的方式來感受這種價值傳遞？我們並不是說去手機化，去APP 化，而是應該在手機 APP 之外補充其它的交互能力。

這種設備應該不受空間的限制，它可能在離你有兩米、三米、四米、五米甚至更遠的地方，也能夠像人一樣隨時待機喚醒，做到遠場識別，用人和人之間的語言來交互。不光能聽到，還能聽懂，不光聽懂，還能把你想的東西給到你，這是傳遞客戶價值比較關鍵的點。

理想很豐滿，現實很骨感，相關技術很難實現，很少能見到讓用戶滿意的產品。我們拿到 Echo 之後，發現它比較死板，現實和我們的想法還是有很大差距的。前段時間網上有一篇文章，叫《十步，智能音箱從入門到放棄》。

當我們意識到我們願意嘗試 Alexa、度秘這種產品的時候，第一步 OK，第二步、第三步發現太難做了，對很多公司來說這是不可能的事情，只好放棄。

今天很多人已經用了語音輸入法，智能音箱不就是拿個音箱，接個SDK不就完了嗎？不是的，這裡面包含太多的技術環節，包括回聲消除、降噪、語音喚醒、語音識別，包括雲端識別，也包括低功耗的本地識別，根據用戶喜歡、用戶畫像、知識圖譜、推薦引擎包括整個對話邏輯以及最後用高表現力很自然的合成方式給用戶反饋出來，這裡面每個點都可以成就一篇非常偉大的博士論文。對公司來說，搞幾個博士點恐怕不是那麼簡單。

技術一定要端到端打通，我們提出 AI 集成化的概念。有很多的技術並不是孤立的，每個技術之間不是黑盒子，一定要深入打通才能得到最終比較好的體驗。

業內有人提出，在移動互聯網的今天，我們所說的 AI 產品經理，和以前的產品經理完全不一樣，今天的人工智慧產品經理一定要精通技術，知道每個技術的優點和缺點。不是光有演算法就夠了，還需要麥克風陣列技術等等，跟智能家居企業打通。正如之前我們都習慣了GUI，基於同一界面，GUI 怎麼設計，怎麼跟設備互動，邏輯怎麼設計？包括對接大量的第三方資源，歌曲的、音樂的、天氣的、股票的等等，每個環節都很難做，都很重要。智能音箱不是接一個訊飛或者語音 SDK 就OK了。

今天有很多人會想，語音識別用一家的技術，麥克風陣列用一家的技術，其它技術再選用一家，串起來不就可以了嗎？這個想法是不現實的。安靜環境下和家裡開著電視機的環境下，距離分別1米、3米、5米，科勝訊無論在安靜還是噪音環境下，無論1米、3米、5米，指標都很穩定。怎麼做到的？用不同廠商的麥克風陣列對接BAT 自己的識別引擎，科勝訊的「不好」非常穩定，只有百分之六十幾，懂行的人都能夠看出來。這說明科勝訊很穩定。但是科勝訊的技術不是為了識別做的，而是為了筆記本電腦上的通話質量做的，這種孤立的模塊完全不行。國內某些公司自己做了麥克風陣列，去對接BAT 的識別引擎，效果一樣差，甚至不如科勝訊。

我們再看一下訊飛做的或者雲知聲做的，我們很好地把麥克風陣列和 AI 技術端到端打通，性能指標上碾壓式地超越它們，所以說 AI 技術一定要晶元化。前不久國內廠商發布了音箱，還是傳統互聯網產品經理的思維，麥克風陣列用 A，語音識別用 B，自然語音理解用 C，最後的產品就是一個笑話。最後的產品會讓你崩潰。只要音箱一放音樂，2米之外要靠吼；放音樂的話，1米半以內基本喚不醒或者喚醒率最多5%、10%。把A、B、C 三個廠商的技術捏在一起，後果就是這樣。

我們提出中控解決方案 Pandora，希望解決現在講的這些困境，把麥克風陣列技術、AI技術等所有的技術端到端打通，解決前面說的行業問題。我們集成了4MIC 陣列降噪，5米遠場語音識別，繼承了 Echo、Google Home、HomePod 等音箱的特點，同時具備了很多它們沒有的特點。除了智能化服務之外，還有一個很重要的技能——連接控制家裡面所有設備時，我們對這些設備有一個最基本的要求就是速度。試想家裡一個空調搖控器，按一下按紐，一兩秒鐘才反應，你不知道按了之後有沒有反應，也許連著三下，最後也不知道開還是關了，按一下沒反應，再按一下不知道那個狀態是開還是關。一個機器人，也許它有非常強大的雲端智能能力，但是反應特別遲鈍，怎麼辦？它一定會讓用戶崩潰。我們提出一定要具備第一點，Pandora的所有系統通過雲端提供認知和智能服務，同時支持終端的AI交互，以及在晶元終端感知和本地智能。

支撐 Pandora 的技術，第一是快。多快？閃電一樣快。我們 Pandora 實現的技術能力喚醒時間小於 0.3秒。雲端響應速度小於 1 秒。不光是說識別的反應速度，也包括一系列環節，包括雲端識別，包括理解，包括知識圖譜，包括服務召回，必須要真的從互聯網產品經理的角度來打磨這個技術。

第二，准。要能非常準確地理解用戶在說什麼。實際上到今天為止，影響我們很多產品落地的一個很重要的原因，是很多技術指標只能局限於實驗室環境裡面，它可以拿標準的資料庫跑到97%、98%的準確率，但在工業環境裡面卻一點價值都沒有。

除了距離遠之外，口音也是個大挑戰。雲知聲今天憑藉麥克風陣列和識別技術，能做到成為國內工業界唯一量產出貨的廠商，沒有之一，是唯一。無論跟國內哪一家廠商PK，我們唯一能做到，直接找帶有口音的被測試人過來，不需要培訓，不用教他怎麼說，因為用戶本身不知道怎麼說；第二，他會直接把空調的風量開到最大。第三，直接說方言。產品開發的時候會遇到很多困難，產品想要量產的話，方言必須要解決。

工業量產還有一個很重要的指標是省。很多公司團隊做一些PR 產品，性能還可以，上來搞一個 4 核CPU，幾個 G 的內存，無法量產。雲知聲提出來一個觀點——一定要省。最低主頻低於 100兆；第二，內存小於 100K 位元組。

還有一件重要的事情是穩。你在家裡睡著了，音箱突然給你講鬼故事，這樣的產品是絕對不行的。要做到你叫它的時候它一定會答應你，不叫的時候絕對不答應。

用戶也可以與我們的設備保持多輪對話，並在交互中隨時打斷，設備都可以靈活應對，實現如水般順暢的流式交互。除了多輪對話，今年系統又放入了百科知識，機器人不僅是助理還是專家，對用戶有更深入的理解和掌握。它會在使用過程中不斷學習你了解你。我們的設備還有男聲女聲和童聲，哪怕只有10分鐘的數據都可以生成高表現力的聲音。

通過中控方案，即使中控設備本身沒有屏幕，也可以把家裡所有屏幕都用起來，做到流式對話，讓所有的用戶行為習慣在各個設備之間無縫流動。我們的方案把所有合作夥伴的周期壓縮到6個月以內，而且各個設備都可以使用。

丁衣：很多機器人產品把邊界過度放大，這不會帶來真正的銷售和口碑變化

丁衣，前極路由、大街網的聯合創始人。在品牌營銷和渠道銷售方面擁有豐富的經驗和洞察。目前，負責物靈整體的市場銷售和運營體系，致力於塑造一個世界級的靈性品牌，讓物靈的產品走向世界各地。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

物靈科技是一個新創立的人工智慧科技公司，是由上市公司東方網力投資的，我們的定位非常清楚，就是做消費者品牌，做消費者產品，而產品主要是人工智慧的機器人產品。

我們非常重視產品定義，做好交互和體驗，這個對我們來講非常重要。現在所有的消費者智能類的產品，除了 Echo，銷量都不好。而我們要根據場景和需求來細化產品定義，做有實際價值的產品。現在市面上很多機器人產品把邊界過度放大，對消費者來講，提高了消費者的期望值，拿到以後，落差非常大，不會帶來真正的銷售和口碑變化。所以，我們認為如何定義產品本身和控制消費者預期很重要。

人目前都是通過機器來對接信息流和服務流的，這是通過人和設備之間的交互完成，我們的核心技術會專註在人機交互這件事情。最終的智慧來自於人和機器的共生的能力，共同進化，我們希望交互的方式從鍵盤到滑鼠 GUI 時代，再到 touch 時代，再到現在並沒有完全定下來的 BCI。大部分人現在會沉浸在 touch 終端。所有注意力都在屏幕上，而我們要做的設備是靜默式環繞式的設備，這將是一種無處不在的智能化和計算力。

對於服務於家庭的機器人來說，家庭裡面的兩類人群——成年人和未成年人——認知方式和語言體系完全不一樣。我們分成年人的產品和未成年人的產品。我們對產品的具體使用場景、具體功能產品的定義做了很強硬的限定，這樣現在的 AI 技術邊界不會達不到。最近我們正在招募我們第一款產品的天使用戶，是一款兒童閱讀養成機器人Luka，用計算機視覺技術可以讀市面上的繪本書，在京東上正在預約，大家可以去了解下。

另外，我們聯合了國內的三家上市公司、一家基金還有三家 AI 初創公司一起成立了萬象人工智慧研究院，希望把底層的演算法和技術能夠跟產業直接對應，研究員一開始研究的時候就知道誰來用，怎麼用。我們的研究院是基金模式的，並且是全球化運營，緊密連接產業的。

我們物靈科技的新 Office 在望京的浦項中心頂層，還配備了專業的咖啡館，可以進行百人左右的發布會，風景非常好，希望做成人工智慧消費級品牌的體驗廳、展示廳和大家聚會的場所，歡迎下次新智元的百人會來我們新的 Office 舉辦。

Panel：對現有智能音箱產品的分析，及對國內智能音箱市場的展望

楊靜：今天我們Panel 的主題是《對現有智能音箱產品的分析，及對國內智能音箱市場的展望》。6 月初的蘋果開發者大會上，智能音箱 Apple Homepod 面世，成為亞馬遜 Echo 和谷歌 Home 的勁敵。包括海爾在內的國內多家廠商也已經或者即將於近期推出自己的智能音箱，BAT也有意或已經入局。戰局背後，是人機交互技術發展的驅動和市場對新一代人機交互界面的真實需求。更自然的人機交互方式是智能時代的重要特徵之一。以語音識別、語義分析、視覺獲取、上下文感知、VR 等等技術為內核的新一代人機交互界面，將成為智能家居、自動駕駛等終端智慧化應用場景下直接決定用戶體驗的關鍵模塊。今天想請在座的各位專家聊一聊，智能音箱的技術挑戰在哪裡？中國的智能音箱中，有沒有哪款能做到接近 Echo 的水準？近期中國能否推出一種在市場上能夠形成主導地位的、或者至少被消費者所廣泛接受的音箱？我們首先有請張寶峰部長給我們分享一下。

張寶峰：家庭裡面會存在一個智能入口，在未來的發展里，這是毫無疑問的。Facebook 最新開發了賈維斯，也是一樣的效果，交互是不是以音箱的形態出現，不一定。非常重要的事情是約束場景。我看過 Echo 的調研，有幾個 TOP 應用，比如聽音樂、設鬧鐘，有些應用使用的比例非常低。我們到底是做廣做全，還是真正做出特定價值？這是非常值得思考的問題。

楊靜：趙峰總有沒有看好的產品？

趙峰博士，海爾家電產業集團副總裁兼CTO，曾擔任微軟亞洲研究院常務副院長，主要負責物聯網、大數據、計算機系統及網路等領域的研發工作。趙峰博士畢業於麻省理工學院 (MIT) 計算機系及人工智慧實驗室，曾在位於矽谷的Xerox PARC擔任首席科學家，創立了該中心的感測器網路研究，並先後任教於美國俄亥俄州立大學和斯坦福大學。趙博士是美國電機電子工程師學會IEEE Fellow，撰寫了物聯網領域第一本專著《Wireless Sensor Networks》，被多所美國大學選為教科書。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

趙峰：對智能音箱來說，實際上更重要的是背後的語音助手。大家接下來更需要關注的，是智能音箱背後整個語音服務生態體系，它的硬體展現方式可能是在音箱上，但我認為，家裡任何一個智能硬體都可以當成入口，智能音箱這個概念需要泛化，而不是簡單的音箱形態。

現在大家對人工智慧的期望遠遠高於技術能夠實現和提供給用戶的體驗，這一點我非常擔心。看了楊靜總關於 2016 年人工智慧的調研報告，裡面講到人工智慧三起三落，我希望這次第三次不要再落下去。前面人工智慧三起二落，第一波是剛開始的符號運算專家系統，第二波是神經網路，那時候沒有大規模運算和數據的支撐，大家的期望值和現實之間產生了落差。這次第三波不一樣，基於深度學習，大數據和大規模計算，語音識別和圖像識別在有些領域已經能夠達到體驗上的一個閾值，大家能夠接受這樣的體驗。以前不能達到這個閾值，十句話裡面有三句話計算機是識別錯的，大家感覺就非常差。在泛化的人工智慧中，特別是沒有限制的對話當中，要能夠非常流暢地像人一樣自然交互，現在還不能做到。我們要聚焦在幾個垂直領域，把體驗做好。比如在家庭場景里，把用戶體驗真正做到極致，使對話能夠流暢，不管是連續說，還是多輪對話，還是背後知識庫的支持，都能夠建全，用戶能真正得到她需要的服務。如果現在想做一個類人機器人，追求什麼都懂，知識面像人一樣全面，現在還沒到那個技術水平，而且還會把人工智慧帶入死胡同，我不希望看到那個第三個「落」出現。大家的期望是，在現階段把智能音箱體驗做好，領域更聚焦一點，滿足用戶的剛需。聽音樂是剛需，智慧生活、智慧家庭里音箱作為用戶交互人口，作為智慧家庭一個中控，和各種智能硬體互聯互通，通過交互獲取服務，也是一個剛需。但如果短期內期望值無限高的話，對整個業界的持續發展實際上是負面的。

我就說這兩點，第一是智能音箱更重要的是背後的語音助手，可以在音箱上展現，也可以在冰箱或電視上展現；第二是現階段需要提升用戶體驗。

楊靜：雖然看起來有點慢，但是智能音箱的確都在進步。請孫富春教授給我們預言一下，哪個智能音箱您比較看好？

孫富春：認知時代離不開語音的交互，一談語音交互就是智能音箱，有非常清晰的理解，將來的市場非常大。現在教育一個最大的變化就是，未來的書已經不是我們掌上的電子書，不是大家在計算機裡面看到的電子書，未來電子書一定是多媒體，要激發大腦的各種感知皮層形成共享效應，這樣在多媒體環境下，學習效率將大幅度提高。另一方面，好的樂曲如果在電視裡面放出來已經失真了，如果能跟音樂完美結合，那是非常美好的一件事情。詩歌朗誦如果用手機去放，丟掉很多東西，如果有非常好的音箱展示，那感受會變得更加美好。借用一句話，人工智慧使我們的未來更加美好，使我們的生活更加美好，音箱在此是不可或缺的。包括筆記本內的音箱，我希望它將來越來越逼真，越來越好，有立體感。分散式音箱不光是一面有，可能是立體的幾面都有，美妙的聲音能夠給我們留下深刻印象，使我們一天生活充滿陽光。

楊靜：群友提出了一個切中要害的問題，現在各個巨頭都推出了自己的生態平台，讓創業公司不好站隊。比如開發演算法，一會兒在這個平台，一會兒在那個平台，浪費精力，而且這也涉及到上下游的硬體或者銷售等等問題。現在大家都在疑惑，加入哪個更好？

孫富春：音箱是一個硬體，需要軟體的支撐，經過軟體處理的聲音將更加美妙。也可能同共享單車一樣，需要背後騰訊或者阿里巴巴的支持。國內人工智慧的大公司就是 BAT，國外就是谷歌、微軟、Facebook，國內這些大公司在人工智慧應用方面起了非常重要的作用。這幾個巨頭應該是不相上下，下一步誰能給我們帶來最美妙的享受我們就支持誰。

楊靜：黃偉，你能不能更尖銳一點，更堅決一點，說一下哪個更好一點。你也是創業公司，如果將來必須要對平台做出選擇的話，你覺得哪個更靠譜一點？

黃偉：這是創業公司很可能面臨的選擇，這個問題不是需要雙向選擇的。我覺得BAT都有很大的機會，我更看重誰有數據，技術的要素對最後的成功不是最重要的。相信BAT 有足夠的資源吸引一流人才，包括我09年從傳統的IT企業去互聯網公司，余凱去百度更晚，在之前這些BAT互聯網巨頭裡面找不出幾個博士，基本是個位數，後來很多人說老黃當時怎麼沒去BAT？那時候沒有BAT，那時候是SBAT，盛大最牛，我去的盛大。盛大全公司的博士當時不一定有五個人，那時候的互聯網公司更強調運營。今天可以看到有很多一流的科學家都在互聯網公司裡面，人才技術對他們來說不是最重要的瓶頸。當然還有一些問題，比如公司的基因能不能用好這些人。

數據的成本獲取是最高的，看BAT或者哪家公司的原有業務數據大一些，誰的概率就更大一些。音箱是聽音樂的，還需要音樂資源，那就是騰訊吧。亞馬遜做音箱可能很偶然，當時亞馬遜有音樂資源，所以做了音箱，這個音箱先用資源打通，但是光有音樂，Echo也沒有成功，從幾十萬銷量到一百萬銷量。把Echo和亞馬遜商城打通，這些產品才是最成功的。作為創業公司，前面給大家展示的是目前階段行業比較酷炫的技術，我們沒有做單品，我們做方案。

楊靜：智能家居裡面，作為中控的智能音箱和其它智能家電設備通信問題的最優解決方案是什麼？比如海爾有很多家電，中控是怎麼跟它們通信的，用什麼語言交流？

黃偉：這是行業裡面很難克服的問題。行業裡面有三股勢力，三國混戰。一個是BAT，有資源，也許會往下走，BAT也會做音箱，從上面往下走；還有一個是設備廠商，像格力、海爾，往上走，做 U+ 等等；第三個是創業公司。這裡面存在很大的問題，我的產品非常好，我能控制窗帘開關，弄一個紅外開關就可以了，但是我控制不了格力空調多少度，他們沒有開放介面給我。這裡面又出現博弈，用戶量多了之後也許各方會坐下來談，會有一個類似 WiFi 藍牙標準協議，使得我們可以互聯互通。如果這個標準沒有的話，其實智能中控是實現不了的。他說的我能聽到，我能聽懂，但是無能為力。我想把空調設到 26 度，不好意思，格力不理我。

楊靜：程總，請您點評幾句？

程驫博士，微軟亞太研發集團創新孵化總監，負責集團新產品、新項目在中國的孵化和落地。程博士擁有計算機科學專業的武漢大學學士，中國科學院自動化研究所碩士以及美國紐約州立大學布法羅校區博士學位。博士畢業後到美國矽谷工作十五年，先後加入兩家初創公司以及在甲骨文（Oracle）公司總部負責大數據及商務智能產品開發十年。2010年回到中國，加入微軟亞太研發集團。

「新智元百人會」七高手縱論人機交互與終端智慧化現狀與痛點

程驫：先說兩句題外話，今天上午才知道有這個活動，看見上次12月份在新智元一起分享的趙峰總和黃偉總在名單上，我想過來聽聽。另外，自動化所是我的母校，我碩士在這兒畢業，有一種回家的感覺。

相對於其他公司，微軟採取的是不同的方式。今年五月份微軟 BUILD 大會之前，微軟正式宣布了和國際頂級音響製造商哈曼卡頓（Harman Kardon）合作開發 Cortana 智能音箱的計劃。雙方合作的這款音箱名叫 Invoke，同時具備哈曼卡頓極致的音響效果及 Cortana 的智能，可以用來實現播放音樂、管理日曆和活動、設置提醒、檢查交通狀況以及推送最新新聞等功能，還可以作為智能家居的控制入口對家用電器進行控制，例如熄滅燈光或控制溫度。從設計上看，Invoke 音箱的頂部有 Cortana 的藍色光環，支持 360 度聲音外放，而跟其它智能音箱相比的最大亮點就是能夠繼承 Skype 互聯網電話服務，能隨時進行語音對話和參加電話會議；所以，Invoke主要針對為工作競爭及家庭需求而忙碌的客戶群體。Invoke 配備了哈曼的遠場語音識別技術，音箱嵌入了 7 個麥克風，採用了哈曼的波束形成、回聲消除和降噪演算法，使其即使在高噪音環境中也能識別語音命令，從而完成語音任務。我非常期待它的早日上市。

楊靜：國內的BAT您看好哪家？

程驫：我覺得都有機會吧。誰做好應用場景、誰掌握好數據，誰就會成為贏家。

楊靜：今天的新智元百人會 6 月閉門論壇到此告一段落，我們期待 7 月份再次相聚，6 月 30 號新智元微信公眾號的訂閱戶超過 19 萬，7 月中旬我們就會搬到新家，新址位於融科資訊中心 B 座谷歌中國的樓上，謝謝大家今天的蒞臨，特別感謝幾位講者的分享。

* 本文為新智元原創報道，未經授權請勿轉載。

點擊閱讀原文可查看職位詳情，期待你的加入~

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※「騰訊優圖首度開源深度學習框架ncnn」主打手機端，同類cpu框架最快
※「谷歌升級ImageNet」大規模視覺理解競賽WebVision冠軍分享｜新智元CVPR-17專題
※騰訊首度開源手機端深度學習框架ncnn，同類cpu框架最快
※新智元百人會：七高手縱論人機交互與終端智慧化現狀與痛點
※谷歌官方CVPR最強總結：5位主席21篇論文，最關注數據

TAG:新智元 |

您可能感興趣

※人機交互，機器的終極智慧
※德國人形機器人手拿「結霜槍」做曲奇餅！人類與高度複雜機器人交互新方式
※交互新人之靈魂拷問
※手勢識別成人機交互新趨勢
※人機交互的大革命，人工智慧平台再掀熱潮
※智能語音技術助力，推進人機交互新時代
※蘋果將研發懸浮手勢，人機交互歷史新革命
※奔向可控的智能化！無人機人機交互的挑戰與前沿
※以人車交互體驗為核心蘑菇智行打造智能網聯新生活
※人機交互未來新趨勢腦電波手勢控制機器人
※智能人機交互驅動機器人產業發展
※華為開發人工智慧語音助手支持情感交互
※人工智慧時代，看英飛凌如何創新人機交互方式！
※華為智慧屏戰略解讀打造家庭智慧娛樂交互新場景
※智能語音交互技術，讓人工智慧智慧家庭解決方案更加順暢！
※劉慈欣談人機交互：機器很可能會把人「寵壞」
※「人機自然交互技術」的趨勢與挑戰
※智能交互革新體驗！海美迪視聽機器人圖賞
※新可視化工具使在線發表更具交互性再現性
※齊悟：做好語音交互技術，讓機器人不再當人工智障