雲知聲黃偉:面向AIoT時代,我們為什麼必須要做晶元?
編輯 | 黑智
整理 | 王妍
7月6日消息,由創業黑馬主辦的「2018中國獨角獸峰會」今日在京舉行,雲知聲CEO黃偉出席活動並發表主題演講。
黃偉在演講中表示,我們雖然進入到IoT時代,有一個可以預見的美好未來,但是離真正落地,還有很多現實問題需要解決。其中晶元在整個IoT的進化過程中起著非常重要的作用。獲得了C 輪1 億美金融資後,不久前雲知聲推出了自研的物聯網AI 晶元「雨燕」。
談及AI晶元的製造,黃偉認為只有具備全棧式的AI技術能力、已經經過驗證的、成熟的業務場景和一定的晶元設計能力,三者結合在一起,才有可能真正的研發出一顆有競爭力的晶元。
以下為經i黑馬&黑智編輯過的演講節選:
互聯網發展不同時代
我有幸經歷過中國互聯網發展的前兩個階段。上大學時我第一次接觸PC,第一次上網是畢業前去網吧,那時候打開一個網頁需要幾分鐘,上網一個小時需要10塊錢,差不多是我兩天的生活費。2009年我離開服務了六年的公司摩托羅拉,加入盛大網路,從學生到工程師,完成了我人生的第一個轉變。那是中國PC互聯網的一個高峰。
緊接著從2010年開始,我們經歷了中國從PC互聯網到Mobile時代。我們看到中國第一代互聯網公司的市值從10億美金左右,翻到Mobile時代的阿里、騰訊的幾千億美金。我們也經歷了蘋果從一個80億美金的市值,到今天為止也成長為大幾千億美金的公司。
這期間發生了什麼?以前全球只有幾億台的設備數量,到現在每個人有一台手機、Pad,可能有幾十億台移動聯網設備。以前我們只能在辦公室、家,甚至只能在網吧上網、打遊戲,今天我們坐在馬桶上就可以完成一個遊戲的支付,這種設備數量以及移動的發展,使得今天我們整個生活方式和社會組織方式都發生了深刻的變革。
今天在發生什麼?我們又開始從Mobile時代開始進入IoT時代,它不再局限於手機、平板,比如像前面暴風馮總介紹的,TV也可以上網、互動。甚至你們家的燈泡、音箱都是你跟這個數字世界進行交互的一個介面。
我們也不再只是通過手機的按鍵輸入,而是完全可以直接說話,可以對著攝像頭做出一些交互的操作。從一個數控時代,開始進入到包括了語音、手勢、體感等多模態的交互的任意場景。當然和以前相比,設備數量可能會更大,我們相信這個地球上很快會誕生萬億美金的公司,即使在今天有中美貿易戰的情況下,這種趨勢還是不可逆轉的。
IoT時代的機遇與「雲端芯」落地
首先,功能會更加智能化,不再只是通過手、嘴巴、眼睛等等。其次,場景化會更加豐富,不光在家、辦公室、汽車等任一場景,我們都能夠跟這個世界進行交互,當然設備也變得更加多元化。
我們描述了一個非常美好、偉大的未來,但是離真正落地,還有很多現實問題需要解決。首先我們今天的技術怎麼實現一種自然的交互?怎麼能在這些場景裡面滿足用戶的體驗?因為每個場景必然的獨特屬性,我們能不能在這個場景里做非常好的適配?這些產品並非靜止,也不是交付到用戶手裡這個過程就結束了,我們如何運營、提升用戶體驗?
另一個很大的不同是價格。手機、平板動輒幾千塊錢以上,IoT設備本身是幾百塊或者是一千塊錢左右,你怎麼樣用一種用戶能夠接受的方案成本交付給你的客戶?當然還有周期,怎麼能夠用更快的時間、效率交付給客戶?這都是我們今天在講IoT想要落地,擺在眼前的幾個困難。
2014年初,我們第一次對外提出「雲端芯」一體化的解決方案。因為我們相信人工智慧絕對不只是發生在雲端,除此之外,一定有邊緣智能,而且想要滲入到每個場景,對端一定會提出很多個性化的需求。所以,我們希望通過雲端來解決智能終端的一些智能化、場景化的問題。當然我們也希望通過晶元,能夠加速AI落地的問題。
前面松鼠AI智適應教育創始人栗浩洋講他在2014年融資非常困難,其實我相信在中國所有技術創業的團隊一開始都會遇到這種問題。因為2012年、2013年,那時候的資本都在投APP、產品創新,沒有人去投技術。所以很早之前,當我們說人工智慧離不開晶元的時候,也遇到很多挑戰和置疑,大家不認為晶元非常非常重要。甚至我記得在2016年,中國有很多資本在國外收購晶元公司,我們說晶元是高端製造業,晶元是西洋產業,但今天我們會發現沒有晶元我們什麼都不是。
今天回過頭來看,人工智慧真正落地,它的痛點是在哪裡?沒有英偉達就沒有深度學習,沒有英偉達提供的GPU,我們不可能開發出非常複雜的深度學習網路,沒有一些低成本、低功耗的晶元,我們不可能賦予智能設備一些本地職能能力,所以晶元在整個IoT的進化過程中起著非常重要的作用。
在我們的認知里,AIoT的擴基點在於晶元,首先在於場景的選擇。因為IoT有很多場景,選擇就變得非常有技巧,哪些場景是用戶真正需要的,哪些場景是今天我們的技術能力滿足需要的。
第二,有了場景以後,我們就知道這個場景需要什麼能力,我們應該提供什麼樣的晶元,當然有了晶元以後其實我們可以加速AI在這個場景里落地,其實他是一種正向的循環。AI晶元也並不是說今天有PPT,明天晶元就能做出來,或者說今天開個發布會,6月以後我的晶元就出來了。毫無疑問,做任何事情都是有前提的,過去幾年我們的體會是什麼呢?AI晶元的製造有3個前提:
1、你必須要有全棧式的AI技術能力。
2、一定要有已經經過驗證的、成熟的業務場景。
3、AI晶元它也是晶元,所以說還要具備一定的晶元設計能力。
只有當三者合在一起的時候,那麼我們才有可能真正的研發出一顆有競爭力的晶元。從2012年6月份成立,雲知聲在這一塊也積累了一些優勢。一開始我們完成了演算法平台化的過程。成立了3個月之後,我們發布了國內第一個免費開放的語音平台,緊著在2012年12月12號,我們買了4個英偉達的語音顯卡。在可能學術界95%的教授都沒有聽說過什麼叫深度學習的時候,我們在2012年就已經開始了。
今年回過頭來看,這三件事情非常重要。平台意味著數據,深度學習意味著我們確定了整個演算法的框架,當時一個很簡陋的GPU,意味著我們在那時就開始了對計算能力的追求,到今天我們的計算能力已經超過100個GPU。
這是我們第一個階段。另外,在發展過程中我們發現,人工智慧對計算能力的追求是永無止境的。今天我們可能說自己研發機房的GPU已經是以千個GPU為單位,包括我們在廈門市政府落地的一個城市大腦的創造平台,每秒的計算能力能達到1億次計算,這就是我們金字塔最底層的DeepFlow集群,它相當於給我們人工智慧修了一條高速公路。
那麼有高速公路之後,我們會面臨另外一個挑戰。就像前面馮總說的,電視數據化看起來很簡單,其實上面涉及到很多環節,包括信號處理、包括麥克風、語音識別、自然語言理解、語音合成,包括像前面我們主持人和機器人的對話,它通過一種高表現力的合成效果把聲音播放出來。
其實當你每個方向都在深度學習,你會發現這在2012年、2013年是不可能現實的。那我們怎麼辦呢?很簡單,運用AI來做AI人才該做的事情。所以,我們在2013年啟動了一個項目叫Atlas平台,把統計學習和深度學習裡面的一些通用演算法抽樣出來。雲知聲有自己的DeepFlow 集群,相當於在高速公路上有一台馬力非常強勁的跑車。在這個時代,你有高速公路,有很好的跑車,你不需要很多司機。正是這樣,雲知聲作為一個創業公司,才能非常高效地在語音識別、語音合成等很多技術里,迅速做出國內最頂尖的技術水平,這是我們在一些基礎技術上的積累。
雲知聲比較早的把這個技術深入到場景裡面去。我們有什麼產品形態?舉個例子,在2013年底、2014年初的時候,我們開始拿出一個晶元模組的原型,希望能用這種產品形態改變今天智能家居的一個應用模式。大家回想一下,在2013年底,其實我們看不到echo,它是在2014年底才出來,但我們在那個時候就開始做這樣的事情,到今天我們的晶元模組幾乎應用在中國所有的頂級家電產品中。
所以,在演算法、硬體以及場景層面,我們做了非常具體的工作和長期的積累。2015年8月,我們組建了晶元團隊。到今年1月15號,我們自己研發的晶元正式流片,5月16號正式發布了晶元「雨燕」,下個月即將大規模量產。
有了晶元之後,給我們帶來了哪些改變?我們的計算能力是目前市面上通用晶元的50倍以上,而且在端這一側積累了很多能力之後,我們可以把一些人機交互的共性部分放到晶元裡面,不光是語音合成、語音識別,甚至包含我們認為非常複雜的自然語言理解,相當於我們完成了人機交互的最共用部分。
那麼,雲端我們去對接的各種技術服務和內容服務等等,在端這一側,我們完全把源代碼開放出來,交給我們的合作夥伴,交給渠道,這樣雲知聲我們就完全進入了「雲+芯」時代。在不久的將來,大家會看到我們中國產的車裡面,我們用的晶元裡面,是由雲知聲提供。
我們為什麼做晶元?
我們為什麼做這個晶元?有一句話是說,「裝一個軟體,就為它設計一個硬體。」最底層的硬體是什麼?就是晶元,因為它能夠實現演算法和算力的完美結合。當然晶元它其實並不是競爭,不是一味的追求說我這個晶元有多少,不是的,晶元它是個生態,追求的是一種平衡,你要平衡好計算能力、成本、功耗,只有深入場景,了解行業,才能夠真正定義好這個晶元。
我們今年是百箱大戰,但是所有的音箱裡面,它裡面所用到的和遠場語音交互的,都是一套模組,要用若干個晶元來實現這樣的功能。
第一,今天雲知聲可以用一個晶元接上2個、4個、6個、8個麥克風,就能實現我們今天所有的功能,體驗會更好,因為這個晶元的計算能力要遠遠超過今天市面上一些晶元的計算能力。
第二,更低的成本、更低的功耗。當然這個晶元我們也可以直接放在一些控制類上面,它既可以離線控制,也可以在線。
我們不止是講個故事,也不是說停留在演算法層面上,而是把演算法和行業結合在一起。比如在教育、在醫療、汽車、智能家居、機器人很多領域裡,其實我們都取得了一些不錯的成績。
就拿醫療來說。2015年,當我們想把AI和醫療結合起來的時候,中國的任何一家醫院,任何一個科室,沒有一個醫生是用聲音來寫病例,但是今天我們在中國很多醫院,包括像今年衛計委還專門出台了文件,我們中國所有三甲醫院的評級標準是必須要有這個語音錄入的病例。
我們非常高興能看到,雲知聲雖然是一家創業公司,但是通過我們的努力,我們改變了醫院,改變了行業,我們甚至促定了標準的制定。


TAG:黑智 |