當前位置:
首頁 > 科技 > 語音公司集體殺入AI晶元 2019場景落地戰打響!

語音公司集體殺入AI晶元 2019場景落地戰打響!

智東西(公眾號:zhidxcom)

文 | 寓揚

2019年的第一個工作日,在第一顆AI晶元「雨燕」落地不久,AI創業公司雲知聲緊鑼密鼓地推出多模態AI晶元戰略,並公布今年3款AI晶元日程表。

緊接著的1月4日,另一家語音公司思必馳成立獨立控股公司,推出TAIHANG AI晶元,搶佔終端語音交互市場。

這還沒完,1月21日,獵豹移動旗下AI公司獵戶星空聯合瑞芯微電子發布專門針對智能語音和物聯網設備的AI晶元——OS1000RK。其官方稱,該晶元已經成功落地到數十萬台智能音箱——小雅Nano中,並預計將在今年年底達到百萬級出貨量。

短短不到1個月時間,就有3家以語音起家的AI公司殺入AI晶元市場,推動戰火升級。而這背後是語音公司集體湧入AI晶元市場,這將會是2019年AI落地的一大浪潮。

近期語音公司推出AI晶元主要玩家統計

但語音公司集體湧入AI晶元浪潮背後,他們到底做的是什麼?他們為什麼要做AI晶元,又為什麼是他們最先湧現出來?AI晶元之爭爭奪的真的是晶元本身嗎?帶著種種疑問,智東西走訪這一行業主要玩家,為您一一揭開謎底。

如果說2018年被行業稱為AI晶元的元年,那麼2019年就是AI晶元真正走向落地、經受市場洗禮的一年。


一、語音公司集體湧入AI晶元浪潮

隨著2017年國內智能音箱的火熱,語音交互技術開始走向前台,落地到越來越多的智能終端設備中,也為AI晶元的到來埋下了一顆種子。

2018年3月,語音技術公司聲智科技推出了一款麥克風陣列晶元SAI101C,這是一款聲學晶元,它集成了優化過的低功耗喚醒以及遠場自動語音識別技術,支持多種麥克風陣列,能夠與主控晶元配合,讓設備具備遠場拾音能力,應用智能音箱、智能電視、智能玩具等市場。

儘管它還算不上一款AI晶元,但代表著語音公司面向終端設備,聚焦在「耳朵」功能——麥克風陣列上的一次探索。

2018年5月,兩家AI公司湧入AI晶元賽道。先是雲知聲宣布推出針對智能家居場景的語音AI晶元「雨燕」,當時雲知聲創始人、CEO黃偉稱這款晶元已經成功流片,將在2018年第二季度量產。

據稱,這款AI晶元由雲知聲自主研發設計,擁有具備自主知識產權的DeepNet(人工智慧核心IP)、DSP(數字信號處理) 、支持DNN/LSTM/CNN等多種深度神經網路模型,以及多種應用介面,其性能比通用方案提升50倍。

當月,出門問問也推出一款AI語音晶元模組「問芯」。它融合了杭州國芯的語音前端晶元GX8008,與出門問問的麥克風陣列信號處理技術等,從模組層面探索B端市場。

緊接著的6月份,Rokid在其成立4年來的首場發布會中,發布了語音AI晶元KAMINO18。這款晶元由杭州國芯定製,Rokid主要做晶元的架構優化,以及NPU指令集的設定,採用40納米工藝,由台積電代工生產。

Rokid CEO祝銘明當時表示,儘管這款晶元為40納米,卻比上一代Pebble音箱中16納米的晶元算力提升1.5倍。此外,這款AI晶元的整體成本低於市場主流通用晶元方案30%。

他還透露,「已經訂下的訂單就有幾百萬片晶元了」,小雅mini兒童音箱與甘布兒童產品都使用這款晶元。

2018年下半年,語音晶元問世的節奏相對緩和一些,但廠商之間的競爭明顯在加劇。思必馳、雲知聲等公司不斷向外界透露AI晶元的最新進展,摩拳擦掌競爭的火花在蔓延。

而在2019年的第一周,兩家公司紛紛舉辦發布會,發布AI晶元產品,展開「貼身肉搏」。

雲知聲公布了其多模態的AI晶元戰略,並宣布2019年將會面向語音、視覺、車載等場景推出3款AI晶元,搶灘IoT場景。

隨後,思必馳的語音AI晶元也與大家見面,它採用專用晶元 高性能DSP 擴展指令集的架構,具備低功耗、高能效、高性價比等優勢,同時支持多種介面、多麥克風陣列,可應用在電視、白電、車載、機器人、智能音箱等場景。

這款AI晶元由思必馳控股的獨立公司上海深聰智能打造,深聰智能CTO朱澄宇告訴智東西,這款AI晶元的定位前端語音交互的專用晶元,核心在於為設備賦予語音能力。

緊接著,獵豹移動也宣布,旗下AI公司獵戶星空聯合瑞芯微電子發布針對智能語音和物聯網設備的AI晶元,它整合了8通道ADC 2通道DAC(數模/模數轉換晶元),可支持8麥克風陣列,專用指令集可以加速神經網路演算法。

此外,訊飛系的AI晶元也在路上。至此,語音演算法公司掀起了集體湧入AI晶元的浪潮。

二、語音公司做晶元,做的到底是什麼?

每一家語音公司做晶元後,我都會問他們,語音公司做晶元到底是做的什麼。

Rokid CEO祝銘明談道,Rokid不是一家晶元公司,不是為做晶元而坐晶元,也不靠晶元賺錢。Rokid更注重通過晶元來提供足夠的算力,實現晶元與演算法更好的匹配,並降低成本,核心在於輸出解決方案。

因此,Rokid採取與杭州國芯合作的方式,Rokid主要做晶元的架構優化,以及NPU的指令集設定,在晶元層面則交由杭州國芯定製。

但云知聲CEO黃偉顯然不認同這一模式,他認為行業做AI晶元有三種做法,第一種是PPT造芯,第二種是合作的方式,第三種才是自研。

他認為與外部公司合作造芯並不是最好的一種方式,比如一方是做晶元的,一方是做演算法的,很難在源代碼層面做到很好的耦合。因此雲知聲選擇了成立子公司,自研AI晶元的做法。具體而言,在AI晶元中,雲知聲主要做的是DSP與人工智慧核心IP DeepNet。

選擇獨立公司方式來打造AI晶元的還有思必馳。思必馳CTO周偉達更進一步表示,語音公司做與不做晶元是按需求來的,思必馳做AI晶元的核心目的是,面向客戶需求,通過軟體定義硬體,軟硬體耦合的思路來構建思必馳在演算法方案上的優勢。

聯發科技副總經理暨智能設備事業群總經理遊人傑則一針見血地指出,每一家語音公司的演算法都不同,需要對晶元硬體架構做耦合,才能夠產生更好的效果與效能,這是語音創業公司做AI晶元的一個主要原因。

他進一步指出,像科大訊飛、思必馳做語音晶元更主要在於做DSP(數字信號處理)。目前用CPU、AP晶元(應用處理器晶元)來做的方案,功耗比較高。

可見正是通用晶元在實際應用場景中的不足,無論是出於功耗、性能、成本等的各方面考量,語音公司湧入這一賽道,通過軟硬體耦合的方式,來進一步確立在語音核心演算法的優勢。


三、為何要做AI晶元?

去年5月,雲知聲CEO黃偉曾說,「不做晶元,必死無疑」;隨後,Rokid CEO祝銘明也回應道,「做語音的公司,毋庸置疑,一定要做晶元」;緊接著,思必馳CEO高始興則稱,做語音晶元是「順勢而為」。

那麼,語音公司要做AI晶元背後的原因究竟是什麼呢?

雲知聲CEO黃偉從市場需求與核心競爭力談道,2014年當時做模組的時候,希望賦予場景語音交互的能力,但是發現市面上沒有任何能夠滿足需求的晶元,並且拼湊出來的成本非常高。因此他很早就意識到了做晶元的必要性,並在2015年開始打造AI晶元。

他之所以說雲知聲不做晶元必死無疑,是因為語音公司的核心競爭力,必須在場景中打通,只有軟硬體結合的方式才能夠實現。

思必馳CEO高始興也告訴智東西,隨著整個物聯網終端的爆發,行業對語音晶元的需求也進一步呈現,而思必馳在之前提供語音方案的過程中跟多家晶元做過對接,知道需求在哪裡,自身做AI晶元本身,也有較大的業務體量做支撐。

並且,思必馳自己做晶元,晶元架構能夠根據演算法、算力做定製調整,演算法也能根據晶元做優化,將芯和雲端打通從而提供更優的性能與體驗。

此外,他還從成本與低功耗的角度談道,傳統晶元在成本與功耗上都非常高,物聯網終端更加講求性價比,而自身打造語音晶元能夠實現成本與功耗的最優化。

總結起來看,語音公司做AI晶元背後無外乎幾大原因:提供充足算力,滿足場景需求;降低晶元以及方案整體成本;智能家居IoT場景存在低功耗需求;而核心則指向通過軟硬體一體構建演算法核心競爭力,從而構建競爭壁壘,形成更閉環的商業模式與盈利能力。


四、為什麼是他們最先湧入AI晶元?

對比傳統晶元企業、晶元巨頭可以發現,語音公司率先湧入終端AI晶元賽道,並率先推出產品,而晶元巨頭在AI晶元尤其是語音AI晶元上還並無太多進展。

為什麼又是語音公司率先湧入AI晶元賽道?

思必馳CTO周偉達以自身實踐經歷談道,語音公司在技術服務產業的思路下,對接了大量客戶,也對接了各種晶元平台,因此語音公司更清楚市場需要什麼,目前市面已有的晶元能夠做什麼,不能夠做什麼,缺少哪些功能等。

從語音演算法的角度來說,語音技術對硬體有一定需求,需要一款高能效、低功耗、降低成本,同時又能夠改善體驗的晶元。

因此他認為,語音演算法公司最了解演算法,又了解市場需求,能夠做出能效最高的晶元,所以語音公司會率先做晶元。

周偉達從打造AI晶元的兩種路徑來看,一種是從硬體出發做AI晶元,但如果公司對AI演算法不夠了解,往往很難做出滿足場景最優的晶元;另一類是演算法公司,根據演算法、場景的需求,結合硬體做優化。

儘管二者做AI晶元都有挑戰,當相對而言,語音演算法公司做AI晶元更有優勢。

此外,他認為在AI晶元的行業早期階段,當下AI演算法還不夠成熟,需要晶元硬體和AI演算法的聯合研發。

但隨著AI演算法的成熟,一定會有晶元公司湧入,並且只需要告訴晶元公司我們需要多少算力、多少帶寬、多少存儲、多少功耗,晶元公司就能夠實現,但目前還無法做到。


五、市場競爭才剛剛開始

儘管語音公司在技術落地的過程中,對於演算法和市場需求有更多的了解,並且率先發力AI晶元,走到了行業前面,但語音公司所面臨的競爭才剛剛開始。

其一,看到IoT場景下端側智能的市場前景,晶元公司也在積極布局AI晶元,比如2017年前後,杭州國芯、啟英泰倫都推出了語音AI晶元,試圖探索IoT場景。

杭州國芯GX8010晶元

再比如,脫胎於清華大學微納電子系的清微智能,面向邊緣設備和物聯網提供晶元以及軟體等解決方案。今年上半年清微智能的業務將集中在語音晶元,預計產量在千萬級。

其二,隨著AI演算法的成熟,以及IoT市場對AI晶元的需求進一步爆發,晶元巨頭必將會大規模湧入這一領域,一旦晶元巨頭進入,將會對語音公司帶來巨大的挑戰。比如目前高通在IoT場景下進行了重點布局。

而這些都構成了語音公司布局AI晶元的外部競爭。

其三,語音公司內部的競爭也尤為激烈。語音公司布局AI晶元,正是想通過軟硬體一體化的方式,匹配充足是算力、功耗等,降低成本,進一步增長自身AI演算法與方案的競爭力。

其四是AI晶元落地場景的考驗。目前各家語音公司的AI晶元剛剛推出,或者剛剛開始落地產品、落地場景,晶元能否真正工程化應用於產品,能否真正滿足實際場景需求,以及晶元的穩定性等都是有待考驗的地方。

2019年正是檢驗AI晶元落地的一年,誰能夠真正落地場景,形成規模,誰就有可能在未來的競爭中勝出。

此外,行業也有一種觀點,AI晶元至於物聯網場景未必是必要的,這一觀點認為物聯網場景中存在很多不需要太多算力的設備,並且隨著通用晶元的升級也能夠滿足這一需求。

面向終端側,到底AI晶元能夠在哪些行業場景爆發,都是有待驗證的難題,也都需要語音公司以及行業進一步探索。


結語:2019AI晶元場景落地戰打響

僅僅是2019年剛剛開年,我們就看到了數款AI晶元的亮相,這代表了AI公司場景落地的深化。

儘管各家都湧入了AI晶元這一賽道,各家的產品也都陸續推出,但產品推出只是第一步,緊接著落地場景才是真正的考驗。

如果說2018年是AI晶元的元年,那麼2019年將會是AI晶元打響場景落地戰的一年。

只有經受場景與市場的考驗,真正解決現實場景的實際痛點,才能真正被行業與市場認可,而這一戰役剛剛開始。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智東西 的精彩文章:

對話微軟ONNX負責人:沒有中國的認可,開源標準沒有意義
2018未來科技創「芯」大會12月14日成功舉辦

TAG:智東西 |