AI公司為何開始爭相推出AI語音晶元?
2019年1月的AI語音晶元市場十分熱鬧,1月2日,雲知聲召開發布會推出多模態AI晶元戰略,並公布今年布局的3款AI晶元。1月4日,思必馳召開發布會發布其第一代AI語音晶元TAIHANG。1月21日,獵豹移動旗下AI公司獵戶星空聯合瑞芯微電子宣布推出專門針對智能音箱和物聯網設備的AI語音晶元。
加上此前出門問問、Rokid已經發布的AI語音晶元,AI語音晶元的競爭正在走向白熱化。這不禁讓人疑問,為什麼AI公司或者說AI語音公司都開始爭相推出AI晶元?
研發AI語音晶元是自然趨勢
獵戶星空首席戰略官王兵博士接受雷鋒網專訪時表示,AI公司紛紛推出AI語音晶元有幾方面的原因,一方面是語音市場需求增長非常快,僅看智能音箱,去年整個市場的出貨量就超過2000萬,並且還在保持增長。另一方面,AI語音演算法現在已經相對比較成熟,做演算法的輸出競爭已經有點白熱化的狀態,所以許多公司就開始研發晶元,因為晶元相對而言商業化的潛力更大,這是一個非常自然的趨勢。
他同時指出,由於AI語音晶元並不需要像AI視覺那麼強的計算能力,也不需要最先進的工藝製程,因此相對而言AI語音晶元不僅研發的門檻低一些,開發周期也相對較短,這也是許多公司推出AI語音晶元的原因。
不過,獵戶星空最終決定研發AI晶元還有更多的考慮。此前獵豹移動董事長兼CEO傅盛接受採訪時提到推出AI晶元的兩方面考慮,第一,沒有針對某個AI場景的專用晶元,例如英偉達GPU是為遊戲設計晶元,高通的SoC是為手機設計,為 AI 或者一些專屬設備設計的晶元很少。第二,如今 28nm工藝已經很成熟,成本也非常低,做一款集成語音演算法的晶元可能只有幾美金,流片幾百萬元人民幣。但在產品中加入這樣一塊晶元,主晶元的負載就可以明顯降低,用原來為手機設計的晶元光語音處理可能就要消耗40%的算力。
當然,獵戶星空能推出AI語音晶元也與自身的積累密不可分。王兵表示:「獵戶星空已掌握麥克風陣列、語音喚醒、語音識別、語義理解和語音合成等全套遠場語音技術,也擁有自研全鏈路的遠場語音交互系統獵戶語音OS,作為全技術鏈條的公司,晶元是必須涉足的領域,這有利於我們在垂直領域建立優勢。同時,在中國人工智慧產業發展聯盟(AIIA)公布的國內智能音箱智能化評級結果中,獵戶語音OS佔據了獲評產品前五強中的三席,這說明了我們在語音市場的影響力。還有,實現晶元的自主可控也是大趨勢。因此,研發晶元成為了非常自然的事情。」
聯合研發AI語音晶元是好選擇
AI語音公司研發AI晶元是自然趨勢,晶元的研發卻可以有多種選擇,包括完全自主研發、聯合研發以及完全交由第三方設計。值得注意的是,獵戶星空選擇的方式是與瑞芯微聯合研發,與此類似,思必馳與中芯國際下屬投資公司中芯聚源成立合資公司上海深聰智能聯合研發。這是否意味著聯合研發AI語音晶元是個好選擇?
對此,王兵表示:「對比而言,從開發周期和成本的角度,聯合研發確實是一個更好的方案。因為比較成熟的晶元公司已經有積累,很多東西不需要重新去設計,能夠縮短開發周期,另外,對許多公司而言,晶元的生產和管理也沒必要親自介入。」
至於為什麼選擇和瑞芯微合作,王兵表示,瑞芯微在低成本晶元方面有很多年的經驗,我們評估了包括自行研發以及與其它廠商合作的方案之後,最終發現瑞芯微的方案成本最低,並且,我們的演算法與他們的硬體能力的結合也比較合適。
具體的合作分工上,獵戶星空負責晶元架構、演算法以及系統軟體的設計,瑞芯微提供一些硬體的成熟方案以及對後期晶元的生產和管理。王兵表示,在合作的過程中,由於獵戶星空有有許多來自知名晶元公司經驗豐富的工程師,因此他們對於晶元該如何去設計以及如何與瑞芯微溝通都非常清楚,雙方的合作還比較順利。
雷鋒網了解到,獵戶星空在2018年上半年啟動晶元項目,目前獵戶星空語音演算法團隊的規模接近200人,晶元團隊包括軟體和系統團隊大約有30人。那麼,從項目啟動到晶元正式推出時間還不到一年,獵戶星空的AI語音晶元競爭力如何?
晶元不一定最便宜,但一站式解決方案便宜且靈活
據了解,獵戶星空與瑞芯微聯合研發的AI語音晶元OS1000RK基於28nm工藝,採用64位4核ARM Cortex-A35 CPU,整合高性能 CODEC(8通道ADC+2通道DAC),可以低成本地支持8個麥克風陣列,硬體語音檢測模塊(VAD)可實現很低的待機功能,專用指令集能讓神經網路的運行更加優化。
OS1000RK主打功耗低、通用性強,能夠實現從語音喚醒、語音理解、語音合成等全鏈條的語音交互能力。
另據了解,在功耗的降低方面OS1000RK的在沒有任何聲音的時候,除了VAD其他部分都不耗電,晶元還會根據需實現變頻工作,讓OS1000RK實現較低功耗。通用能力則是王兵重點強調的優勢,他表示:「我們的AI晶元是一個通用性很強的產品,目前可以看到的規模較大的語音應用,基本都可以用它來實現,現在市面上還沒有其他AI語音晶元的通用能力特彆強。」
「除了晶元,作為全鏈條AI公司,客戶需要什麼演算法我們都能提供,我認為目前行業內其他人還不能做到這一點。這一能力來源於我們在演算法上的巨大投入,還有數據的積累,獵戶星空從2016年成立之初就開始做語音的演算法。」王兵補充道。
另外,有一個AI晶元公司都不得不面臨的問題就是AI演算法的不斷更新。對此,王兵表示:「我們用互聯網的思維做硬體,我們不認為一個硬體出售之後功能就不會變,而是需要不斷更新,因此我們的晶元可以通過OTA在線更新,以此來保持晶元的競爭力。」
但是,晶元的通用性、性能和成本不可兼得。獵戶星空高通用性還能具備成本優勢嗎?王兵指出,成本需要看系統成本,而不是只看晶元成本,這也是為什麼我們要推出一站式解決方案的原因,這種模式能讓系統成本最低。也就是說,如果只強調硬體成本,做一款特別專用的晶元成本可能是最低,但靈活性不行,這將導致最終的系統不管是從性能還是成本的角度可能都比不過一站式的解決方案。因此,我們晶元不一定最便宜,但一站式解決方案一定是最便宜,而且是最靈活的。
王兵所指的一站式方案包括從晶元到晶元上的演算法以及晶元上的系統軟體,再到雲端的軟體、應用軟體、內容體系。他還舉例表示,如果有客戶想推出智能音箱,我們從電路板的設計到操作系統再到雲端軟體的演算法都可以提供,客戶基本上主要去做特定場景的內容優化以及渠道推廣就可以。
視覺AI晶元在自研路上
目前,OS1000RK已經搭載在小雅Nano智能音箱中,預計將在今年年底達到百萬的出貨量。這也意味著獵戶星空的AI語音晶元今年底的出貨量將在百萬級別。王兵也表示:「從目前的訂單看我覺得百萬應該沒有太大問題,我們下一代的小豹AI音箱也會搭載這款晶元。除了智能音箱,語音控制的智能家電,比如美的新一代的冰箱,兒童故事機、兒童教育機器人等其他機器人等都將採用我們的語音晶元。」
不僅僅是語音晶元,獵戶星空還在自主研發視覺、導航等更多領域的專用晶元。王兵表示,選擇自研的原因也是因為機器人視覺和導航還處於非常早期的階段,沒有特別好的專用晶元,自己研發能夠把性價比做到最優。
至於視覺和導航晶元為什麼選擇自研而不是聯合研發,他表示,「語音晶元已經有一些公司有積累,但視覺和導航到的晶元目前成熟的東西比較少,可能都需要自己設計,因此選擇自主研發。目前我們在這些領域我們也有了一些積累,也引進了一些資深人才。」
最後,在談到AI晶元熱潮以及資本寒冬是否會影響AI晶元公司的時候。王兵表示AI晶元是熱在投資階段,但AI晶元能夠真正量產和商業化的比較少。資本寒冬可能對於O2O或者互聯網領域會有影響,對AI、機器人、視覺、導航等不會有影響。
雷鋒網小結
AI晶元領域此前更受關注的是AI視覺晶元,但隨著語音演算法競爭的白熱化,為了能夠保持競爭力並建立優勢,越來越多的演算法公司開始推出自研AI晶元。此時我們看到,包括獵戶星空和思必馳都採用聯合研發的方式而非完全自研,這在很大程度上證明了這種方式的可行性和性價比。
語音演算法輸出以及AI晶元競爭的白熱化,讓更多AI語音的場景更成為各方爭奪的焦點,這也意味著我們離AI語音真正改變生活更近了一步。


※被「養」11年!黑客濫用Firefox「高齡」漏洞強制用戶輸入信息
TAG:雷鋒網 |