當前位置:
首頁 > 新聞 > 中國4大AI語音公司掀起「造芯」,中芯國際入場,行業洗牌在即

中國4大AI語音公司掀起「造芯」,中芯國際入場,行業洗牌在即

進入 2019 年, AI 技術的場景落地和商用化會成為一個更迫切的議題,但語音識別已是所有 AI 技術中最成功的領域,眼前有四大AI語音公司思必馳、雲知聲、Rokid 、出門問問不約而同投入「造芯」運動,開始押寶自製 AI 語音晶元,開啟第二戰場!

(來源:思必馳)

「融資」與「造芯」成為 AI 創業公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資後,即透露與某晶元巨頭進行 AI 晶元的研發,如今答案揭曉,思必馳旗下的晶元設計公司「深聰」獲得「國家隊」中芯國際旗下的股權管理公司中芯聚源投資,同時中芯國際也為深聰打造第一顆 AI 語音晶元。

「百箱大戰」時代開啟 ,AI 語音晶元熱度火到「互撕」?

基於深度學習( Deep Learning )的語音辨識技術很快成為 AI 創業界的流量擔當,尤其 2017 年 Amazon 一口氣推出多款Echo系列產品,開始了國內「百箱大戰」的年代,更讓相關 AI 語音企業迎來一陣小高潮,不少同性質公司更是明爭暗鬥陷入「互撕」局面,反應該市場的火熱程度。

根據 Canalys 估計, 2017 年全球智能音箱出貨量突破 3000 萬台, 2018 年出貨量預計是超過 5600 萬台,全球前四大品牌廠為Google、Amazon、天貓、小米。再者, 2017 年全球智能音箱用戶量排名前五名是美國、英國、德國、中國、加拿大,但2018年中國可望躍居第二名。

除了音箱之外,智能家居、汽車市場很多應用場景的硬體也會陸續加入語音智能化的功能,都讓 AI 語音技術的應用場景增添無限想像空間。

(來源:思必馳)

光是 2018 年就有三家 AI 語音創業公司發表相關晶元,包括雲知聲發表面向 AIoT 市場的 UniOne 晶元、出門問問的 AI 語音晶元模組「問芯」Mobvoi A1、 Rokid 的 AI 語音晶元 KAMINO 18 ,思必馳透露要進入自製晶元領域已有一段時間,4日才正式對外揭露具體戰略細節。

中芯國際助陣,思必馳「造芯」如虎添翼

不同於雲知聲、Rokid進入晶元自製領域,都是在公司內部成立獨立部門進行研發,思必馳2018年初成立子公司「深聰」,2019年初推出的第一顆產品是AI語音晶元深聰TAIHANG晶元。

思必馳扶植的深聰之所以引起業界注意,是因為思必馳的「造芯」之路,找來國內半導體巨頭中芯國際助力,旗下的投資公司中芯聚源加入成為創始股東之一。再者,思必馳對深聰的持股比重超過50%。

思必馳自製的首顆AI語音晶元,就是由中芯國際操刀,以40納米工藝打造,約莫是2017年中啟動該晶元項目後,在2018年8月進行流片,11月晶元出來後,現在處於採集樣本階段,預計2019年中將進入風險試產,該顆晶元拔劍出鞘的速度十分快,幾乎把需要6 個季度的工作,縮短為3個季度完成。

深聰TAIHANG晶元面向智能家居、智能終端、車載、手機、可穿戴設備等各類終端設備,基於雙DSP架構,內部集成codec編解碼器,以及大容量的內置存儲單元,再者,該晶元也採用了指令集擴展和演算法硬體加速的手段,相較於傳統通用晶元具有10X以上的效率提升。

深聰聯合創始人吳耿源表示,在晶元戰略上是兩步走,因為背後強大的需求力道驅動,第一顆晶元不單是求快,講求time-to-market,也專註低功耗、單向反饋、實現演算法加硬體融合優化的想法。

圖 | 深聰聯合創始人吳耿源(來源:思必馳)

同時,深聰內部已經開始第二顆晶元的規劃,是專用晶元加特定架購,雙向溝通更能達到軟硬體融合、深度優化的功效提升,以軟體需求來定義晶元架構,再用架構去反饋演算法,同時,演算法也會優化硬體架構,等於是彼此做到雙向溝通,預計該顆晶元將在2019年下半年流片,2020年量產。

從「通用」到「專用」,這是一條怎麼樣的心路歷程?

從通用晶元到量身打造專用晶元的過程,想必有一番思考、摸索與探尋,吳耿源接受DT君專訪時娓娓道來。

吳耿源分析,思必馳是一家滿十歲的企業,這幾年趕上AI崛起的浪潮,過去多年的技術積累獲得發力的機會,目標戰場是物聯網,第一個應用場景是智能音箱,一切有了很美好的揭幕,但坦白說,智能音箱終究「 me too 」產品,Amazon 已經在前開路。

思必馳的智能音箱初期用過很多家晶元大廠的通用晶元,但隨著產品線逐漸成長茁壯後,許多問題逐一浮現。因為,通用晶元功能再怎麼強大,落地到AI場景上會有削足適履之感,加上很多目標市場越來越明確、消費者群聚效應展現後,特製化晶元的需求因此誕生。

AI 晶元在市場上有兩路的提供者,早幾年都是通用晶元的天下,像是高通、聯發科等,這些巨頭在晶元戰略上,較為著眼於商業利益價值,但是,很多AI應用場景都屬於細分賽道,要通用晶元巨頭「削足適履」,會比較不切實際。

這些晶元巨頭當然也會想要「染指」AI市場,但這個市場和他們過去擅長的遊戲規則有落差,以前是巨頭們設計出什麼樣的晶元,客戶就要乖乖接受,但AI市場是反其道而行,要透過使用者來定義產品,再由把需求反饋給演算法,靠演算法實現。

但是,傳統晶元巨頭無法緊密地直接觸碰市場需求,或是內部沒有強大的演算法團隊或數據(Data)做後援,在AI領域要成功,演算法、數據、正確地定義市場都是關鍵。

因此,近幾年起演算法公司開始切入「造芯」運動,也提供給演算法公司實現垂直整合布局的機會,更重要的是,藉由「造芯」來確保產品的差異化和核心價值凸顯出來。

吳耿源表示,思必馳從演算法公司跨入產品,再垂直整合成一個平台,上下串連繫統,在雲端(Cloud)、邊緣(Edge)兩端都有布局,關鍵就是欠缺一個硬體晶元去擔任執行的角色,而AI領域是軟體定義晶元,初期用市面上通用晶元時,也發現演算法與晶元對接的過程,有很多文化融合的問題。

舉個例子,當演算法遇到晶元,發生的第一個衝突是演算法的改朝換代速度遠快於晶元的工藝技術。

一般而言,從定義產品到晶元誕生於世,大概要「懷胎」兩年(24個月),中間經歷設計、流片、試產、改版、升級、量產,每一個階段慢慢磨練,中間經歷的循環以「季度」為單位來計算。

反觀在演算法的世界裡,每一個禮拜都在改,循環可能是以「禮拜」作為單位,若將演算法與晶元擺在同一家企業中,彼此步伐不一致的問題,會產生明顯的內部矛盾與衝突。

思必馳從演算法、產品、平台、系統整合布局到整個生態系統,現在加入深聰自製AI語音晶元,布局齊全後,將跨出智能音箱這個「me too」市場,進入AIoT領域,包括TV盒子、白色家電、智慧家庭、故事機等,當物聯網遇上AI,商機是無可限量。

多模式人機交互是理想桃花源

吳耿源進一步指出,光是語音AI技術就還有很大的精進空間,現在的智能音箱的溝通仍需經過「喚醒」的程序,其實是「人工弱智」,要做到自然人機交互,當中的技術突破就需要演算法的大幅增進,其中一個關鍵的元素是聲紋。

市面上的智能音箱只能辨識出說話的內容,再針對問題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因為必須要在明確對象的情況下進行,唯有做到「聞聲即可識人」,不需要「喚醒」這個多餘的動作,這才是真正的「SMART」。

吳耿源進一步解釋,AI語音晶元在應用場景的廣度上,絕對不單是音箱領域,還包括物聯網、智慧家庭、車載市場等,更進一步場景是多模生態,當下AI是最好的時代,天時、地利、人和,AI時代正在騰飛、國家關注造芯、加上軟體、硬體、人和的融合。

現在的AI技術場景分別在語音、視覺兩大領域有不錯的起步和成功的場景落地,但卻都是各自表現,所謂的多模生態是指聲覺、視覺、五官、手勢、觸摸等獨立的功能融合在一起,實現自然的多模式人機交互。

AI技術領域的前方是無人區,只能摸著石頭過河,每一步都是挑戰,但也處處是驚喜。

更重要的是,這是一個國內最有機會與美國科技先驅並行的領域,AI技術的「造芯」運動是日正當中,想想海思追趕高通也花了超過十年,才造就今日的江湖地位,國內發展AI技術有應用場景做後盾,要打造出一家巨星級的企業,這一劍肯定不用磨到十年!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

4年50億美元投入IOT領域,微軟釋放加速語音技術商業化落地信號
抑制破裂動脈出血新療法,電脈衝技術在活體動物大動脈中有效

TAG:DeepTech深科技 |