當前位置:
首頁 > 科技 > 「不設邊界」的雲知聲:從多場景AI晶元到視覺AI,誓要2019營收近3倍

「不設邊界」的雲知聲:從多場景AI晶元到視覺AI,誓要2019營收近3倍

記者| 楊麗

出品| AI科技大本營

若非要總結 2018、展望 2019 的話,可以借用雲知聲創始人兼 CEO 黃偉的一句點評:「所有偉大的公司都誕生於真實的生產需求。」

2019 年 1 月 2 日,雲知聲在京召開戰略發布會,正式公布其正在研發的三款定位不同場景的 AI 晶元,包括第二代物聯網語音晶元「雨燕」Lite、面向智慧城市的支持圖像與語音的多模態晶元「海豚」、以及面向智慧出行的車載多模態晶元「雪豹」。據悉,該三款晶元計劃於本年度 Q2、Q3、Q4 先後發布。

值得一提的是,發布會上,黃偉表示雲知聲的企業收入主要來自於 AI 晶元和軟體,並預計 2019 年依然會有兩至三倍的收入增長,且人均產值也十分良好。

從家居、車載、機器人等 AI 生活,到醫療、教育、政務、金融、客服、酒店等 AI 服務,從 2014 年確立「雲端芯」的產品體系,到 2018 年首款物聯網 AI 語音晶元 UniOne「雨燕」的發布,雲知聲將「場景」優勢提升至了最優級。

幾乎所有人還都沉浸在 2018 的寒冬里,雲知聲已搶先一步打響了新一年的戰鬥。那麼,2019 年是否能真正成為人工智慧實現量產化、規模化的一年呢?AI 晶元似乎成為了這個領域技術供應商無法繞過的話題。

黃偉表示,雲知聲不是一家以銷售為主導的企業,銷售人員佔比僅 10% 不到。儘管雲知聲目前為多個行業的頭部客戶提供服務,但不會根據不同場景提供逐一定製服務。不過,不同的階段,公司(戰略)是不一樣的。2019 年制定的增長目標將無疑促使雲知聲加大這些方面的投入。

會後,雲知聲 CEO 黃偉、IoT 事業部副總裁、晶元研發負責人李霄寒接受了 AI 科技大本營等媒體在內的採訪。

「不設邊界」的雲知聲

從 2014 年開始切入物聯網 AI 硬體晶元方案(IVM),2015 年雲知聲正式組建晶元團隊開始自研。隨著三年後晶元的成功流片,2018 年 5 月雲知聲正式發布其第一代終端 AI 晶元「雨燕」,該晶元採用自主 AI 指令集,擁有具備完整自主知識產權的 DeepNet1.0、uDSP(數字信號處理器),並支持 DNN/LSTM/CNN 等多種深度神經網路模型。

隨後幾個月,雲知聲陸續開源 AI 晶元「雨燕」針對智能家居、智能音箱場景的語音交互解決方案。面向客戶、方案商、開發者等上下游合作夥伴,提供具體場景的軟硬一體化 Turnkey 解決方案,足夠開放且高度可定製化。一家從軟到硬的技術供應商,在外人看來難免像是一種「不設邊界」。

「如果沒有晶元就很難和演算法結合起來,在這個做的過程中,我覺得邊界是模糊的,隨著技術的不斷演進,場景的不斷深入給我們提出了更多的需求。現階段我們面向物聯網選擇了一個重點場景,將算力和應用服務更好的結合,這是比較明確的,」黃偉解釋道。

直到如今,人工智慧產業也未形成很大的市場,更沒有任何一家企業能做到絕對的市場壟斷。演算法、框架、晶元、模組、加速器等領域都在時刻湧現新興企業。雲知聲要做的則是針對 IoT 場景下的全棧式終端晶元,這也印證了其「雲端芯」戰略中「芯」的定位。

目前,基於「雨燕」晶元的全棧解決方案已導入的各類方案商及合作夥伴已超過 10 家,包括美的、奧克斯、海信、京東、360、中國平安、硬蛋科技等,相關產品最早將於今年 Q1 量產上市。

什麼決定著終端晶元的設計?

通過摩爾定律我們知道:同一晶元所能提供的算力將越來越強;同理,不同晶元之間,單位算力輸出的情況下,功耗則越來越低。這也是為什麼從前段時間的英偉達 GPU 到現在的英特爾 Movidus 和國內的華為海思晶元都在進行從「雲」到「端」的嘗試。

黃偉說:「2G 時代看網路小說,3G 看圖片,4G 誕生了快手、抖音、頭條;5G 則是一場質變,有著廣闊的覆蓋、更寬的網路……雲知聲是 5G 的受益者。」

5G 與人工智慧的結合將真正促進萬物智聯(AIoT)的落地與實現,端側與中心側需要更快速地響應和識別,以實現更複雜的功能。物聯網設備數量的大規模增長、連接成本更為低廉、數據維度複雜多變、應用場景更為垂直等諸多挑戰,將進一步挑戰物聯網 AI 晶元的設計。

除了成本、算力、功耗、安全性等需要考慮之外,在李霄寒看來,還需要關注以下三點:一是圖像、語音等新維度的數據,對其傳輸的複雜度及數據實時性的需求;二是給定成本和功耗條件下,通用晶元架構達不到最佳能效比;三是基於深度學習加速的新硬體勢在必行。

物聯網 AI 晶元的最終呈現形式將不再是一個單一的硬體,而必然是承載著邊緣能力與雲端能力的多模態 AI 軟硬一體解決方案。

因此,在晶元設計層面,他指出三點因素:

一是場景化,晶元設計正由原來追求的 PPA(Power、Performance、Area,即性能、功耗、面積)逐漸演變為基於軟硬一體,甚至包括雲端服務的方式來解決某個垂直場景;

二是多模態,晶元需要具備支持多模態數據採集分析和梳理的能力;

三是端雲互動,即形成邊緣算力和雲端算力動態平衡。

多模態 AI 晶元技術布局

為實現多模態 AI 晶元的戰略落地,除了語音技術,雲知聲在機器視覺方面也取得了不小進展。

其中,面向機器視覺的輕量級圖像信號處理器已可實現在不依賴外部內存的情況下,在 30 fps 的速率下實時對感測器的圖片進行預處理,以進一步提高後續機器視覺處理模塊的處理速度和效果。藉助基於人臉信息分析的多模態技術,已可實現人臉/物體識別、表情分析、標籤化、唇動狀態跟蹤等功能,可為產品交互和用戶體驗提供更多的可玩性和靈活性。

尤為值得一提的是,雲知聲多模態人工智慧核心 IP——DeepNet2.0 的發布,標誌著雲知聲人工智慧處理核心由 1.0 語音時代全面邁入 2.0 融合語音、圖像等處理能力的多模態時代。DeepNet2.0 可兼容 LSTM/CNN/RNN/TDNN 等多種推理網路,支持可重構計算(計算單元可像七巧板一樣進行任意拼接組合),支持 Winograd 處理,最高可配置算力達 4T。目前雲知聲 DeepNet2.0 已在 FPGA 上得到驗證,將在 2019 年落地的全新多模態 AI 晶元「海豚」上落地。

此外,雲知聲還與杜克大學所領導的美國自然科學基金旗下唯一人工智慧計算中心——ASIC 達成深度合作,致力於 AI 晶元演算法壓縮與量化技術, 以及非馮新型 AI 晶元計算架構研究。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

知識圖譜升溫之勢已現,不要錯失下一個AI風口
阿里首次開源深度學習框架X-Deep Learning

TAG:AI科技大本營 |