當前位置:
首頁 > 科技 > 對話阿里達摩院付強:年初阿里完成收購 未來或推語音專用晶元

對話阿里達摩院付強:年初阿里完成收購 未來或推語音專用晶元

智東西5月3日消息,今天,阿里宣布全資收購北京先聲互聯科技有限公司,先聲互聯創始人、中科院聲學所前研究員付強博士,正式入職阿里達摩院機器智能技術實驗室,負責語音交互前端處理技術和方案的研發。

先聲互聯是智東西早期關注的創業項目,也是國內最早從事語音增強、遠講語音交互介面技術的團隊,曾為阿里、百度、小米等多家公司提供遠講語音交互軟硬體的解決方案。智東西在去年7月份就曾與創始人付強有過深入溝通(從中科院走出創業小團隊 扼住了智能音箱的咽喉!)。

(圖中紅衣者為付強博士,背景為智東西曾經的辦公室)

在阿里宣布對先聲互聯收購的消息後,智東西也第一時間聯繫付強,在獲得對方確認的同時,也獲得了關於此次收購的更多信息。付強曾是中國科學院聲學所的研究員,在語音信號處理領域擁有20餘年是深厚經驗,此次加入阿里,他和他的團隊又將上演怎樣的故事?


一、阿里全資收購 今年初正式完成

據付強介紹,阿里此次對先聲互聯是全資收購,主要是技術、人才的收購,並在今年年初正式完成。本次加盟的技術人員一共5人,他們多為付強在中科院的原班人馬,其中有一位來自著名的杜比實驗室。

「團隊核心演算法人員包括我之前帶的學生和從杜比實驗室出來跟我一起創業的。他們的共同特點都是能文能武,既能寫出IEEE trans.這樣的領域內國際頂級刊物學術文章,又能深入到實際產品研發」,付強稱。

當談到為何為何選擇加入阿里時,付強談回憶到,他從碩士階段就開始做語音處理了,至今已有20多年,當時做語音並不吃香,但正是他憑藉做事就做透的精神,一直堅持至今。「和有情有義的人,一起做有價值的事」詮釋了他的心聲,無論是最初長達12年的聲學所研究,還是選擇創業,亦或是今天選擇加入阿里,對於他而言都是聲學事業的一個階段,相信他也會在這條道路上走的更遠。

付強及團隊在語音增強等領域創造了多項國內第一,在中科院聲學所期間,他與團隊完成了國家自然科學基金面上等30餘項科研課題,並在包括IEEE Trans.等國內外權威學術刊物及會議上發表論文70餘篇。此外他還積極將學術成果與實際相結合,在2006年和2008年分別和通用、大眾合作,將遠講語音方案應用到車載中,這也是國內最早在消費級產品上的遠講語音探索。

而通過對先聲互聯的收購,付強團隊在遠場語音交互技術的解決方案,也成為阿里IoT場景落地的關鍵一環。


二、籌建聲學實驗室 將語音交互落地更多場景

入職阿里達摩院機器智能技術實驗室後,付強所負責的是語音交互前端處理技術以及方案的研發。他短期的目標是幫助語音交互技術在多種場景和終端上落地,在複雜環境下保持正確的識別率。

讓萬物實現聽說的第一步就是,讓機器「聽清」,而現實場景往往伴隨著各種噪音。比如地鐵機場等場景:有人流聲音、有喇叭音,背景音嘈雜;家庭場景:噪音沒那麼複雜,但涉及到混響、回聲處理;車載場景:不遠不近、混響小,但涉及到胎噪、風噪等擴散場雜訊。

在這些場景中,付強稱他們都有不同的終端產品已經或即將落地量產。在這些已有成績的基礎上,他們會在技術深度和方案的可複製性上有更多的布局。

特別是針對智能家居的需求,付強團隊正在研發基於小陣列語音增強技術的低功耗、低成本、高集成的端雲一體語音交互技術和硬體方案。

最近付強也在與團隊籌建兩個實體聲學實驗室,其中一個是標準的全消聲實驗室,該實驗室將由付強和去年11月份加入阿里iDST的前Polycom聲學設計和信號處理首席工程師馮津偉共同建立。

另一個聲學實驗室則是用於複雜聲學環境下的語音交互系統在線端到端測試。這有別於現有的遠講語音交互測試認證方法,其特色是在局部區域內建立真實的聲場場景(家庭、車載等),在此環境中建立自動化的一整套測試流程,從而提升對語音交互IoT終端設備的賦能效率和產品質量。

付強還稱,隨著阿里在晶元上的戰略布局,他們也會在語音專用晶元上有更多進展。這不由得就讓我聯想到,在2013年7月誕生的國內首顆專用語音晶元,就是由四川長虹和當時在中科院聲學所的付強團隊共同研發的,該晶元在語音識別的基礎上,融合了多方面的語音增強功能,包括語音降噪、回聲消除、波束形成等,支持低功耗喚醒,能夠實現遠場語音採集。

可以預見的是,不遠的未來,付強團隊或許也會為阿里帶來一顆語音專用晶元。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智東西 的精彩文章:

互聯網+時代的電子政務:千億市場的新一輪黃金髮展期
眾趣科技獲2400萬元A輪融資 同步推出新款3D相機

TAG:智東西 |