反思仿製Echo的熱潮:為什麼國外巨頭要布局AI交互?
美國調查公司VoiceLabs在本年初發布了《2017年語音報告》,報告中對目前美國智能語音市場進行了調查,特別是亞馬遜Alexa和谷歌Google Home的開發者和消費者。報告中預測2017年將有2450萬台以語音為主要交互方式的智能硬體產品發貨,市場總量將達到3300萬台,市場規模超過200億美元。
語音為主的智能硬體產品
隨著亞馬遜的智能音箱Echo銷量逼近千萬,蘋果的智能耳機AirPods登頂美國無線耳機市場榜首,亞馬遜Alexa在美國CES展上大放異彩,國內各個科技公司也紛紛開始了進入語音交互領域。
無論是IT科技巨頭阿里、百度、騰訊、科大訊飛等,還是陸續出現的思必馳、聲智科技、雲知聲、三角獸、驀然、Rokid等創業公司,智能語音產品和語音助手成為競相追隨的熱門話題,儼然形成了一股全行業研究亞馬遜Echo的熱潮。根據聲智科技提供的數據,國內已經有超過200多家公司正在研發類似Echo的智能音箱。
然而,就在國內科技公司還在模仿Echo之時,國外的科技巨頭已經開始進一步搶奪全球語音交互市場的控制權。無論是行業標準的定製,還是戰略專利的布局,抑或是音頻數據集的開放,以及各種產業生態聯盟的搭建,一切都在悄然的進行中。
智能語音交互的行業標準之爭拉開帷幕
3月6日,微軟在其官網上發布了新版本的語音平台測試標準,即2.1版本。微妙的是,就在微軟發布消息的同時,我們驚喜的發現,亞馬遜的官方網站上也已經推出了其語音測試的最新標準,智能語音交互的行業標準之爭已經開始「漸入佳境」。
微軟指出,目前語音平台支持Windows 10中的所有語音體驗,如Cortana和Dictation,而其最新的測試標準適用於所有使用微軟語音平台的音頻輸入設備。其中,直接影響的設計參數,包括語音識別精度和語音處理演算法的性能。目前,微軟還沒有把該測試標準作為設備認證必不可少的環節。然而,隨著測試標準日益規範化,平台用戶數增多,未來的結果一切都不言而喻。
測試環境搭建圖
區別於微軟,亞馬遜也為其所有採用Alexa開發的智能語音產品設立了相應測試標準,然而,此測試並未公開,還是採用黑盒測試的方式,用戶需提交產品給亞馬遜進行相應測試。其產品通過認證測試後,搭載Alexa的智能語音交互產品才可獲得Alexa認證,並在Alexa Smart Home商店出售。
目前通過測試獲得認證的企業
語音交互市場專利布局競爭更為激烈
一直以來,一旦掌握行業標準制定的主導權也就掌握了整個市場的控制權。與其有同樣魅力的便是專利。當今的激烈市場競爭中,專利早已經成為市場競爭的一柄利劍。
從1月19日國家知識產權局公布的數據顯示:過去的2016年,我國國家知識產權局共受理髮明專利申請133.9萬件,同比增長21.5%,這已經是我國第6個年頭專利受理量居世界首位。同時,國外專利的申請情況也保持良好的增長勢頭,2016年通過《專利合作條約》(PCT)途徑提交的國際申請4.50萬件。然而,雖然專利整體保持良好的發展態勢,但是,在語音交互領域國內的專利布局與國外尚存差距。
眾所周知,語音交互涉領域廣泛,是一門多項技術融合的交叉學科,涉及到信號處理、模式識別、概率論與資訊理論、發聲機理和聽覺機理、神經網路,語音識別,機器學習等。其中,語音以及音頻的編解碼(G10L),電數字數據處理(G06F),電話通信(H04M),這三個領域專利累積數量最多,比例高達80%。
從德溫特世界專利索引資料庫平台收錄的自1963年以來全世界40多個專利機構的基本發明的數據來看,語音識別的相關專利約2萬件。
根據CNKI自1985年後收錄的中國專利的數據來檢索關鍵詞語音識別情況
其中,截止到2015年,僅「語音識別」累積專利申請量方面來看,前五位的為IBM,NEC,微軟,Nuance和東芝,分別為749件,508件,506件,415件,406件。而從2010年至2015年的語音識別專利的申請量來看,除了IBM被Google替代,降至第7名,其他幾位仍然保有專利數量的優勢,排名順序是Nuance,谷歌,微軟,東芝,NEC,分別為206件,178件,141件,102件。
巨頭形成的專利防禦攻勢仍然迅猛,而業界所關心的後起之秀也來勢洶洶,2010至2015年,僅「語音識別」方面,谷歌布局專利178件、蘋果布局專利25件、亞馬遜布局專利33件。
對於國外的科技公司來說專利之間的鬥法更加劍拔弩張,專利壁壘正在逐漸形成。從《中國知識產權報》發布的數據來看,截止至2017年1月,蘋果公司在語音領域的專利申請量為695件,而谷歌公司為1261件。從語音領域專利布局方面看,兩家公司在語音領域的技術除了自主研發外,還通過併購語音類相關企業或者收購語音技術相關專利來加強專利儲備。
2013年蘋果公司收購語音識別公司NovaurisTechnologies。經過收購,蘋果公司獲取了該公司的4件語音專利。通過這4件專利,蘋果Siri由可通過簡單識別單個詞句來理解上下文,發展到通過識別超過2.45億個短語來輔助理解上下文的功能,從而大幅度提升語音系統的理解力。
為了應對蘋果公司帶來的激烈競爭,谷歌公司採用了專利「圍剿」戰術。2013年,谷歌公司收購了Wavii公司的一件專利,該專利技術使得谷歌公司的語音搜索識別正確率提高了25%。同年,又收購了SR Tech Group公司的兩件關於語音識別的專利,併購入雅虎公司的一件名為「背景會話上下文搜索技術」的專利,通過購買專利,谷歌公司擁有了完整的語音識別引擎。
目前,中國的語音識別企業專利布局還主要是在國內,國際領域的專利布局情況和國外企業對比,確實還存在巨大差距。不過,國內企業的知識產權意識也越來越強烈,百度,科大訊飛,聲智科技等在近幾年的專利申請上也有不錯的作為。
對比於市場銷量帶來的直接經濟效益,知識產權的價值還不能充分體現。然而,在提高公司效益,搶佔市場,保持公司可持續發展時,知識產權的價值不可小覷,專利作為企業不得不向公眾透露以獲取獨佔權的關鍵信息,對其進行詳細、周密、綜合的分析,可以從中獲得巨大的商業價值,特別是在國際市場競爭中。
谷歌開放音頻數據集,用意不言而喻
3月8日,谷歌開放了一個大規模的音頻數據集 AudioSet。該數據集包含了 632 類的音頻類別,收集了2084320 條人工標記的每段 10 秒的YouTube視頻中的聲音剪輯片段(包括 527 個標籤)。
這些特定音頻是使用基於元數據,上下文(例如,鏈接)和內容分析的搜索來標記的。聲音內容十分廣泛,包括人類的聲音和動物的聲音,各種類別樂曲的聲音和每天日常環境中的各種聲音等。谷歌聲稱:此次開放這個資料庫的目的就是為了滿足學術研究的需求。
從此前ImageNet廣泛數據集的開放效果來看,大部分識別圖像中的目標研究已經從中獲益。而此次,對於利用AudioSet公開數據集訓練機器學習模型的語音識別研究者或者技術公司來說,無疑是獲益匪淺。然而目前,國內的科技巨頭還沒有開源音頻數據集的動作,哪家公司可以有魄力的貢獻資源,我們還要翹首以待?
組建產業聯盟,試圖瓜分市場蛋糕
毫無疑問,通過語言交流獲取知識是人類最有效的學習方式。從PC時代的鍵盤滑鼠過渡到移動互聯網的觸屏操控,下一個AI時代,無疑將會是以語音、體感等多種感知融合的新的獲取方式,而語音交互作為天然的人機交互入口,勢必是對信息生態與未來生活的一種重構。
誠然,語音交互涉及了非常複雜的技術鏈條,包括了聲學處理、語音識別、語義理解和語音合成等核心技術。需要產業鏈上下游相互合作,需要產業夥伴相互合作。目前,美國頂尖的科技公司,INTEL、ARM、谷歌、亞馬遜、Facebook等都紛紛牽頭成立了自己的產業聯盟。
隨著智能語音交互領域不斷發展,國際化的競爭也會日趨激烈。如何積極搶佔全球智能語音交互的主導權?必然是組成產業技術創新聯盟,把握國際標準的制定、積極做好專利戰略布局,才能緊抓國內外同步創新的契機,不再重複PC和移動互聯網時代的遺憾。


※打造一家像Amazon Go的無人零售店,需解決哪些核心問題?
※IBM 語音識別能力逼近人類水平,獲深度學習巨頭 Yoshua Bengio 盛讚
※這個曾經發明「真·雙卡雙待」的晶元大佬展訊,決心挑戰高通和聯發科的高端晶元
※一場訴訟,埋葬了 Google和Uber 之間的動蕩 「婚姻」
TAG:雷鋒網 |
※Inspur World 看什麼?看浪潮的布局與轉型
※熱點|如何使用IMAX Enhanced揚聲器布局
※曝光:filecoin上線前布局IPFS礦機的真實原因!
※硬體全面布局,全新HUAWEI MateBook E來襲
※又一巨頭入局!華為發布首款智能音箱AI Cube,加速布局IoT領域
※逆市布局全時AI和all in OLED背後是創維的萬丈雄心
※如何使用IMAX Enhanced揚聲器布局
※AIoT風頭正旺,行業大佬如何布局?
※群創入股光鋐 強化MiniLED、MicroLED的布局
※蘋果新iPhone要上三攝瘋傳!網友迫不及待的關心攝像頭布局
※CB Insights:全面拆解谷歌AI戰略布局
※浪潮發布AI品牌TensorServer 戰略布局全球市場
※思科結盟AWS,擴大Kubernetes混合雲布局
※提前布局AR頭顯:傳新iOS和macOS底層均支持ARKit
※中國反壟斷部門對台灣集邦旗下DRAMeXchange突擊調查;布局AI邊緣運算商機 IP/晶元/儲存業者各有千秋
※銳成芯微布局RISC-V,加入SiFIVE DesignShare項目
※傳媒:芒果TV首次參展ChinaJoy,利用內容優勢撬動硬體、渠道布局
※全領域空凈產品布局,LIFAair為你的每一次呼吸負責
※「超空間經濟」的誕生:HiDii嗨的國風攜手ACGN行業巨頭深度布局未來生態
※再布局FinTech領域,LINE業務不斷開疆擴土