當前位置:
首頁 > 最新 > 科技巨頭下一個戰略高地,獨家盤點國內外智能語音交互公司有哪些?

科技巨頭下一個戰略高地,獨家盤點國內外智能語音交互公司有哪些?

回顧人類發展歷史,不難看出,隨著人類不斷進化,從最初通過手掌、肢體使用簡單工具、傳遞簡單信息,發展到控制發聲並通過耳朵接收,形成了一個以語音為載體的快速信息傳遞通道和收發閉環,成為人類間最自然、最重要的信息交互手段。聲波作為一種音頻信號,和視頻信號、無線電信號一樣是,非接觸方式傳播,也是人類唯一可以不藉助工具就可自由掌控的一種天然「無線」資源。

語音交互好像離我們越來越近,從2011Siri的橫空出世,各大公司加入語音助手陣列,到Amazon發布Echo, 用智能音箱打響語音交互硬體時代的第一,各大廠商也紛紛發布各自的智能語音產品和語音操作平台。

智能語音交互是基於語音輸入的新一代交互模式,通過說話就可以得到反饋結果。典型的應用場景—語音助手。自從iPhone 4S推出siri後,智能語音交互應用得到飛速發展。中文典型的智能語音交互應用如:蟲洞語音助手訊飛語點已得到越來越多的用戶認可。

近日,物聯網資本論梳理了目前國內外語音交互提供商基本信息。

國外語音交互供應商

Nuance

Nuance全球最大的語音技術公司,超1000項專利技術。目前世界上最先進的電腦語音識別軟體Naturally Speaking就出自於Nuance公司。用戶對著麥克風說話,屏幕上就會顯示出說話的內容。T9智能文字輸入法作為旗艦產品,最大優勢支持超過70種語言,超過30億部移動設備內置T9輸入法。已成為業內認同的標準輸入法,被眾多OEM廠商內置,包括諾基亞、索愛、三星、LG、夏普、海爾、華為等等。T9全球市場佔有率超70%,中國超50%。

Nuance的產品提供人性化、高效率的電話口語或語言辨識功能,消費者可透過傳統的電話系統或行動電話以自然口語交談的方式完成資料查詢及商業貿易,使用輕鬆。在類似的產品中擁有最高的語音辨識率,英文可達99%。其英文語音產品Dragon NaturallySpeaking9在法律和醫院臨床記錄佔據很大市場。

微軟

提到微軟在語音交互的布局,不得不說起微軟兩姐妹,小冰和小娜。微軟現在有三款聊天機器人,主打情感計算的小冰、主打商務助理的小娜,還有在垂直領域的深度應用智能客服。

微軟過去幾十年做的人工智慧方面的研發集成到Azure雲上去,Azure雲支持IoT、Bot Framework,第三方用微軟的人工智慧技術,已經可以通過Bot Framework、Azure IoT等來做。

Azure雲可以實現更多的事情,像語音識別、語言理解、機器翻譯、語音合成。

Sensory

Sensory 致力於改善用戶體驗通過嵌入式機器學習技術,如語音、視覺、和自然語言處理。開發、生產高性價比的語音識別產品。二十多年前公司的創立者開發了第一個語音合成晶元,率先將音頻技術應用到PC機和消費電子產品中。

Sensor的技術從數以百計的出貨量在20億產品領先的消費電子產品製造商包括丙氨酸,孩之寶,華為,谷歌,JVC,LG、摩托羅拉、美泰公司Plantronics,三星、索尼、世嘉,Uniden,V-Tech。感覺有超過35發布專利覆蓋語音識別在消費電子,生物認證,感測器/語音組合,語音識別在DSP的,客戶端/雲使用語音技術等等。

谷歌

Google一直致力於投資語音技術,此前收購多家語音識別技術公司及專利。

2011年,收購語音通信技術公司 SayNow 和語音合成技術 Phonetic Arts。 2014年收購SR Tech Group的多項語音識別相關的專利,其中包括 「 搜索引擎語音界面」 和 「 修改、更新語音識別項目系統」 的專利。

今年4月份Google還開放了自己的語音識別API,即Google 語音搜索和語音輸入的支持技術。Google Cloud SPeech API包括了80多種語言,適用於各種實時語音識別與翻譯應用。

2017年,谷歌宣布了用於語音交互的Actions on Google平台得到進一步擴展。現在該平台將支持所有Google Assistant所支持的平台,在功能方面,Actions甚至允許用戶通過語音完成交易。

蘋果

蘋果收購過Siri、Novauris、VocalIQ等語音技術公司,且請了不少牛B的人組建基於神經網路演算法的語音識別團隊。

蘋果正依靠語音助手Siri構建更大的生態系統,在最新的HomeKit的合作夥伴名單中,除了國內廠商海爾,還有照明廠商飛利浦、科銳 (CREE),以及Marvell(美滿電子)、Honeywell(霍尼韋爾)等全球頂級製造商。

國內語音交互供應商

科大訊飛

科大訊飛股份有限公司從事智能語音及語言技術、人工智慧技術研究,軟體及晶元產品開發,語音信息服務及電子政務系統集成的國家級骨幹軟體企業。

科大訊飛作為中國智能語音與人工智慧產業領導者,在語音合成、語音識別、口語評測、自然語言處理等多項技術上擁有國際領先的成果。

2015年,科大訊飛重新定義了萬物互聯時代的人機交互標準,發布了對人工智慧產業具有里程碑意義的人機交互界面——AIUI。2016年,圍繞科大訊飛人工智慧開放平台的使用人次與創業團隊成倍增長。截至2017年1月,訊飛開放平台在線日服務量超30億人次,合作夥伴達到25萬家,用戶數超9.1億,以科大訊飛為中心的人工智慧產業生態持續構建。

思必馳

思必馳專註人性化的智能語音交互技術,思必馳是國內擁有全套語音類知識產權的公司。在語音識別、語音合成、語義理解、聲紋識別、對話管理、音頻分析等方面均有深厚技術積累。國際上極少數擁有自主產權、中英文綜合語音技術(語音識別、語音合成、自然語言理解、智能交互決策、聲紋識別、性別及年齡識別、情緒識別等)的公司之一。

目前思必馳把語音相關技術整合成 AI OS 人機對話操作系統,作為安卓系統之上的一層標準介面,提供給硬體合作夥伴。針對不同場景,AIOS 又分成了 For Car,For Home,For Robot 等版本,針對車載、家居、機器人等產品做垂直領域下的對話式交互。

出門問問

出門問問有全套語音交互核心技術的創業型公司。該公司基於語音識別、語義識別、垂直搜索引擎、語音合成以及智能推送幾項自主研發的核心技術,擁有自主研發的語音交互、智能推薦、計算機視覺及機器人SLAM等技術,有Ticwear(語音操控的可穿戴設備)、魔法小問(語音操控,提供各類生活服務)、開車問問(智能語音車載APP)以及出門問問智能語音助手,語音識別比較紅火的幾個應用場景基本都有鋪路。以軟硬結合的方式打造多場景聯動AI產品。出門問問的使命是定義下一代人機交互,推動大眾進入人工智慧消費時代。

出門問問應該是除了科大訊飛和百度以外,唯一一家有全套語音交互核心技術的創業型公司。

雲知聲

雲知聲,是一家專註物聯網人工智慧服務,擁有完全自主知識產權、世界頂尖智能語音識別技術的高新技術企業。

雲知聲利用機器學習平台(深度學習、增強學習、貝葉斯學習),在語音技術、語言技術、知識計算、大數據分析等領域建立了領先的核心技術體系,這些技術共同構成了雲知聲完整的人工智慧技術圖譜。在應用層面, AI芯、AIUI、AI Service三大解決方案支撐起雲知聲核心技術的落地和實現,目前已經在家居、汽車、醫療和教育等領域有廣泛應用,形成了完整的「雲端芯」生態閉環。

雲知聲自成立以來,發展迅速,備受人工智慧行業及資本市場的廣泛關注,累積融資近億美元。雲知聲的合作夥伴數量已經超過2萬家,覆蓋用戶已經超過2億,日調用量2億次,其中語音雲平台覆蓋的城市超過647個,覆蓋設備超過1億台。並且,雲知聲連續兩年入選福布斯中國最快科技成長公司50強企業,是中國人工智慧行業成長最快的創業公司之一 。

哦啦語音

哦啦語音於2013年初成立,擁有在中文自然語言理解、語音識別、語音控制和語音交互系統等方面的 20 多項自主專利。目前已應用在智能家居、智能車載、可穿戴設備、語義和交互API服務、智能會議系統、手機語音助手幾個方面。他們家最大的特色,是對於中文語義的理解,針對用戶各種問題可以給出生動、活潑、幽默、精確的回答。

通過哦啦,用戶可以通過語音控制,實現用戶對各種生活信息的實時查詢和操作、對手機內各個程序的調取要求,以及在界面內實現人機互動聊天、娛樂等需求。在未來,用戶只要打開哦啦,就可以完成所需要的手機操作。是第一款實現對於用戶連貫性提問進行全文解析的語音助手。

問之科技

問之科技是一家從事產品自主研發的高科技企業。問之科技專註於人工智慧產品和技術研究領域的開發,致力於打造中國機器人的最強大腦。以語音、語義、視頻技術為核心服務於機器人及智能家居領域,一切旨在為拓展智能交互新體驗,用聲音傳遞簡易生活方式。

SoundAI

SoundAI是一家專註聲學前沿技術和人工智慧交互的科技創新公司,致力於引領真實環境下更自由的人工智慧交互體驗,實現「聽你所言,知你所想」的人機交互願景。

SoundAI提供從軟硬體到雲服務的遠場語音交互技術方案,以及從晶元模組、PCBA到工業設計的Turnkey產品方案,其回聲抵消、雜訊抑制、聲源定位、混響消除、波束形成、遠場語音喚醒、遠場語音識別等技術在業界遙遙領先;同時,聲智科技與ARM、NVIDIA、Xilinx、Cypress、Knowles、百度、騰訊等著名企業深度合作,深耕智能家居、智能汽車、智能安防、智能金融、智能教育和機器人等行業,服務於小米、360、京東、聯想、海爾、創維等著名品牌,共同提升遠場語音交互的用戶體驗。

同時,全面採用聲智科技語音交互解決方案和模組的產品也已經陸續上線。

SoundAI努力以技術拉動產業,以技術改變生活,以技術服務社會,持續推動國內外聲學領域和人工智慧領域的產品升級和技術創新。

慧聽科技

慧聽科技是數據服務提供商。擁有一支專業的數據製作團隊,負責完成過語音識別、語音合成、語音評測、語言文本類、多媒體類等多領域數據製作,並參與過語音合成、語音識別、輸入法系統的研發。同時,慧聽科技還有一支高水平技術研發團隊,為數據服務提供強大的技術支撐。公司的硬體設施過硬,擁有符合ITU國際標準的錄音室和錄音設備。在管理方面,慧聽公司採用全程質量監控流程,執行完善的標註流程,配合保密管理手段,提供質量上乘的數據服務。

目前,慧聽科技能夠提供語言語音、多媒體兩大類幾十餘種數據服務。

馳聲科技

馳聲科技專業從事智能語音技術研究和產業化的教育科技公司。是國內最早進入教育行業的語音公司之一,馳聲科技自主研發了基於大數據、深度學習的智能語音系列技術,幫助客戶實現人機互動的智能學習產品,引領教育信息化創新發展。

迄今,馳聲科技已在培訓、出版、教育軟體、在線教育、教育硬 件、考試服務等領域培養了一大批標杆客戶,馳聲科技的智能學習技術也已惠及海內外數以億計的個人學習者。市場上應用了智能語音技術的教育產品 半數以上都採用了馳聲科技的先進技術。

作為此輪教育信息化浪潮的中堅力量,馳聲科技將持續、專註地為國內外教育企業提供最專業、最完善、最優質的智能技術與服務,並致力於成為 世界一流的智能語音技術品牌服務商。

百度語音

百度語音為開發者,提供業界優質、免費的語音技術服務。通過場景識別優化,為車載導航、智能家居等行業提供語音解決方案。融合依存句法分析、信息抽取、短文本分類等自然語言處理技術。

垂直場景識別模型。在提供通用語音能力的同時,百度語音還提供針對特定垂直領域的語音聽寫模型。開發者可根據使用場景,自定義設置識別垂類模型。有音樂、視頻、地圖、遊戲、電商共17個垂類領域可供選擇。

豐富的垂直資源。語義解析可以識別用戶的意圖並提取用戶表述中的關鍵內容,從而幫助開發者理解用戶需求,百度語音識別服務支持35個領域的語義解析,可進行多意圖解析、具備強大的糾錯能力,依託百度知道等社區產品上積累的強大知識庫,更能夠做到智能推理、「不言而明」。

靈雲科技

北京捷通華聲科技股份有限公司成立於2000年10月,是一家專註於智能語音、智能圖像、生物特徵識別、智能語義等全方位人工智慧技術研究與應用,全面發展人工智慧雲服務的高新技術企業。靈雲平台隸屬於北京捷通華聲科技股份有限公司。

2001年,捷通華聲推出代表國內最高水平的中文語音合成技術,全面開啟了中文語音合成技術在中國信息產業發展中的實用化進程,奠定了捷通華聲在中國語音產業界的穩固地位。歷經十年發展,捷通華聲所擁有的自主知識產權的中文語音合成、手寫識別技術在語音交互、模式識別技術市場佔有率達到50%,成為國內第一家倡導並實現同時提供語音合成、語音識別、手寫識別、文字識別等技術的全方位人工智慧技術提供商。

輕生活科技

深圳市輕生活科技有限公司由國家級高新技術企業深圳市超維實業有限公司100%投資,於2015年4月在深圳成立、註冊資本1000萬。

輕生活科技聚焦研究語音交互控制技術和語音搜索技術,並整合WiFi、BLE、RF等先進的物聯網技術、雲服務技術、大數據技術等為智能家居行業提供短平快小生態技術解決方案;公司專註以前瞻智能語音技術(語音識別技術、語音合成技術、降噪、去回聲等前端處理技術),致力於家居物聯網智能語音交互技術軟體與硬體的開發;為輕生活品牌提供完整產品,透過輕生活科技來整合優質的上遊資源形成輕生活獨有的產品方案,並通過自己的品牌產品來示範和檢驗並完善方案,從而更好的為輕生活開放性研發平台的客戶、加盟方案友商服務。

阿里雲(小Ai)

智能語音交互(Intelligent Speech Interaction),是基於語音識別、語音合成、自然語言理解等技術,為企業在多種實際應用場景下,賦予產品「能聽、會說、懂你」式的智能人機交互體驗。適用於多個應用場景中,包括智能問答、智能質檢、法庭庭審實時記錄、實時演講字幕、訪談錄音轉寫等場景,在金融、保險、司法、電商等多個領域均有應用案例。

搜狗語音

搜狗從2012年開始研發智能語音技術,並在2013年開始進行深度學習。目前,搜狗的智能語音技術已經成功應用至搜狗的全線產品中。搜狗方面的數據顯示,搜狗搜索日均語音搜索次數增長超過4倍,搜狗輸入法日均輸入超過1.4億次。

搜狗「知音」引擎解決了用戶在說話過程中因語速過快而導致的吞音問題。語音識別錯誤率相對下降30%以上,語音識別速度提升3倍;「知音」能夠在語音交互中支持用戶修正錯誤的識別結果,用戶可使用自然語言進行改錯。比如,用戶可以說把「張」改為「章」。

此外,「知音」還支持多輪對話,處理更複雜的用戶交互邏輯,用更自然並且用戶更容易接受和理解的方式進行交互。

亞馬遜Alex

Alexa是亞馬遜的雲語音服務提供數以百萬計的設備從亞馬遜和第三方設備製造商。用Alexa,您可以構建自然聲音的經驗,提供客戶更直觀的方式與他們每天使用的技術。我們收集的工具、api、參考解決方案,和文檔方便任何人用Alexa構建。

亞馬遜Alexa與谷歌Assistant正圍繞各自的語音助手輔助應用展開激烈的競爭,兩家公司都在努力讓助手們儘可能多地搭載汽車、智能音箱、集線器、耳機、智能手機和其他設備上使用。例如,谷歌最近宣布與門鎖製造商西勒奇(Schlage)在語音助手方面進行合作,而Alexa也即將應用於藍牙汽車充電器。谷歌與它的智能助手相比Alexa確實更有優勢:它在許多國家(在歐洲和其他地方)比Alexa更有市場。方案,和文檔方便任何人用Alexa構建。

捷通華聲

北京捷通華聲科技股份有限公司成立於2000年10月,是一家專註於智能語音、智能圖像、生物特徵識別、智能語義等全方位人工智慧技術研究與應用,全面發展人工智慧雲服務的高新技術企業。

2001年,捷通華聲推出代表國內最高水平的中文語音合成技術,全面開啟了中文語音合成技術在中國信息產業發展中的實用化進程,奠定了捷通華聲在中國語音產業界的穩固地位。歷經十年發展,捷通華聲所擁有的自主知識產權的中文語音合成、手寫識別技術在語音交互、模式識別技術市場佔有率達到50%,成為國內第一家倡導並實現同時提供語音合成、語音識別、手寫識別、文字識別等技術的全方位人工智慧技術提供商。

本文為物聯網資本論編輯部獨家盤點,未經允許不得轉載

掃碼添加客服

拉你進入交流群

物聯網資本論

物聯網產業第一財經媒體


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 物聯網資本 的精彩文章:

打響CES第一槍:英偉達發布全球最強芯;諾基亞攜T-Mobile及英特爾成功部署5G商用基站

TAG:物聯網資本 |