當前位置:
首頁 > 最新 > 智能語音將成下一代人機交互新入口

智能語音將成下一代人機交互新入口

2017廣州《財富》全球論壇晚宴上,小女孩用一口流利的英語和科大訊飛機器人「曉曼」交流,「曉曼」「聽懂」後立即用中文回應。

「Hello,我是林志玲,祝您一路好心情哦」、「我是羅永浩,請鎮定一下,我要開始導航了」,對於某些地圖導航的用戶來說,這樣的語音一定不陌生。但你可能不知道,這並不是一字一句錄製,而是藉助了科大訊飛的語音識別功能。只需要3小時的聲音素材,就可以合成所需要的聲音。

2017年11月,國家科技部宣布科大訊飛以智能語音成為國家新一代人工智慧開放創新平台之一。包括BAT在內的互聯網巨頭也紛紛搶灘智能語音領域。

智能語音為何能成為人工智慧領域的重點項目?站在第三次人工智慧浪潮的當口,智能語音的應用又將如何改變我們的生活?

商業一線

智能語音在多個領域廣泛應用

智能語音設備之外,中國企業在語音轉寫技術、語音輸入法方面也走在了商業應用前沿

當你回到家,說聲「叮咚叮咚,我回來了」:燈自動打開,窗帘自動閉合,空調啟動,電視自動打開並跳轉到你平時最常看的頻道,客廳里響起你喜歡的音樂——京東和科大訊飛合作推出的叮咚智能音箱就是這個智能家居場景的「總導演」。

近幾年,國外微軟、蘋果、亞馬遜,國內科大訊飛、騰訊、百度、阿里等企業,無一不在緊鑼密鼓地推進智能語音的商業應用落地。

2011年,蘋果Siri語音助手正式亮相。正是以Siri的發布為引爆點,智能語音應用領域由傳統行業向移動互聯網等新興領域延伸。在2017年蘋果WWDC開發者大會上,Siri的智能化進一步提升,加入了實時翻譯功能、支持上下文的預測,用戶甚至可以用Siri作為Apple TV的遙控器。

中國智能語音交互系統的另一家領軍企業百度在智能語音領域深耕多年。去年,百度推出DuerOS系統,廣泛應用於音箱、電視、冰箱、手機、車載多個場景。在1月9日舉行的2018年CES(國際消費類電子產品展覽會)上,百度發布了DuerOS 2.0 的三款硬體產品——智能視頻音箱、智能音箱燈和智能投影吸頂燈。

百度度秘事業部總經理景鯤表示,根據IDC的報告,在2020年前,27%的智能家庭將會擁有智能語音設備,51%的智能汽車和68%的智能手機和智能穿戴設備也會具備語音對話功能。「DuerOS是一個活躍的對話式AI生態體系,不僅有設備合作商,還有晶元製造商、系統整合商、內容開發者等等。」

智能語音設備之外,中國企業在語音轉寫技術、語音輸入法方面也走在了商業應用前沿。

在2017年的全國兩會上,科大訊飛的產品「訊飛聽見」利用人工智慧實時語音轉寫技術,首次在政府工作報告網路直播中實現同步字幕直播。此外,智能語音輸入應用讓訊飛輸入法用戶突破5億,截至目前已支持22種方言語音輸入,方言識別準確率達90%以上。

2017年11月,國家科技部宣布科大訊飛以智能語音成為國家新一代人工智慧開放創新平台之一。

對此,科大訊飛股份有限公司品牌管理部總經理、華南公司副總裁吳駿華向記者表示,智能語音之所以成為新時代人工智慧應用發展的重點方向之一,一方面來自於語音技術的成熟,另外一方面則是在萬物互聯的時代,語音成為了人機交互的新入口。

據吳駿華介紹,作為平台企業,科大訊飛會把人工智慧核心技術開放出來,構建持續閉環迭代的生態體系。「我們將平台對廣大的創客團隊開放,截至2017年12月,訊飛開放平台的累計終端數已經達到15億,日均交互次數達到40億,創業團隊數已經達到了50萬。」

技術前沿

智能語音五年內將像水和電一樣無處不在

除了語音識別之外,語義理解是目前各大企業需要攻克的技術難關

智能語音是人工智慧技術的重要組成部分,包括語音識別、語義理解、自然語言處理、語音交互等。

目前,在語音識別方面,科大訊飛、百度、蘋果、谷歌等主流平台識別準確率均在96%以上,穩定的識別能力為智能語音技術的落地提供了可能。

「科大訊飛在語音識別上已經做到98%了。」吳駿華表示,在國際語音合成大賽(Blizzard Challenge)中,科大訊飛連續十二年蟬聯第一名。在2016年CHiME Challenge國際多通道語音分離和識別大賽中,科大訊飛包攬全部三個測試項目的冠軍,並大比分刷新歷史紀錄。吳駿華告訴記者,接下來,科大訊飛還要做多方言語音識別。目前,訊飛已經做到了22種方言。

百度在2017年宣布ALL IN AI之後,除了發力自動駕駛之外,也在語音智能方面持續發力。

景鯤表示,百度人工智慧技術的方向包括語音識別Deep Speech、視覺識別「智能讀圖」、自然語言與智能語義等。憑藉PaddlePaddle深度學習平台、億萬級大數據訓練處理能力和超高速異構AI計算集群三大核心技術, 可模擬低齡人腦思維,擁有語音、圖像、自然語言處理、用戶畫像四大能力。「其中,語音識別準確率達97%,支持27種語言互譯。」

除了語音識別之外,語義理解是目前各大企業需要攻克的技術難關。吳駿華坦言,按照目前實現的語音合成和語音識別技術,科大訊飛可以完成在固定的範圍內回答問題,但是在邏輯推理上機器今天還是沒有辦法實現突破。在語音理解沒有重大技術突破的前提下,機器在語義理解方面還存在不小挑戰。

微軟亞洲研究院院長洪小文博士也指出,要做到百分之百的語義理解,是一個AI complete問題,只有解決了其他AI的問題才可能有解。「比如,你去參加一個雞尾酒會,周圍非常嘈雜,你講的話裡面十個有九個字我都沒有聽清,可是因為你講的內容我大概知道,所以即使我聽不清還是能夠猜出你講的是什麼。但如果用語音識別和語義理解,可能會失敗。在具體的應用場景,除了語音,還包括視覺、知識的綜合使用,這是語音人工智慧未來的挑戰。」

國家政策層面,也在大力推動智能語音的發展。去年12月14日,科技部印發《促進新一代人工智慧產業發展三年行動計劃(2018—2020年)》,明確對智能語音的發展做出展望,「到2020年,實現多場景下中文語音識別平均準確率達到96%,5米遠場識別率超過92%,用戶對話意圖識別準確率超過90%。」

對於未來智能語音的普及推廣,吳駿華表示,在政策和行業的雙重推動下,預計未來五年內,智能語音會像水和電一樣無處不在。」

行業格局

智能音箱背後是語音交互技術的競爭

智能語音技術的普及,讓智能音箱、智能家居客廳重回大眾視野,成為科技巨頭的「新寵」

在享有「互聯網女皇」稱號的瑪麗·米克爾發布的2016年互聯網趨勢報告中,超過十分之一的篇幅在論述語音識別交互帶來的改變。報告將語音功能讚譽為「人機交互的新範式」,並稱語音功能「解放了雙手和眼睛,擴展了永遠在線的概念。市場認為,智能語音交互有望成為下一代人機交互新範式。

記者梳理髮現,目前智能語音的參與者中,可以分為互聯網巨頭企業、智能語音公司、初創企業三種類型。

國內以BAT為首,國外以谷歌、亞馬遜、蘋果為首的互聯網巨頭,開放語音生態系統,以產業內合作的方式,將語音技術植入產品和或應用於相關業務場景,構建全產業生態鏈。2017年7月5日,百度在北京舉辦「2017百度AI開發者大會」,發布了DuerOS開放平台,開放技術能力滿足智能語音設備開發者的需求。

而以科大訊飛為代表的智能語音公司,依託原有優勢,從單一智能語音技術商向全方位人工智慧技術服務商轉變。思必馳、雲知聲、出門問問等初創廠商,則以垂直領域和細分場景為突破口,重點布局家居、車載和可穿戴設備。

不論哪種類型的參與企業,無一例外都開發了同一款產品——智能音箱。智能語音技術的普及,讓智能音箱、智能家居客廳重回大眾視野,成為科技巨頭的「新寵」。

去年7月,百度收購美國語音交互技術公司KITT·AI,就在同一天,阿里發布智能音箱「天貓精靈X1」。此前,京東聯合科大訊飛推出了「叮咚音箱」,騰訊雲發布了「小微」。而國外智能音箱競爭大戰早已打響,隨著亞馬遜Echo打開智能音箱的市場,谷歌的Google Home、蘋果的Home Pod、微軟的Invoke陸續上線。

縱觀國內外市場,智能音箱市場引爆之勢呼之欲出。

據Research and Markets研究報告顯示,全球智能語音市場將持續顯著增長,預計到2020年全球語音市場規模預計將達到191.7億美元。近日,Canalys公布的報告也預測,2018年將是智能音箱普及的一年,相比2017年出貨量的3000萬台,2018年的出貨量預計將達到5630萬台。

通過智能語音交互技術,佔領未來智能生活的家庭入口,這是國內外科技巨頭紛紛布局智能音箱背後的深層邏輯。

中大創投聯合創始人鄭貴輝認為,聲音這種最直接的指令方式,被認為是目前最好的人機交互方式,也成為了控制其他家庭硬體的方式。從產業角度看,智能音箱實質是通過聲音做智能交互,而音箱只是一個表現形式。現在這些巨頭做的智能開放平台,目的都是聚合技術,提升產品的競爭力。「科技巨頭們都蓄謀已久,瞄準這個風口。以智能音箱為載體,背後是智能語音交互技術的競爭。」

大事記

2011年

蘋果Siri語音助手正式亮相。

2014年11月

亞馬遜發布第一台Echo智能音箱,2016年銷量突破500萬台,2017年預計Echo銷量超1000萬台。

2017年

科大訊飛語音識別的準確率進一步提升到98%,中文準確率超過了英文。

2017年6月8日

科大訊飛AIUI開放平台上線,幫助開發者實現產品智能化。

2017年7月

在國際語音合成大賽(Blizzard Challenge)中,代表中國參賽的科大訊飛AI研究院、語音及語言信息處理國家工程實驗室包攬了本次賽事核心指標的冠亞軍。

2017年7月5日

百度在北京舉辦「2017百度AI開發者大會」,發布DuerOS開放平台。

2017年7月5日

阿里巴巴在北京舉行「阿里人工智慧實驗室2017夏季新品發布會」發布阿里人工智慧實驗室第一款智能語音終端設備「天貓精靈X1」。

2017年11月15日

科技部召開了新一代人工智慧發展規劃暨重大科技項目啟動會,科大訊飛成為四大國家人工智慧開放創新平台之一。

2017年12月14日

科技部印發《促進新一代人工智慧產業發展三年行動計劃(2018—2020年)》,對智能語音的發展做出展望,「到2020年,實現多場景下中文語音識別平均準確率達到96%,5米遠場識別率超過92%,用戶對話意圖識別準確率超過90%。」

2018年1月9日

CES(國際消費類電子產品展覽會)上,百度發布了DuerOS 2.0 的三款硬體產品——智能視頻音箱、智能音箱燈和智能投影吸頂燈。

AI大局觀

人工智慧已準備好

為世界賦能

科大訊飛 魏思

當前,人工智慧的第三次浪潮已經到來,其廣闊前景和戰略意義日益凸顯,且正在全球範圍內引發全新的產業浪潮。

人工智慧從技術階段上主要分為計算智能、感知智能和認知智能三個階段。計算智能是讓機器具備能存會算的能力,目前,人工智慧的計算能力已經超過了人類。感知智能是讓機器能聽會說,在這一領域,人工智慧也超過了絕大多數的人類。比如,科大訊飛的語音識別技術可以把語音實時轉寫成文字,準確率超過了速記員。

認知智能是人工智慧的高級階段,科學家們期望推動機器擁有類似人類的智慧,甚至具備各個行業領域的人類專家的知識積累和應用的能力。在認知智能領域,中美兩國都已經進入無人區。

2017年12月11日,國家科技部將認知智能國家重點實驗室交由科大訊飛來承建,這是繼科技部公布科大訊飛列入國家首批新一代人工智慧開放創新平台之後,又一次把探索人工智慧頂尖領域的任務交給了科大訊飛。

在人工智慧時代,我們一直認為,人工智慧是用來延伸人類能力而非替代人類,不是說用技術去替代某些行業的工作,而是希望人機耦合互動提高效率。例如速記行業,人工轉寫準確率是80%,機器轉寫在大部分場景下的準確率是95%以上。將來最好是讓速記員和「訊飛聽見」合作,可能一個人帶著100個機器去100個會議,並做到正確率100%的會議記錄轉寫。

今天人工智慧助手可能只能幫我們解決10%的工作,但很快,它就能幫我們可以解決30%甚至80%的工作,五年以後希望人工智慧能夠幫我們解決90%以上的工作。與此同時,人類可以去做更具創意的事情。人機耦合互動,是未來人工智慧最有希望做成,而且也是最滿足社會倫理價值觀的模式。

人工智慧的概念很宏大,但真正的成功會依賴於垂直滲透,核心技術的持續突破,使得機器通過學習頂尖專家知識,達到一流專家水平,並超過90%的普通專業人士。因此,人工智慧已準備好為世界賦能。

這是否意味著以後人工智慧的世界只要有演算法,機器就可以無所不能了呢?我們認為,在絕大部分領域中,用人工智慧改變世界,需要具備三要素:核心技術、行業數據、領域專家。

通過和教育部考試中心共建人工智慧聯合實驗室、和中國醫學科學院北京協和醫學院共建醫學人工智慧研發中心、和最高人民檢察院共建創新研究院,科大訊飛正在努力搭建平台,用最好的數據和專家去訓練具有核心技術的人工智慧系統,讓人工智慧更好地服務於教育、醫療、司法等各行各業。

科大訊飛在2015年正式發布AIUI平台,吸引和鼓勵開發者們使用頂尖的人工智慧技術去做各個細分領域的市場。截至2017年12月,訊飛開放平台累計終端數超過15億,開發者團隊達到50萬家,日均交互次數已達40億。

我們認為,將來決定人工智慧發展的是整個產業鏈的發展,整個產業生態的繁榮才能推動整個人工智慧的成長。同時,我們還把人工智慧生態延伸到技術創新的科學家,讓每一位科學家的源頭技術創新成果可以集成到AIUI平台上,不僅賦能開發者,也能幫助科學家。

在華南地區,我們成立了科大訊飛華南人工智慧研究院,將圍繞自然語言理解、圖像識別、大數據基礎平台、雲計算平台等核心技術方向開展研究工作。同時,將人工智慧核心技術創新與行業應用相結合,打造覆蓋華南地區、產業特色明顯、創新能力突出、輻射帶動作用強的一大批人工智慧示範應用。

在教育領域,我們的英語智能學習平台「E聽說」提供了涵蓋英語聽說考試、教學、練習全場景的學習及備考解決方案,科大訊飛希望通過人工智慧技術使因材施教成為現實。在醫療領域,科大訊飛的語音電子病歷、醫學影像輔助診斷系統、導診機器人等產品可以大大節約一線醫生的時間。

「人工智慧+」時代正在來臨,未來人工智慧會像水和電一樣無處不在。科大訊飛將繼續堅守在人工智慧的道路上,為中國的人工智慧產業作出應有的貢獻,用人工智慧建設美好世界。

(作者系科大訊飛華南人工智慧研究院院長)

(責任編輯:張潔欣)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國網 的精彩文章:

TAG:中國網 |