錯誤率超低 IBM語音識別已接近人類水平
【觀察者網編譯報道】你知道在對話過程中,一個人聽錯或漏聽字詞的概率是多少嗎?在我們聽到的20個詞中,普通人一般會聽錯或漏聽1到2個詞。這意味著,在5分鐘的對話中,你可能會錯過80個詞。但是,對大多數人來說,這並不會構成溝通障礙。可是,如果和一台電腦對話呢?
3月7日,IBM宣布說,該公司的語音識別軟體的錯誤率已經降到了5.5%。美國《軟體開發時代》3月8日報道說,人類的語音識別錯誤率大約為5.1%,這意味著,IBM的語音識別軟體已經與人類的語音識別能力非常接近。
IBM總裁弗吉尼亞·羅曼提
據美國《商業內幕》3月9日報道,IBM此前曾創造錯誤率僅為6.9%的語音識別記錄,但在2016年,微軟宣布其語音識別軟體的錯誤率僅為6.3%。但5.5%並不是IBM的最終目標,IBM也將人類的語音識別錯誤率5.1%設定為自己的目標。
「現在還不是慶祝的時候。」《軟體開發時代》引用IBM科學家喬治·桑恩的話說,「我們將繼續致力於創造一種能夠跟得上人類耳朵、聲音和大腦的交互相的軟體。現在的成果讓我們充滿動力,未來的工作也會在目前工作的基礎上進行,最重要的是,我們想要達到最高的標準。」
IBM早期研究語音識別的科學家
《商業內幕》說,這一突破對智能手機中的人工智慧軟體,比如Siri和谷歌助手等來說是一個積極信號。
儘管取得了可喜進步,但這一技術距離識別人類自然對話仍有不小距離。「識別人類的對話依然是一個巨大的挑戰,因為人類的對話,特別是自然而然的對話,是非常複雜的。」美國哥倫比亞大學計算機科學系教授朱莉婭·希爾施貝格說。
哥倫比亞大學計算機科學系教授朱莉婭·希爾施貝格
儘管因為音調和習慣用語等問題,這一軟體識別人類的自然對話尚有一定距離,但對機械朗讀的識別程度已經很多。
此外,IBM介紹說,5.5%低錯誤率是通過長短期記憶、WaveNet語言模型和三個強聲學模型實現的。而這一結果則是使用SWITCHBOARD和CallHome語料庫測試得出,具有相當的權威性和業內認同。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。
※王思聰概念股九好集團忽悠式重組 被頂格處罰
※北上廣深興起「獨聯派」式公寓
※兩千年後繼續批秦是怎樣的一種「政治正確」
※對用戶下KPI考核指標,百度貼吧可能是第一個
TAG:觀察者網 |
※細思恐極,AI可以預測人類壽命了,準確性接近70%
※SCARPA DAYLITE多功能接近鞋—戶外徒步新選擇
※GPA有多重要 加州歐文恢復所有高年級GPA優秀學生錄取 而低分生入學接近無望
※4G資費持續降低,半數WIFI運營商出局,接近尾聲?
※WE奪冠MSI賠率高達9倍 但已是最接近SKT的隊伍
※足球彩票:英超MVP無限去接近意甲勁旅
※李小龍飛踢高度有接近3m,打NBA會是什麼水平?
※NASA证实有一未知巨大人造物正接近地球
※盤後分析:接近缺口就是接近階段性頭部
※小米MIX2重磅大料,屏佔比接近百分百,其他友商該如何應對?
※函數365之CEILING函數:將數值向上舍入到最接近的指定數值的倍數
※NVIDIA最新DX12特效無限接近真實:真怕被這團火燒到
※高配版iMac Pro你也就看看 價格接近12萬元
※$1.5起接近史低價!GNC保健品低至3折!魚油葡萄籽不到9刀
※人可以接近無限完美,人類社會卻未必
※在Steam平台,中文用戶總數已接近兩成
※清晰度飆升!iPhone 8解析度接近2K,PPI高達528,果粉夙願終於實現
※NASA警告有一顆超大型小行星接近地球
※落花有意流水無情!槍手主帥不屑英超MVP,稱從未與之接近簽約