為何一條「怪魚」能夠入選MIT2018十大突破性技術?
在過去的2017,科技界經歷了許多大事件。阿爾法狗大戰世界頂尖圍棋選手,無人駕駛汽車上路,光量子計算機誕生,發現新引力波……每一件都給世界帶來新的變化。《MIT Technology Review》(下稱MIT)發布2017「全球十大突破性技術」,其中多項「突破性」技術已經被印證在改變世界。2018年MIT又預測了哪十大突破性技術?
在2018MIT「全球十大突破性技術」官方榜單上,一款名為「巴別魚耳塞」入選其中。「巴別魚」(babel fish),說起來很拗口,其實是音譯詞。它源於美國作家的科幻喜劇《銀河系搭便車指南》中虛構的一種生物,以聲音中的語言概念為食,消化後排出跟寄主同調的腦波。所以只要把魚塞進耳朵里,就可以聽懂各種語言。
當前「巴別魚」的主要研究者不僅有谷歌這樣的國際科技公司,也有中國國家人工智慧四大創新型平台之一的科大訊飛名列其中。
谷歌智能耳機Pixel Buds展示了實時翻譯的前景,而科大訊飛的曉譯翻譯機則進一步貼近生活,面向出境旅遊和商務場景,實現中英、中日、中法、中韓等中文和多語種之間的互譯,在日常交流、購物、點餐、旅行、生活、輔助工作、學習等場景下實現極速翻譯,為全球六個大洲、137個國家的用戶提供翻譯服務,累計服務次數超過2000萬次,創造了翻譯機新品類的市場奇蹟!
在全球化日益發展的今天,語言仍是人類交流的一大障礙。想要聽懂各種語言,除了依靠人工翻譯,現在還能夠靠人工智慧技術。譬如,在語言服務領域,說中文翻譯成英文或其他語種,反之亦然。這技術稱之為機器翻譯。這一翻譯過程是機器模擬人腦的套路,首先通過語音識別理解人說話的意思,然後經過自然語音理解形成對說話人的語義表示,接下來把語義轉換成另一種語言來表達,如果需要機器說出來,那就應用到語音合成技術。這一機器翻譯過程恰好就是曉譯翻譯機的原型。
上市一年多時間來,曉譯翻譯機不僅開拓了翻譯市場,還貢獻了智能翻譯三大標準,跟人工翻譯的「信達雅」標準一樣,需要「聽得清」、「聽得懂」、「表達專業」。
眾所周知,人工翻譯服務其實並不會因為少聽或誤聽一兩個詞而出現重大翻譯失誤。可是,機器就不行了,每一個詞都很關鍵。因此「聽得清」的智能翻譯標準尤為關鍵。據悉,訊飛翻譯機基於深度全序列卷積神經網路(DFCNN)語音識別框架提升語音識別率高達98%,使語音識別的詞錯率低於人類,同時遠場識別技術保證在複雜環境下如嘈雜的交流環境和信號不佳的情況保持專業翻譯狀態。
隨著語音識別準確率不斷提升,如何讓機器「聽懂」人話並準確翻譯,成為使用體驗至關重要的一環。通過日常使用的監測,日常主要是口語化的表達,區別於書本上的標準表達。這個難點在於自然語言理解,而機器閱讀理解是自然語言處理中最關鍵的部分。日前,科大訊飛與哈工大聯合實驗室(HFL)在由斯坦福大學發起的機器閱讀理解領域權威評測SQuAD中兩次登頂。他們提交的融合式層疊注意力系統(Hybrid Attention-over-Attention Reader)融合了近期學術界提出的諸多前沿技術,如基於上下文的文本表示、自適應轉隨機梯度下降的優化方法等,同時又研發出一些全新技術,不僅在EM指標(精準匹配率)超過人類平均水平,並成為首個F1指標(模糊匹配率)上超過89%的系統。
為了讓體驗更出眾,尊重表達,將翻譯結果展現出來,智能翻譯產品不局限於發送文字和圖片,最好是有媲美真人聲音讀出來,不用語言的自由轉換成為現實,讓用戶擁有便捷而愉悅的服務。
利用神經網路技術打造出普適性的翻譯技術,通過一個模型翻譯多種語言。像曉譯翻譯機,做到了至少五國語言的互譯;通過技術升級,還實現了離線翻譯,遇到網路不佳或無網路也可以實時翻譯。這也是一個翻譯人員很難匹及的。
那麼翻譯,以後不需要人來做了嗎?從目前效果看,機器翻譯還達不到專業人工翻譯的水準,只能適用於日常溝通和網路交流,尚不能形神俱全地翻譯藝術作品。許多優秀的工作都在做翻譯產品,我們現在看到的無論翻譯機還是智能耳機,都是為了提高工作效率,形成人機耦合模式而不是取代。從訊飛側了解到,他們的優勢是把業界最好的演算法跟行業專家、用戶大數據結合起來,通過不斷更新迭代升級產品功能,進一步增強用戶粘性。


TAG:人工智慧那些事 |