當前位置:
首頁 > 新聞 > 清華馬少平教授:搜狗翻譯寶Pro強在大數據

清華馬少平教授:搜狗翻譯寶Pro強在大數據

9月19日,搜狗正式對外發布新的智能翻譯硬體——搜狗翻譯寶Pro。多場景的翻譯測試數據顯示,搜狗翻譯寶Pro的準確度評分遠超世面主流翻譯產品。中國人工智慧學會副理事長、清華大學馬少平教授對此表示,「大數據語料」是決定智能翻譯「聽懂、看懂、說清」的關鍵,而這正是搜狗翻譯寶Pro的優勢所在。

另據了解,搜狗翻譯寶Pro離線翻譯支持中英日韓4種語言互譯,在線翻譯可支持法語、阿拉伯語、德語、義大利語、西班牙語等42種語言互譯,覆蓋200多個國家。同時,搜狗翻譯寶Pro還加入了實景拍照翻譯功能,能幫助用戶準確識別點餐、問路等各種場景下的文字信息。尤為值得一提的是,搜狗翻譯寶Pro離線翻譯與雲端翻譯結果基本無差異。這也是其區別於市面上其他競品的又一亮點。

當前,隨著通信技術的不斷發展,語言對溝通產生的阻礙越發明顯,包括谷歌、微軟、Facebook、搜狗、騰訊等各大科技公司都在發力智能翻譯技術,市場上的翻譯機產品也如雨後春筍一般湧現。但這些翻譯軟體、翻譯機的實際效果卻並不盡如人意。此前曾有評測報告顯示,這些翻譯APP和「翻譯機」將外語翻譯成中文時的準確率非常低。

馬少平認為,智能翻譯必須以大數據語料做支持。如果機器翻譯缺乏大數據支持,就只能按照既定的語法規則將辭彙組織起來,無法領會語言的自然性和多義性。這種情況下,翻譯出的結果通常不符合語言的習慣表達方式,基本不能直接使用。

數據顯示,搜狗每天語音請求次數在3 億次,每天可以收回大概24萬小時的語料數據。中國人工智慧學會和IEEE會員、北京郵電大學計算機學院教授石川對此也表示,任何一項人工智技術的發展都離不開大數據。智能翻譯領域也不例外,得語料者才能得天下。搜狗在此方面的優勢保證了搜狗翻譯寶Pro能在眾多智能翻譯硬體中脫穎而出。

大數據語料之外,強大的人工智慧技術加持是搜狗翻譯寶Pro能夠在眾多競品中脫穎而出的又一原因。作為中國知名的互聯網企業,搜狗多年來一直在人工智慧領域展開投入,並完成了全球獨創的神經網路機器翻譯技術。該技術曾在國際學術賽事WMT2017中獲得中英機器翻譯全球第一。

此次,搜狗翻譯寶Pro就採用了該技術,並以深度循環神經網路編碼解碼框架技術作為主要技術,使用完全端到端的學習方式。獨特的人工智慧技術和大數據語料的融合,不僅保證了搜狗翻譯寶Pro離線和在線翻譯的準確度,真正解決了用戶聽不懂、看不懂、說不出的問題,也保證了整個翻譯決策過程的連續性,使得翻譯出的句子在流暢度上更優異。

專家們表示,2018年以來,中外各大互聯網企業都在紛紛布局智能翻譯市場。搜狗翻譯寶Pro的推出標誌著智能翻譯正式進入「智能」賽道。而智能翻譯硬體有可能成為AI消費硬體的第一枚果實。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

當投資人相中一個區塊鏈基礎設施項目時,他們在想什麼?
Deepmind 發布里程碑成果:直面「黑箱」問題,自動檢測 50 余種眼疾特徵

TAG:雷鋒網 |