當前位置:
首頁 > 科技 > 搜狗獲全球口語翻譯大賽冠軍 成機器翻譯標杆

搜狗獲全球口語翻譯大賽冠軍 成機器翻譯標杆

作為一家以搜索業務而出名的企業,搜狗在翻譯領域也是「混」的風生水起。在近期舉辦的2018IWSLT(International Workshop on Spoken Language Translation)全球頂級口語機器翻譯評測大賽上,搜狗憑藉BLEU(BLEU是機器翻譯自動評價方法,其數值越大意味著越準確)值28.09的成績奪得冠軍,超過第二名1.6個BLEU。


搜狗獲全球口語翻譯大賽冠軍 成機器翻譯標杆

打開今日頭條,查看更多精彩圖片


資料顯示,IWSLT(International Workshop on Spoken Language Translation)是全球最具影響力的口語機器翻譯評測比賽。今年是第15屆,共有10支隊伍參賽。在比賽方式來看,本次大賽共分了2大賽道,其一是Baseline Model(基線模型賽道),這是業內最主流最實用的語音翻譯應用技術。另一賽道是End-to-End(端到端賽道),為本屆大賽新增設賽道。

從比賽內容上來看,baseline模型對應的語音翻譯方案,包含語音識別、機器翻譯兩大模塊,採用多步流水線設計,即語音信號先輸入語音識別系統得到源語言的識別文本,然後再將識別文本送入機器翻譯系統輸出目標語言的對應譯文;End-to-End模型則是輸入語音,基於深度神經網路模型直接輸出譯文,並不會產生源語言的識別中間結果。搜狗參加的是baseline模型賽道比拼,並最終奪得冠軍。


搜狗獲全球口語翻譯大賽冠軍 成機器翻譯標杆


對此,搜狗語音技術負責人陳偉表示,為了確保口語翻譯準確率更好,無論是語音識別還是機器翻譯,都採用了多個不同模型融合去做,包括不同的語料、時間點、數據、特徵等。每個模型優勢不同,多個模型做磨合,讓多個專家一起做決策,這樣能保證準確率有進一步的提升。僅語音識別方面,搜狗團隊就用了用包括TDNN、BiLSTM、Deep-CNN在內的多個模型融合。

目前,搜狗已經推出了諸多的翻譯機、同傳等產品。其中,搜狗同傳產品已在網球公開賽、游泳世界盃等多場景下進行了實踐使用。這些來源於實際產品的經驗和用戶反饋,也幫助搜狗語音翻譯技術不斷迭代突破。目前在噪音相對小的情景下,搜狗語音識別準確率可達95%,以5分制評價,機器翻譯能維持在4分左右。未來,搜狗還會有多款圍繞語音翻譯技術的硬體產品發布,為用戶的需求提供更好地體驗。

【本文圖片來自網路】

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 三易生活 的精彩文章:

2.5L自吸+7座布局 長安馬自達CX-8今日正式下線
全新標緻508國產實車諜照曝光 軸距加長110毫米

TAG:三易生活 |