當前位置:
首頁 > 天下 > 人工智慧十大難題之首:機器翻譯挑戰眾包模式

人工智慧十大難題之首:機器翻譯挑戰眾包模式

人工還是機器,你中意那種?


人工智慧劍指全自動

不同語言之間的自動翻譯是人類長久以來的一個的夢想,早在計算機出現之前就已經有許多先哲進行了不懈的探索與追求。而隨著電子計算機特別是互聯網的出現,這種對於自動翻譯的需求變得更加迫切,而被譽為人工智慧領域「皇冠上的明珠」的機器翻譯,甚至被稱為人工智慧領域十大難題之首。這是因為翻譯不僅僅是簡單的科技應用,從某種意義上來說是機器和人類之間的交流!


人力眾包

2007年,著名的社交網站Facebook發動雙語用戶志願為網站進行翻譯,並一舉成功(Meer,2010) ,開啟了眾包翻譯的時代。眾包翻譯模式迅速在社交媒體、非盈利性組織、文化傳播、政府機構等方面得到了許多應用,並迅速成為翻譯產業的一個新興的應用模式。相對於以人員翻譯為主的眾包翻譯而言,機器翻譯具有明顯的速度優勢,再加上眾包翻譯需要一系列的翻譯流程,速度儘管比傳統的個人翻譯模式要快許多,但是與機器翻譯相比仍處於劣勢。


到底為何物

機器翻譯(Machine Translation)是利用計算機實現從一種自然語言到另一種自然語言的自動翻譯技術。機器翻譯方法目前公認可以分為基於規則的機器翻譯(Rule-Based MT)和基於語料庫的數據驅動的機器翻譯(Corpus-Based MT)。TM是利用已有的源語言資源和對應的目標語言資源,建立起一個或多個翻譯記憶庫。在翻譯過程中,系統自動搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、篇章),作為參考譯文呈現給用戶。人們一直熱衷於機器翻譯的研究,從論文發表網站知網搜索可以看出,關於機器翻譯的研究在1996年逐漸增加,並將很高的增長速率保持了20多年的時間,其熱度可見一斑。


前世今生明朝

上個世紀40年代英國工程師Booth和美國工程師Weaver提出利用計算機進行翻譯的想法,從此開啟了機器翻譯的大門。既然是機器進行翻譯,結果的準確程度就應該進行評測。目前常見的評測方式現階段有兩種: 人工評測和自動評測。其中人工評測包括: 譯文用詞是否準確;是否忠於原文的語法語義;以及譯全率、流利度等等。人工評測主要是以譯文的用詞、語法、語義等為標準來判斷譯文是否忠實於原文,評測比較精準,同時具有主觀性。著名機器翻譯專家董振東老師提出了人本機器翻譯的概念,就是要以翻譯人員為中心,同時把翻譯人員也作為整個翻譯系統的一部分,從而實現人和機器之間的智能共同體。或許到那時,機器翻譯才能真正智能化,做到信達雅的最高境界!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 非典型性工科男 的精彩文章:

超級計算機1秒鐘:等於地球人不停地算30年
洗衣機也會思考了:智能時代允許我們變得更懶

TAG:非典型性工科男 |