當前位置:
首頁 > 知識 > 即時翻譯器能夠成就一段戀愛嗎?

即時翻譯器能夠成就一段戀愛嗎?

即時翻譯器能夠成就一段戀愛嗎?



喬希注視著窗外的群山,望得出神了,手邊的茶慢慢涼了下來。群山近在咫尺,威嚴而壯麗。他手中捧著他最愛的小說,書里曾無數次地描述過這美景。咖啡館裡熙熙攘攘,人們暢快地談論著天南海北的奇聞異事。喬希獨自坐著,但他並不孤單。當他的目光回到身前的時候,他發現自己的面前坐著一個人,用他聽不懂的語言,對他講話。喬希戴上了一對小耳機。耳機把那陌生的語言轉換成了他熟悉的語言,喬希捕捉到了最後一句話:「……我最喜歡的小說。」

「這本嗎?」喬希舉起了手中的書,問道。


「對呀。」


「這也是我的最愛,」喬希說,「這是譯文版,不過,這本小說我至少讀過12遍了。」


喬希的新朋友笑道:「是哪個版本的譯文?谷歌版的還是亞馬遜版的?」

科技樂觀主義者認為,總有一天,人類能夠藉助翻譯器,去閱讀任何書籍,無論這本書的原語言多麼晦澀難懂。一直以來這都是人工智慧工程師的奮鬥目標之一。翻譯工作是電腦不能用數字技術解決的最古老的難題之一。1954年,喬治敦大學和IBM公司共同推出了第一款翻譯器。這款翻譯器能夠把俄語翻譯成英語,可以應對十分複雜的句子。它總共能夠識別60個句子,遵循6種語法規則,內部儲存了250個辭彙。設計者對公眾表示,機器翻譯的技術難題,將在未來3到5年得以解決。


有無數人在這個領域進行著不懈的探索,2001年,谷歌重新投身於這個領域,並且很快就超過了其他競爭者。一開始,谷歌只能做6種語言之間的翻譯(英語、葡萄牙語、德語、義大利語、西班牙語和法語),它不斷改進自己的演算法、翻譯質量和翻譯速度。到2005年,谷歌的翻譯器已經能夠支持8種語言了。它在一場翻譯比賽中,用1000台電腦,在40個小時之內翻譯1000個句子。而今,2016年,谷歌網站能夠在幾秒鐘內,完成對103種語言的翻譯。每個月,都有超過5億人次使用翻譯器。其中超過92%的用戶不在美國。讓機器翻譯能夠與具體的語境相結合,是所有程序員共同努力的方向,有的人甚至聲稱,機器翻譯已經解決了這個問題。


上周,紐約市韋弗利實驗室發布了他們的最新成果派樂(pilot)。這是一副售價299美元的耳機,預計在2017年發售。這項設備預計能夠對4種語言進行接近於同聲傳譯水平的翻譯。這個設備受到了視頻「當他與一位法國女孩相遇」的啟發。項目的創始人安德魯·奧喬亞說,派樂能夠讓「人與人之間擺脫語言的障礙,讓生命信馬由韁」。在發布會之後,《福布斯》雜誌採訪了韋弗利實驗室,仔細詢問了這個翻譯設備的真實性。但是他們卻忽略了這個項目背後一個更加重要的假設:拋開資金問題不談,這項設備能夠幫助人們與外國人相戀嗎?


喬希無意結識任何人,但這實在是一場美麗的偶遇。喬希正打算告訴他的新朋友,這本書是他在一次交通事故雙腿受傷之後,他媽媽送給他的,這本小說陪伴了他10多年。服務員開始給他續茶。當服務員說話的時候,他發現,她說話的節奏與周圍的人不同。然後,翻譯器里就開始發聲了:「你從哪來?」這個問題真是一個和陌生人開始聊天的萬能句式。


電腦(比如IBM的設備)曾經運用和人類一樣的模式學習語言:把一門語言中紛繁複雜的語法、例外用法、例外的例外用法進行內化。語法太複雜了,電腦程序可能要掌握超過一百萬種指令。翻譯結果經常顯得非常笨重粗糙。1949年,科學家沃倫·韋弗提出了一種新的理念,它可以取代基於語法的翻譯技術,這種技術被稱作基於統計模型的機器翻譯技術(SMT)。該技術並不會逐點進行翻譯,韋弗提出了一種雙管齊下的方法:首先,電腦會檢索上百萬份文檔,用統計法找出具有典型性的語言模式,並由此記憶其中的語法、句法和遣詞的規則。與此同時,程序會創建一個模型,來預測特定的短語將出現在句子中的什麼位置,如何進行翻譯。比如,一台電腦在數十億次的重複之後,能夠預測到,在德語中,動詞一般出現在句子的末尾。

韋弗利實驗室還沒有公布他們軟體的細節,但是,谷歌的翻譯軟體很可能也採用了同樣的技術方法,谷歌用這種預測機制來提供統計學上最接近真實的翻譯,這很可能是迄今為止最好的翻譯方法。但是人們運用語言的環境多種多樣,翻譯軟體也必須對具體的語境(也就是「域」)進行識別。比如,當一位客人正在買吉他的時候,翻譯器就知道應該把「neck」翻譯成「琴頸」。但是,為了實現統計上的典型性,一個「域」必須非常大,至少有200萬個詞。因此,這方面的翻譯訓練材料都來自如聯合國這樣的大型組織。這些組織擁有大量的已經被人工翻譯的材料,即便如此,這種演算法還是有其自身的局限性。


很多人即使閱讀了5萬份由英語翻譯成羅馬尼亞語的歐盟議會報告,也學不會羅馬尼亞語;但是他們卻能夠輕而易舉地看懂那些YouTube評論區里或是Facebook上的網路語言,這些網路語言就像垃圾場一樣,充滿了語法錯誤、辭彙濫用或純標點符號組成的表情。但是一台電腦遇到了哪怕一點程序之外的語法規則,都無法識別。


從結果上看,基於統計模型的機器翻譯技術極大地提高了機器翻譯的流暢度。但是它還無法應對俚語或者方言。這個問題只是一個技術層面的問題;理論上來講,更大的資料庫,更快的運算速度和更先進的演算法最終能解決這個問題(就像辦公軟體裡面的自動糾錯功能一樣)。其實,機器翻譯技術所面臨的真正難題,並不是技術層面的,難題來自於語言本身。


喬希告訴服務員,她的聲音特別好聽,然後又點了一份曲奇。他的新朋友也不介意服務員打斷他們的談話,但是喬希手裡全是汗。他用餐巾擦了擦,不知道怎麼樣才能把話題帶回那本小說上來。他口吃了半天,然後直接問出了頭腦里出現的第一個問題:「你最近怎麼樣?」


愉快的氣氛是如此的平常,人們經常忽視這種氣氛的複雜性。從語言學上來看,這被稱之為交際語言,意思是一種表達不光傳遞了一份信息,更達成了一種社交目的。比如,當別人問你「最近怎麼樣」的時候,多數人會覺得別人只是發出一份關心,並不是真的想打聽你最近都經歷了什麼。只要資料庫夠大,機器就能識別「最近怎麼樣」這個句式,並進行與之相關的聯想。但是交際語言,就像所有的常用語言一樣,非常不穩定。

如果喬希生在了喬叟的那個時代(14世紀),他可能會說:「貴客,歡迎來此」;在莎士比亞的年代(16-17世紀),他可能會說:「天賜良日,天公作美啊。」(那個時候「hello」用來表示驚奇、意外。)網際網路是一個巨大又複雜的語言環境,這個環境使得語言翻譯也不停地變化。


1986年,美國和英國英語最大的語言資料庫伯明翰語料庫里包含了2000萬個辭彙。到了今天,資料庫中的牛津字典分區里就有25億個辭彙了,這些辭彙中有很多都來自於愛爾蘭、澳大利亞、紐西蘭、加勒比、加拿大、印度、新加坡和南非。更何況,現在的詞典編撰者還要去了解博客、電子郵件、社交軟體、電視節目劇本、留言板等很多媒體。對於那些用戶自己可以進行編輯的網站,新辭彙的數量更是呈爆炸式的增長。


語言的自我演變進行得十分迅速。


比如「Netflix and Chill」(字面意思是「看個電視劇放鬆一下」,實則帶有一定程度的性暗示)這個詞,如果這個詞在下一季《歡樂再滿屋(Huller House)》結束後仍在流行,那麼它的含義很可能已經隨著觀眾興趣的改變而改變了。矛盾的是,基於統計模型的機器翻譯技術的 特徵,是靜態的、保守的、被動的。資料庫中那些已經過時的表達,會阻礙翻譯演算法去適應語言的演變。如果想要讓翻譯程序實時適應語言的演變,那就必須讓程序能夠準確地接觸所有的書面、口頭表達,這個過程中翻譯程序很可能識別不了某些語言的自我演變。

過了一會兒,咖啡館裡就只剩下喬希他們倆了。他們兩個人的人生經歷特別相似。他們都有一個親哥哥,小的時候都有成為藝術家的夢想,每早都起來跑步(而且都睡過頭過)。這場對話輕鬆自然,沒有尷尬,也沒有冷場。喬希甚至都沒空吃曲奇。喬希的目光多次掠過曲奇餅,然後喬希的朋友就說:「咱們一起吃吧。」


英語里,很多表示肯定的表達中,深藏了各式各樣的潛台詞。比如,喬希可以斬釘截鐵地回復一句:「好!(yes)」但是,出於討論的需要,我們假設喬希已經餓得前胸貼後背了,咖啡廳的廚師又剛好下班了,他特別想一個人把曲奇全吃了。所以,他很可能說「好吧( fine )」。「


好」和「好吧」字面上都表示贊同和許可。但是後者包含著勉強,不舒服的情緒。「好吧」是小孩子被父母喊去下樓丟垃圾時,既表示遵從又表示不情願時會使用的詞。就像交際語言一樣,「好吧」真正所要表達的東西,不是字面上的意義,而在於它所暗示的情感。


15分鐘之後,這場聊天已經進行得十分順利了,喬希想要有更進一步的表示,但是他忍住了,就像所有人第一次約會一樣,喬希覺得現在的氣氛有些曖昧。


如果喬希的約會對象說的是日語,喬希必須小心翼翼地應對。一般來說,日本人覺得,你一聲不響地聽別人講話,不太禮貌,你應該經常說「是嘛、啊、沒錯」等予以回應。這些表達,在英語環境下,會讓人覺得聆聽者對這個話題十分感興趣;但是在日語環境下則並非如此,聆聽者予以回應完全是出於禮貌。


日本人幾乎從來不直接拒絕別人。如果喬希與他的新朋友吃完了飯,邀請他一起回家,那喬希很可能得到一個模稜兩可的回答:「可以是可以,只不過……」任何一個日本人都會立刻發現這其實就是拒絕,但是天真的喬希聽不出這弦外之音。


但是,在辨別親密關係的時候,日語是一門絕佳的語言。基於談話雙方的社會地位和親密關係,他們的動詞和名詞有完全不同的4種修辭方式。


如果和喬希約會的姑娘講話時完全不使用敬語,談吐特別隨意,那麼這就是一種強烈的暗示:她對喬希很感興趣。


如果喬希在波哥大,他的約會對象很可能會用「您」(usted)來稱呼他。相比於「你」(tú),這是一個比較正式的第二人稱稱呼。如果對方把「您」改成了「你」,顯然這暗示著兩人的關係變親密了。但是英語中的第二人稱稱呼只有「你(you)」,翻譯器應該如何傳達出這種情感上的差別?這類難題,即使是人工翻譯,也很難解決。對於喬希的翻譯器來說,就更難了。計算機依據統計數據來進行翻譯,而不是依據對詞語或者人們行為的準確理解來進行翻譯,計算機沒辦法判斷親密關係。沒有任何的統計模型能夠對兩人關係的親密程度進行量化、比較。不過我們還是要恭喜喬希,他邁出了拉近關係的第一步。


當兩人準備起身離開的時候,喬希坦率地說,他之前和他的伴侶一起生活了5年,最近一段時間才分手。不幸的是,對於「伴侶」這個詞的真正含義,翻譯器沒法準確掌握。


性別,就像禮貌用語一樣,在不同的語言中,表達方式多種多樣。例如在阿拉伯語中,可以輕易地從名詞、動詞、形容詞中分辨出性別。在英語中,詞語的性別特徵則不那麼明顯。在英語文章中作者完全可以不露痕迹地掩蓋一個人的性別,就像這篇文章,只看喬希和新朋友之間對話,讀者無法判斷喬希的約會對象是男是女。英語的「伴侶」(partner)一詞,既可以指代異性情侶,也可以指代同性情侶。


多數情況下,一個人想要了解另一個人,會更加關注他說話的方式,他的弦外之音,而不是他說話的具體內容。有意無意地,在一場對話裡面,聆聽者總會捕捉到各種各樣的來自語言之外的信息。即使是說話的口音,也能傳遞很多,比如人們一聽到倫敦口音,就會覺得這個人多半很刻板、保守。對於喬希自己來說,想要講清楚英語中幾個同義詞的具體差別就特別困難,更不用說翻譯器了。這種來自語義上的小差異,在表達中會引起特別不一樣的效果。就好比一副近視眼鏡,度數上差一點點,普通人可能覺得無傷大雅,但對使用者來說,整個世界都會變模糊。


拋開這些繁瑣的語言學理論不談。喬希現在和他男朋友回到了小旅館。他的新男朋友有點緊張,聳著雙肩,無所適從。「呃……」他說,「你最近怎麼樣?(how are you)」喬希的男朋友把喬希剛見面時的窘態模仿得活靈活現,兩個人都笑了,一起倒在床上。喬希深深地吸了一口氣說:「我們再也不離開這個大鼻子小廚師(nosey little cook)了。」然後他發現自己口誤了,他其實想說「可愛的小家(cozy little nook)」,但是兩個人又被逗得前仰後合。


喬希剛剛犯了一個首音誤置的錯誤。他把第一個詞的母音字母和第三個詞的母音字母互換了。喬希的口誤是無心之舉,但是人們經常會精心設計這類文字遊戲來取樂。這也是人和電腦之間的一個重大差別。電腦可以完成龐大複雜的運算,但是卻沒有辦法理解這種脫離語法規則的語言遊戲。就像上文提到的,機器翻譯的難點,並不在於對單個辭彙的翻譯,任何一個單獨的詞,無論多難,都能翻譯。比如葡萄牙語中的一個詞「紹達蒂思(saudades)」,在英語中,找不到任何一個詞能跟它完美匹配,但是我可以用英語去解釋它:這是一種相思病,對某人某物思念得無可救藥。翻譯的真正難點在於,當人們使用某個詞的時候,他們的意圖是不穩定的、多樣的、模稜兩可的,甚至是具有欺騙性的。


除開這些種種的不足,谷歌翻譯和他的同行所提供的機器翻譯技術,已經在效率上和經濟上超過人工翻譯了。正如某次會議上,一位谷歌翻譯的程序工程師所指出的那樣:當你想快速瀏覽某些文件,或者查看某些評論(比如說餐館評論)的時候,你不在乎語法錯誤。這時候,機器翻譯就是你的一個完美選擇。從商業的角度上來說,當翻譯內容特別客觀,可以排除人的主觀干涉的時候,比如說,當北美紅十字會想要得知墨西哥城所有醫院的醫療用品庫存總計的時候,機器翻譯就大有用武之地了。


就算韋弗利的新產品「派樂」翻譯出來的內容生澀難懂,對於學生、遊客、移民和難民來說,它已經可以幫上大忙了。它能夠幫助人們與社會有更加實質性的接觸,甚至可以讓人們相愛。但是,它什麼時候才能做到像它承諾的那樣,讓「人與人之間可以擺脫語言的障礙,生命信馬由韁」?


當喬希到達機場,必須與他的男朋友分離的時候,他一直在抽泣,不停地說自己回家收拾好了東西,就會馬上飛回來,回去之後,天天都要保持電話聯繫。等喬希回家之後,才發現,他們倆的作息時間差別太大了。開始還天天通話,後來就只有周末通話,再後來,只是每周通話一次。最後他們甚至只用電子郵件聯繫了。6個月之後,當喬希回憶起這段感情的時候,他覺得自己所迷戀的,可能並不是那個人,而是那份異國戀愛的體驗。


把語言當作是一組統計學意義上的語法集合,是非常不切實際的觀點。人們之間的談話是如此的複雜,它凌駕於最精緻的計算機演算法之上。電腦所作的翻譯,深深地依賴著資料庫,沒有真情實感,太過糾結於單個的字元串。語言不是一種單純的工具,也不是一種公式,它像小兔子一樣機靈狡黠,讓人捉摸不透。


原文作者:斯賓塞·麥斯泰爾


[譯自美國《大西洋》月刊]


來源/海外文摘雜誌社

即時翻譯器能夠成就一段戀愛嗎?



古今中外(wxxcf2014)——


我們已入駐【今日頭條】,【搜狐】和【一點資訊】媒體平台並且是目前擁有超過2000家自媒體成員,輻射2億微信用戶的中國最大微信自媒體聯盟「J界面JMedia聯盟」成員,合作微信:zuiai650410


更多精彩等你加入......


博覽 律動 求真 愉悅


請您繼續閱讀更多來自 我要為你歌唱 的精彩文章:

TAG:我要為你歌唱 |
您可能感興趣

一款紅遍日本的離線即時翻譯器,它能走進中國嗎?
一款紅遍日本的離線即時翻譯器,它能走進中國嗎
有了這款神奇的翻譯器!從此走遍天下都不怕!
狂拽炫酷吊炸天 黑客編譯器,5秒你也能擁有!
再也不用擔心出國旅遊語言不通了,度娘為你準備了翻譯器
對於一個很複雜的常量表達式,編譯器會算出結果再編譯嗎?
媽媽騙爸爸給寶寶裝了心情翻譯器,爸爸信了還聊起天來,太好笑了
最牛翻譯器問世,即將改寫歷史與人生!
動物語言翻譯器,實現了,太棒了
能將文本轉換為盲文的攜帶型實時翻譯器
日本節目給寶寶裝「心情翻譯器」 爸爸的反應有點可愛
顫抖吧,人類!寵物語言翻譯器即將在亞馬遜上出售
島國餐廳用goole翻譯器來製作中文菜單,結果……讓人哭笑不得
中國人工智慧的崛起,新一代科大訊飛翻譯器,即時翻譯溝通無障礙
中國最牛人工智慧翻譯器面市,翻譯員要下崗!不用再學英語啦?
媲美同聲傳譯的翻譯器發布,以後留學不用考雅思了?
島國餐廳用goole翻譯器來製作中文菜單,結果讓人哭笑不得
ICC GCC傻傻分不清?聊一聊編譯器那些事兒
【科技】訪日看病不需翻譯,世界上首個可佩戴式自動語音翻譯器被研發!