商鵲網獲千萬投資,試譯寶開始商用,鄒劍宇的「譯後編輯」模式能撬動萬億蛋糕么?
從 2016 年到 2017 年,或許是翻譯行業的從業者們最人心惶惶的年頭。科技企業挾 AI 令「翻譯」,隔幾天就發布一個新數字,不斷推高機器翻譯的準確程度,似乎這個行業已然成為「AI 替代人類」最早的炮灰。
機器翻譯的進步,得益於神經網路的應用。不過,即便比統計模型基礎上的機器翻譯大有進步,神經網路翻譯(NMT)的質量,其實也還遠未達到專業人類譯員的水平,用鄒劍宇的話來說,只是「可讀」,能獲取一定信息,但如果想要商用,還是需要人類來做「譯後編輯」。
鄒劍宇是中文互聯網的第一代記者,1997年加入《三聯生活周刊》,見證了互聯網企業在中國發展的第一個十年。這個十年,不僅是搜狐、百度、阿里、騰訊、網易起步的十年,也是中國媒體界「編譯」的十年。在十年里,國內媒體從業者們搞定了一件事,那就是在新聞(News)層面和國外實現了「語言的同步」。進入第二個十年,鄒劍宇已經選擇了翻譯。
在他看來,翻譯需求無處不在,但大部分有價值的英文內容,還沒有被譯出來,比如比新聞(News)更高級的信息(Information),以及更深度的知識(Knowledge)。鄒劍宇給前來採訪的雷鋒網作者舉了一個實例:
現在還沒有看到誰有能力把近十年甚至從創刊起的《經濟學人》或者《柳葉刀》譯成中文,如果翻譯出來,其價值巨大;如果再加上能搜索、檢索,其價值就大到無法想像。
巨大的翻譯需求,不能掩蓋這個行業「生意」的小。 「都是小公司,沒有大公司」,但鄒劍宇認為這是機器翻譯的機會,也是他們的機會——「我們創業的時候(2013年),這一點看得很清楚,如果不跟上機器翻譯的趨勢,翻譯一定沒得做」。
從人工智慧大火的今天往回看,這個趨勢毋庸置疑。人類翻譯受限於生物條件,生產力存在天花板,到了這個天花板,就無法再提高。這也是這個行業為什麼沒有巨頭的核心原因,而當神經網路翻譯出現之後,人類翻譯有了一個更好的選擇,那就是「譯後編輯」。
一個翻譯需求發出,先交給機器翻譯,譯後再由人類進行編輯,經過實踐之後,「譯後編輯」的做法可以將效率提升2-4倍,成本降低30%-80%,作為個人譯員收入提升,企業可以規模化發展,而需求發出單位能夠收到速度更快、術語準確度更高、翻譯質量更好的譯文。
經過前期探索,在這種思路下,鄒劍宇和他的搭檔魏勇鵬創建了商鵲網,詳細過程可參見雷鋒網另外一篇相關報道。商鵲網創立時,正是跨境電商最熱的時候,鄒劍宇順利成章就盯上了「這塊肥肉」,成為阿里巴巴的供應商,做電商信息的翻譯。但這一次的嘗試,並沒有帶來太多效益,跨境電商的長鏈條、低利潤,處在末端的翻譯更分不了多少錢。
很快,商議之下,商鵲網重回魏勇鵬此前曾經做過的專利翻譯業務。事實證明,「譯後編輯」的效果得到了客戶日本專利局的認可,訂單從2014年的78萬件擴大到了2015年的145件,而結構化的「專利數據」,也把商鵲網的「專利翻譯引擎」打磨得很好。
雷鋒網了解到,近日商鵲網達成千萬元戰略資金投入,未來將著眼於投資、醫療、教育等領域的智能服務系統及跨境信息服務的建設。
除了很好地訓練了機器翻譯模型,獲得了大量訂單,還有一個收穫就是得到了一整套基於「譯後編輯」模式下的譯員培訓。
對於傳統翻譯業務而言,翻譯眾包公司接到訂單,需要組織大量譯員進行翻譯,在翻譯前必須有一個「培訓」的過程,了解背景知識、統一術語等等,才能讓翻譯效果有基礎的保證。而機器翻譯介入後,也改變了譯員培訓和翻譯教育,這便是鄒劍宇的另一個產品——試譯寶。
簡單來說,試譯寶是一款基於機器翻譯的翻譯自動批改和輔助培訓的在線產品,同時還加入了機器自動打分、譯文點評功能(包括老師點評、學生互評和自動點評),在一個產品中將「練習-評點-講解」統一起來,成為一體化的系統翻譯訓練平台。這個系統有兩端,分別是學生端和教師端。
在學生端,進入規定的課程,就可以像答題一樣作答,英文材料下方會給出即時的機器翻譯結果,答題結束後可進入「自評」,自評後就可以進行提交,提交之後的結果會發送至教師端進行線上批閱,同時也能收到機器打分和其他人的評論。
*答題
*自評
*提交和評點
而在教師端,則設置了創建題庫、檢索、批改等功能,界面友好,降低了教師備課的門檻,提升了其批改的效率,讓教和學有了更為良好的互動方式。
*分句批改
*批量點評
*成績統計
*考勤統計
在機器翻譯技術的輔助下,教師能在三個方面獲益頗豐:
1. 實現多種學生練習作業批改模式,如按人批改、按題批改、按知識點批改等;
2. 利用平台教學資源,降低備課門檻,創新教學模式
3. 利用平台積累的答題數據,輔助科研和教研工作
該產品自2016年上線以來,目前已經獲得了10萬用戶,並且成為北京語言大學第七屆國際口筆譯大賽唯一提交入口,並創下了歷年來筆譯類大賽報名人數之最。同時,也有不少專業院校採買該系統,定製化之後成為學校專用的翻譯教學工具。
在近日,試譯寶也獲得了由雷鋒網頒發的「2018年度最佳試題評測獎」,是翻譯教育軟體第一次獲得互聯網及人工智慧行業的獎項。
在採訪的最後,鄒劍宇向雷鋒網表示,翻譯行業想像空間巨大,但要做成一件事需要天時地利人和,試譯寶的作用就在「人」和「數據」上,抓住了這兩個點,就抓住了AI背景下的關鍵。實際上,機器翻譯也是AI屈指可數的可商用的領域,並且已經逐漸從語言深入到了語義層,是技術進化到強AI的一條可依循的路徑。
「這僅僅是一個開始」,鄒劍宇說。


TAG:雷鋒網 |