0
| 本文作者: 叨叨 | 2018-01-12 16:40 | 專題:AI最佳掘金案列 |
從 2016 年到 2017 年,或許是翻譯行業的從業者們最人心惶惶的年頭。科技企業挾 AI 令“翻譯”,隔幾天就發布一個新數字,不斷推高機器翻譯的準確程度,似乎這個行業已然成為“AI 替代人類”最早的炮灰。
機器翻譯的進步,得益于神經網絡的應用。不過,即便比統計模型基礎上的機器翻譯大有進步,神經網絡翻譯(NMT)的質量,其實也還遠未達到專業人類譯員的水平,用鄒劍宇的話來說,只是“可讀”,能獲取一定信息,但如果想要商用,還是需要人類來做“譯后編輯”。
鄒劍宇是中文互聯網的第一代記者,1997年加入《三聯生活周刊》,見證了互聯網企業在中國發展的第一個十年。這個十年,不僅是搜狐、百度、阿里、騰訊、網易起步的十年,也是中國媒體界“編譯”的十年。在十年里,國內媒體從業者們搞定了一件事,那就是在新聞(News)層面和國外實現了“語言的同步”。進入第二個十年,鄒劍宇已經選擇了翻譯。
在他看來,翻譯需求無處不在,但大部分有價值的英文內容,還沒有被譯出來,比如比新聞(News)更高級的信息(Information),以及更深度的知識(Knowledge)。鄒劍宇給前來采訪的雷鋒網作者舉了一個實例:
現在還沒有看到誰有能力把近十年甚至從創刊起的《經濟學人》或者《柳葉刀》譯成中文,如果翻譯出來,其價值巨大;如果再加上能搜索、檢索,其價值就大到無法想象。
巨大的翻譯需求,不能掩蓋這個行業“生意”的小。 “都是小公司,沒有大公司”,但鄒劍宇認為這是機器翻譯的機會,也是他們的機會——“我們創業的時候(2013年),這一點看得很清楚,如果不跟上機器翻譯的趨勢,翻譯一定沒得做”。
從人工智能大火的今天往回看,這個趨勢毋庸置疑。人類翻譯受限于生物條件,生產力存在天花板,到了這個天花板,就無法再提高。這也是這個行業為什么沒有巨頭的核心原因,而當神經網絡翻譯出現之后,人類翻譯有了一個更好的選擇,那就是“譯后編輯”。
一個翻譯需求發出,先交給機器翻譯,譯后再由人類進行編輯,經過實踐之后,“譯后編輯”的做法可以將效率提升2-4倍,成本降低30%-80%,作為個人譯員收入提升,企業可以規模化發展,而需求發出單位能夠收到速度更快、術語準確度更高、翻譯質量更好的譯文。
經過前期探索,在這種思路下,鄒劍宇和他的搭檔魏勇鵬創建了商鵲網,詳細過程可參見雷鋒網另外一篇相關報道。商鵲網創立時,正是跨境電商最熱的時候,鄒劍宇順利成章就盯上了“這塊肥肉”,成為阿里巴巴的供應商,做電商信息的翻譯。但這一次的嘗試,并沒有帶來太多效益,跨境電商的長鏈條、低利潤,處在末端的翻譯更分不了多少錢。
很快,商議之下,商鵲網重回魏勇鵬此前曾經做過的專利翻譯業務。事實證明,“譯后編輯”的效果得到了客戶日本專利局的認可,訂單從2014年的78萬件擴大到了2015年的145萬件,而結構化的“專利數據”,也把商鵲網的“專利翻譯引擎”打磨得很好。
雷鋒網了解到,近日商鵲網達成千萬元戰略資金投入,未來將著眼于投資、醫療、教育等領域的智能服務系統及跨境信息服務的建設。
除了很好地訓練了機器翻譯模型,獲得了大量訂單,還有一個收獲就是得到了一整套基于“譯后編輯”模式下的譯員培訓。
對于傳統翻譯業務而言,翻譯眾包公司接到訂單,需要組織大量譯員進行翻譯,在翻譯前必須有一個“培訓”的過程,了解背景知識、統一術語等等,才能讓翻譯效果有基礎的保證。而機器翻譯介入后,也改變了譯員培訓和翻譯教育,這便是鄒劍宇的另一個產品——試譯寶。
簡單來說,試譯寶是一款基于機器翻譯的翻譯自動批改和輔助培訓的在線產品,同時還加入了機器自動打分、譯文點評功能(包括老師點評、學生互評和自動點評),在一個產品中將“練習-評點-講解”統一起來,成為一體化的系統翻譯訓練平臺。這個系統有兩端,分別是學生端和教師端。
在學生端,進入規定的課程,就可以像答題一樣作答,英文材料下方會給出即時的機器翻譯結果,答題結束后可進入“自評”,自評后就可以進行提交,提交之后的結果會發送至教師端進行線上批閱,同時也能收到機器打分和其他人的評論。 
*答題

*自評 
*提交和評點
而在教師端,則設置了創建題庫、檢索、批改等功能,界面友好,降低了教師備課的門檻,提升了其批改的效率,讓教和學有了更為良好的互動方式。

*分句批改

*批量點評

*成績統計

*考勤統計
在機器翻譯技術的輔助下,教師能在三個方面獲益頗豐:
1. 實現多種學生練習作業批改模式,如按人批改、按題批改、按知識點批改等;
2. 利用平臺教學資源,降低備課門檻,創新教學模式
3. 利用平臺積累的答題數據,輔助科研和教研工作
該產品自2016年上線以來,目前已經獲得了10萬用戶,并且成為北京語言大學第七屆國際口筆譯大賽唯一提交入口,并創下了歷年來筆譯類大賽報名人數之最。同時,也有不少專業院校采買該系統,定制化之后成為學校專用的翻譯教學工具。
在近日,試譯寶也獲得了由雷鋒網頒發的“2018年度最佳試題評測獎”,是翻譯教育軟件第一次獲得互聯網及人工智能行業的獎項。
在采訪的最后,鄒劍宇向雷鋒網表示,翻譯行業想象空間巨大,但要做成一件事需要天時地利人和,試譯寶的作用就在“人”和“數據”上,抓住了這兩個點,就抓住了AI背景下的關鍵。實際上,機器翻譯也是AI屈指可數的可商用的領域,并且已經逐漸從語言深入到了語義層,是技術進化到強AI的一條可依循的路徑。
“這僅僅是一個開始”,鄒劍宇說。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。