Google翻譯AI開始在兩個它從未配對過的語言之間翻譯

TECH2IPO 於 25/11/2016 發表 收藏文章

最近,Google 將其翻譯功能切換到了由深度學習算法驅動的翻譯人工智能,這讓它的翻譯更為精準。尤其是在面對那些從未出現過的語言配對時,Google 翻譯會更加得心應手。

舉個簡單的例子,在過去如果一個翻譯系統可以進行中日翻譯和日英翻譯,並不意味着這個系統能很好的進行中英翻譯。但現在,通過深度學習的訓練,Google 的翻譯系統在僅適配中日翻譯和日英翻譯的情況下,可以很好的學會如何進行中英翻譯,並且正確率與人工適配好的中日翻譯、日英翻譯接近,沒有明顯下降。

Google 翻譯目前為止支持 103 種語言,這意味着將語言兩兩配對之後會產生 5253 種路徑。人工不可能完成所有的配對工作,因此過去在翻譯路徑上更傾向於將某種語言作為中轉語言,而這會導致某些冷門翻譯路徑的正確率特別低。而深度學習框架讓翻譯 AI 自己學會了如何翻譯沒有被教過翻譯路徑,這使得翻譯的爭取綠大幅度提升。

研究人員也不能 100% 確定它是如何工作的,因為眾所周知深度學習網絡是難以理解的。當研究人員將學習完成的數據進行可視化的時候發現,Google 的翻譯 AI 會將不同語言的同一詞語更準確的分在一組。如果擴大機器學習可用的語言範圍,比如將語言總量拓展到 12 種,然後讓 Google 翻譯其中兩種沒有被適配過的語言,正確率比僅給 3 種語言更高,但總體正確率依然低於只給兩種語言的情況。不過,研究人員稱這個正確率已經可以投入實際使用。


資料來源:TECH2IPO

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→