谷歌神經(jīng)機(jī)器翻譯質(zhì)量接近筆譯人員
谷歌神經(jīng)機(jī)器翻譯質(zhì)量接近筆譯人員。谷歌于昨日發(fā)布了網(wǎng)頁版和移動版的谷歌翻譯。在漢譯英的過程中,會采用全新的神經(jīng)機(jī)器翻譯,而這個(gè)App每天要進(jìn)行一千八百萬次這樣的翻譯。此外,谷歌針對這個(gè)翻譯系統(tǒng)的運(yùn)作原理,發(fā)表了一篇學(xué)術(shù)論文。
早前,谷歌就曾表示它們在谷歌翻譯中運(yùn)用了神經(jīng)網(wǎng)絡(luò)技術(shù),但只限于實(shí)時(shí)視覺翻譯這個(gè)功能。前段時(shí)間,谷歌的高級員工Jeff Dean曾告訴VentureBeat,谷歌已經(jīng)在嘗試把越來越多的深度學(xué)習(xí)功能融入到谷歌翻譯中。除此之外,谷歌的一位發(fā)言人在郵件中告訴VentureBeat,最新的神經(jīng)機(jī)器翻譯是他們努力研發(fā)深度學(xué)習(xí)功能的成果。
實(shí)際上,谷歌一直以來都在致力于將深度神經(jīng)網(wǎng)絡(luò)融入它旗下越來越多的應(yīng)用軟件中,其中包括Google Allo和Inbox by Gmail。這個(gè)功能可以幫助谷歌更快捷、更有效地處理它們的數(shù)據(jù)。
谷歌的神經(jīng)機(jī)器翻譯(GNMT)對八層長的短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)(LSTM-RNNs)依賴性很強(qiáng)?!巴ㄟ^層間殘留聯(lián)系可以加強(qiáng)梯度流。”谷歌科學(xué)家在論文中寫道。在圖像處理器的幫助下,神經(jīng)網(wǎng)絡(luò)一旦變得足夠成熟,谷歌就可以靠它尚未發(fā)布的張量處理單元進(jìn)行數(shù)據(jù)處理。
雖然神經(jīng)機(jī)器翻譯并不永遠(yuǎn)是最佳之選,但是谷歌的各種嘗試顯示,在某些情況下它還是有過人之處的。
“人們對這個(gè)翻譯系統(tǒng)的評價(jià)顯示,比起之前基于短語的翻譯系統(tǒng),在翻譯多種語言時(shí),神經(jīng)學(xué)習(xí)翻譯系統(tǒng)的錯(cuò)誤率已經(jīng)降低了60%,其中包括英法互譯,英西互譯以及英漢互譯。附加實(shí)驗(yàn)的結(jié)果顯示,翻譯系統(tǒng)的質(zhì)量將和筆譯人員平均水準(zhǔn)更加接近?!?/p>
在昨天發(fā)表的一篇博文中,Google Brain Team的研發(fā)科學(xué)家Quoc Le 和Mike Schuster提到,有了雙語評分員的幫助,在翻譯Wikipedia上的多語種樣句時(shí),谷歌神經(jīng)機(jī)器翻譯的錯(cuò)誤率實(shí)際上已經(jīng)降低了55%到85%。
盡管如此,這個(gè)系統(tǒng)還是不完美的?!吧窠?jīng)機(jī)器翻譯還是會犯一些筆譯人員永遠(yuǎn)都不可能犯的錯(cuò)誤,比如漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯(cuò)、對文章語境缺乏整體把控等等。所以,我們還是有很大的進(jìn)步空間。但不可否認(rèn)的是,神經(jīng)機(jī)器翻譯具有里程碑意義。”
2898站長資源平臺網(wǎng)站排行榜:http://stoptheftofyouridentity.com/webmain.htm