機器翻譯代替人工翻譯,真的可能嗎?這句話,近日爆紅網絡的百度文言文翻譯器將它翻譯成了我們今天的標題。
最近,網友「獨角獸少女」發表一條名為「百度翻譯可以翻譯文言文了!」的帖子,短短幾日,就吸引近10萬網友參與轉發評論。網友「芙蓉錦」認為,翻譯僅僅流於表面,不夠地道,很多關鍵字詞韻味不夠,讀起來也不夠順暢。網友「筆記本」等則表示,其中不少詞語翻譯得挺到位,借它提升下格調綽綽有餘了。
昨日,記者也點擊進入百度翻譯器,一探究竟。記者分別輸入了《嶽陽樓記》和《圍城》中的一段話。
白話譯文言
《圍城》原文:人生據說是一部大書。假使人生真是這樣,那麼,我們一大半作者只能算是書評家,具有書評家的本領,無須看得幾頁書,議論早已發了一大堆,書評一篇寫完交卷。
百度翻譯:人言是一部大書。使人信然,然則,我一半人家乃書評,有書評家之術,不須看的數頁書,議早發一百,書評一篇寫納卷。
老師點評:身為資深語文教師的網友老王表示,譯文古今夾雜,不少語言不通順,也不符合古文的常識。「比如人言是一部大書,『是』明顯是現代白話的表達方式。」
老師試譯:人生乃一大書也。若其果如斯,則吾屬多止為書評者。其具書評之能,閱書徒數頁而發論多矣。是時,一書評亦畢矣。
開發團隊
機器翻譯模型 海量數據
昨日,百度翻譯團隊相關負責人向記者透露,這個定位的初衷就是從兩個方面考慮———學習和娛樂。
知情人士透露,該團隊收集了大量文筆優美的古文進行機器訓練學習,完成韻律模型。整個翻譯原理就是結合收集的海量數據和機器翻譯模型,在保證翻譯結果基本正確的情況下,綜合考慮古詩文的韻律、樂感、平仄聲交錯等規則,得出最後的翻譯結果。團隊還專門招聘了古代漢語文學專業的學生進行質量評估,對翻譯提供建議和意見,幫助機器翻譯優化。
機譯代人譯 啥時能實現
美國發明家、未來學家雷·科茲威爾(Ray Kurzweil)接受《赫芬頓郵報》採訪時曾預言,到2029年機譯質量將達到人工翻譯的水準,情況真的如此樂觀嗎?
20世紀70年代末至80年代末,靠專家們寫下一條條翻譯規則,計算機「唯命是聽」的方法逐漸成熟。這種基於規則的翻譯法,就像剛學話的小孩一樣,教一句就會一句,不教就不會。
20世紀90年代,能夠依靠大量語料自主「學習」的機器翻譯技術迅速發展,風頭逐漸超越之前的技術。這種基於語料庫的翻譯法,會從語料庫中尋找相似的句子,並對源句進行適當改動,得出翻譯結果。
如今,更加高級的基於語料庫的方法,是利用機器學習和數學建模技術來實現自動翻譯系統構建,常稱為統計機器翻譯。這是如今比較主流的機器翻譯方法,谷歌、百度等都是使用這種方法。
【七嘴八舌】
Vanessa579:用今年的高考作文試了試,感覺不錯:「無所不朽,吾輩終為。然吾不欲究陳規,但欲攜君過橋路。度漠與逸,窮村茫山,空數星辰,於窗望霓虹。欲如晶片常保汝心,為永之客,共譜情篇,記錄涓滴,使我不枉此世。」
裸泳有益健:古文常省略主語,這種翻譯充其量是近代文言文。古代文言文語法用法都不嚴謹,錯落之美這個工具絕對搞不出。
數數讀:不作死就不會死居然能譯成「上瑤樓臺皆仙色,怎奈偏登極樂,墜佛入魔。」辭藻華麗,但還是有點牽強!
靜止老榮耀:當網絡術語翻譯成古風文字,感覺等級瞬間飆升一個層次,太優美了!