日漫迷有福了!這個系統可以全自動翻譯日漫,再也不用啃生肉了

2021-01-15 騰訊網

機器之心報導

機器之心編輯部

買了心儀的漫畫全集,卻又苦於看不懂上面的文字,翻譯成了一大難題。對於這個令人頭疼的問題,來自 Mantra 公司、雅虎日本和東京大學的研究者幫你解決了。他們提出了一個全自動漫畫翻譯系統,可將漫畫中的文字翻譯成英文和中文。

漫畫在世界各地都很流行,但大多數漫畫中的文字沒有翻譯。如果能夠迅速將漫畫中的文字翻譯成各種語言,那可就太棒了。近日,來自 Mantra 公司、雅虎日本和東京大學的研究者聯合發表了一篇論文,提出了一種快速翻譯漫畫文本的方法。就像這樣:

該研究解決了日漫(Japanese comics)的機器翻譯問題,這涉及兩個重要問題:語境感知和多模態翻譯。在漫畫中,文本和圖像是以非結構化的方式混合在一起的,因此從圖像中獲取語境至關重要。但如何從圖像中提取語境併集成到機器翻譯模型中仍是一個尚待解決的問題。

論文地址:https://arxiv.org/pdf/2012.14271v1.pdf

此外,目前還沒有用於訓練和評估此類模型的語料庫和基準。該論文為日漫翻譯研究奠定了基礎,主要貢獻包括以下 4 點:

首先,該研究提出了一種多模態的語境感知翻譯框架,也是首個結合漫畫圖像來獲取語境信息的研究。該方法能夠翻譯對話氣泡中的文本,這類文本通常需要語境信息(如其他對話氣泡中的文本、說話者的性別等)才能夠翻譯;

其次,為了訓練模型,研究者提出了基於成對的原始日漫及其譯文自動構建語料庫的方法。使用該方法可以構建大型平行語料庫,且無需任何人工標註;

第三,該研究創建了一個新的日漫翻譯評估基準;

最後,該研究在提出方法的基礎上,設計了一個用於全自動日漫翻譯的新系統。

語境感知日漫翻譯

該研究提出的語境感知日漫翻譯框架包括兩個主要部分:語境提取和翻譯。

多模態語境提取

該方法提取 3 類語境:場景、閱讀順序、視覺信息(如圖 2 左側所示),這三者對多模態語境感知翻譯都有重要作用。

圖 2:該研究提出的日漫翻譯框架。其中,N』 表示源句子 N 的譯文。

1)場景分組:單個漫畫頁面包括多個畫框,每個畫框代表一個場景。翻譯故事時,同一場景中的文本通常比其他場景中的文本更加有用。因此,該研究按場景將文本進行分組,以選出可以用做語境的文本。

2)文本排序:接下來要預估文本的閱讀順序。更正式的說,該方法對無序集合 T 進行排序,形成有序集合 {t_1,...,t_N}。由於在日漫中,單個句子通常被分為多個文本區域,因此確保文本順序正確是非常重要的。日漫是按畫框閱讀的,因此文本的閱讀順序是根據以下順序確定的:畫框;每個畫框中的文本。

3) 視覺語義信息提取:最後,該研究提取了場景中出現的物體等視覺語義信息。為了利用每個場景中的視覺語義信息,研究人員使用 illustration2vec 模型來預測每個場景中的語義標籤。

需要強調的是該框架並不局限於日漫。通過適當地定義場景,該框架可被擴展到電影、動畫等具備多模態語境的媒介中。例如,按照以下步驟提取語境,該方法可以輕鬆翻譯電影字幕:將視頻分割成場景;對文本按時間進行排序;通過視頻分類提取語義標籤。

語境感知翻譯模型

為了將提取到的多模態語境集成到 MT 模型,該研究採用了一種簡單而有效的連接方法:連接多個連續文本,並使用句子級 NMT 模型進行一次性翻譯。這裡注意一點,任何 NMT 架構都可以與該方法合併。該研究選擇了 Transformer (big) 模型並按照《Attention is All you Need》設置默認參數。

圖 2 右側展示了三種模型:模型 1:2+2 翻譯;模型 2:基於場景的翻譯;模型 3:具有視覺特徵的基於場景的翻譯。

構建大型平行語料庫

除了日漫翻譯框架以外,該研究還提出了一種自動語料庫構建方法,以便訓練翻譯模型。輸入為兩本漫畫書,一本是日本漫畫,另一本是其英文版,目標是提取具有語境信息的平行文本,這些信息可用來訓練該研究提出的模型。

術語和可用的標註數據:圖 4 列舉了對話氣泡、文本區域以及文本行。對話氣泡包含一或多個文本區域(即段落),每個文本區域包含一或多個文本行。

圖 4:日漫文本中的術語定義。

該研究假設訓練模型只能獲取對話氣泡的標註,文本行和文本區域的標註不可用。此外,對話氣泡和任何目標語言數據的分割掩碼也不可用。

注意,該研究提出的方法並不依賴於特定語言。除了英語,該研究還將漢語作為目標語言,稍後在圖 9 中演示。

訓練檢測器:該研究訓練了兩個目標檢測器:對話氣泡檢測器和文本行檢測器,這是語料庫構建 pipeline 的基本構建塊。該研究使用以 ResNet101 為主幹網絡的 Faster R-CNN 模型來訓練目標檢測器。

由於無法獲取文本行標註,該研究以弱監督方式基於對話氣泡標註生成文本行標註,參見下圖 6:

圖 6:生成文本行標註。

提取平行文本區域

下圖 5 展示了提取平行文本區域的 pipeline,包括:a) 頁面配對、b) 文本框檢測、c) 對話氣泡的像素級估計、d) 分割連接的對話氣泡、e) 不同語言之間的對齊操作、f) 文本識別,g) 語境提取。

圖 5:平行語料庫構建框架。

全自動日漫翻譯系統

研究人員基於其模型和構建的語料庫提出了一個全自動日漫翻譯系統。給出日漫頁面,該系統可以自動識別文本、將文本翻譯為目標語言,並將譯文替換掉原始文本。

該系統包括以下步驟:文本檢測與識別;翻譯;清除原始日語文本;將譯文填充進原始文本區域,下圖展示了該系統的翻譯過程。實驗結果表明該該系統能夠自動將日漫翻譯成英文或中文。

圖 9:全自動日漫翻譯系統的示例,分別從日語翻譯成英語和中文。

實驗

數據集:該研究建立了兩個新型日漫數據集:OpenMantra 和 PubManga,一個用來評估 MT(機器翻譯),另一個用來評估構建的語料庫。

機器翻譯評估

為了驗證該研究提出的模型和 Manga 語料庫的效果,該研究在 OpenMantra 數據集上進行了翻譯實驗。參與評估的 6 個系統參見下表 1:

表 1:在 OpenMantra Ja–En 數據集上進行評估的所有翻譯系統及其性能。「*」表明結果顯著優於 Sentence-NMT (Manga) ,p

從表 1 中可以看到人工和自動評估結果。與谷歌翻譯與 Sentence-NMT (OS18) 相比,SentenceNMT (Manga) 的性能有顯著提升,這表明該研究提出的 Manga 語料庫構建策略有效。

與人工評估的結果相反,語境感知模型的 BLEU 值不如 Sentence-NMT (Manga)(表 1 第 4-6 行),這表明 BLEU 值不適合作為日漫翻譯的評估指標。下圖 7 展示了在人工評估中 Scene-NMT 優於 SentenceNMT (Manga) 的一個示例,但前者的 BLEU 值較低。

圖 7:基於句子(中間圖)與基於畫框(右側圖)的模型輸出。H 和 B 後面的值分別表示每個頁面的人工評測值和 BLEU 值。

語料庫構建評估

為了評估語料庫構建的性能,該研究比較了以下四種方法:Box、Box-parallel、Mask w/o split、Mask w/ split,結果如下表所示:

表 2:在 PubManga 數據集上對語料構建性能進行評估。

該結果表明,該研究利用掩碼估計的語料庫構建方法顯著優於僅使用邊界框區域的兩種方法,掩碼分割也能顯著提升查準率和查全率。

THE END

轉載請聯繫本公眾號獲得授權

投稿或尋求報導:content@jiqizhixin.com

相關焦點

  • B站UP主自製翻譯器,自稱可啃任何生肉,還可以翻譯論文
    白交 發自 凹非寺 量子位 報導 | 公眾號 QbitAI一個B站UP主,自製了個翻譯器,稱可以啃任何生肉視頻,甚至是遊戲。這個翻譯器是基於OCR技術製作的,也就是說,你只需在界面上截圖,即使是遊戲、動畫新番的字幕,也能截屏翻譯。而且,隨著畫面的改變,還可以直接自動翻譯。
  • 有了這個翻譯器,以後啃不動的生肉就交給它吧!
    結果語音翻譯軟體沒找著,倒是被世超發現了一款免費好用的字幕自動翻譯神器——「 糰子翻譯器 」。 它可以翻譯包括英文、日文、韓文在內的多種形式的字幕,起初是由 B 站一個名叫 「 胖次の糰子 」 的 up 主所製作,現在軟體被她分享在 GitHub
  • 美劇「生肉」實時翻譯成中文字幕,這個平板厲害了!
    【天極網IT新聞頻道】華為最新發布的Mate 40系列帶來了許多令人耳目一新的新功能,其中就包括系統級翻譯和AI字幕。最近,旗艦平板MatePad Pro用戶也陸續收到了EMUI 11的推送,系統升級後,在平板上也能體驗到這兩個在手機端備受好評的「黑科技」。
  • 美劇「生肉」實時翻譯成中文字幕
    華為最新發布的Mate 40系列帶來了許多令人耳目一新的新功能,其中就包括系統級翻譯和AI字幕。最近,旗艦平板MatePad Pro用戶也陸續收到了EMUI 11的推送,系統升級後,在平板上也能體驗到這兩個在手機端備受好評的「黑科技」。首先是全新的「系統級翻譯」功能,包括選詞翻譯與圖片翻譯,只需要在應用中單指長按要翻譯的單詞或句段(瀏覽圖片採用雙指按壓),拖動光標選擇識別範圍,就可以將外文翻譯成指定的目標語言,如果翻譯文本為單詞時,還可以上滑翻譯窗口,查看更多單詞釋義和例句。
  • 神經機器翻譯系統上線500天 百度的英文說得越來越溜
    去年5月,百度率先將基於神經網絡的機器翻譯(Neural Machine Translation,簡稱NMT)納入百度翻譯中,推出全球首個基於深度學習的在線翻譯系統。這個系統有多厲害呢?簡單來說,從前翻譯系統是將一句話拆分成單詞或者詞組進行翻譯,這樣的翻譯結果往往會導致語句不通,出現各種鬧笑話的「中式英語」。
  • 華為平板EMUI 11升級,AI字幕讓「啃生肉」成為過去時
    2020-12-11/19:53 華為最新發布的Mate 40系列帶來了許多令人耳目一新的新功能,其中就包括系統級翻譯和
  • 小米推出首款全自動麻將機 小戶型有福了
    10月14日消息,小米有品今天上架了第一臺自動迷你麻將機,既可用作麻將桌,也可用作餐桌。一機多用,小家庭也可放置。小米推出首款全自動麻將機 小戶型有福了這款迷你麻將機售價1850元起。提供38-56共10種尺寸的麻將牌型可選,麻將尺寸越大,麻將桌的價格也越貴,最貴2950元。
  • So easy EMUI11升級版翻譯神器 哪裡不會點哪裡
    比如開會時,PPT展示的一些英文內容,別人還需要依賴第三方APP拍照翻譯,我就可以直接利用系統自帶的AR翻譯功能,讓翻譯內容直接顯示在手機屏幕上,無須拍攝一目了然。我們只要打開系統相機,點擊左上角的智慧視覺圖標,然後將模式調到「翻譯」即可。多虧有了它,在別人還要重複拍攝,糾結照片不夠清晰的時候,我已經可以了解完全文含義了。
  • 鏟屎官:生肉餵養後,我的貓拉屎再也不臭了
    10塊錢/斤一下的貓糧就不要考慮了,20塊錢以上的貓糧選擇性更多,但一般人也無法長期供應這個價位的貓糧,所以建議大家買貓糧要在10-20塊錢/斤,這個檔位的。 貓咪吃得少,10-20塊錢的價位,還是可以長期供應的。千萬不要買太便宜的貓糧,吃好點的對貓咪發育、毛髮、皮膚等都好,否則只會拉得又多又臭。
  • 編輯試用翻譯機:同聲轉譯精準,從此無「生肉」
    有了它,從此就再也沒有「生肉」視頻  無意中發現現在訊飛的翻譯機擁有了一個「同聲字幕」的功能,可以在我看外語直播/視頻時,實時且同步的在電腦上生成中英文字幕。  這個功能對我來說就很有用。像我們的日常工作中,同事經常會去外網扒一些「生肉」視頻/直播,翻譯成中文來撰寫資訊,而我這種外語不好的就只能眼巴巴地看著別人去賺這種流量。
  • 真正的賽博朋克今日發售x你選擇等中文還是啃生肉?
    今天是11月27日,距離《賽博朋克2077》發售還有14天不過虛假的賽博朋克還在跳票,真正的賽博朋克已經發售了x被譽為「黃油界2077」的A社(Alicesoft)新作:《多娜多娜 一起來幹壞事吧》今日發售!
  • 白酒官宣新名「Chinese Baijiu」 翻譯時再也不用生編硬造了
    原標題:白酒官宣新名「Chinese Baijiu」 翻譯時再也不用生編硬造了近日,中國酒業協會稱,海關總署同意將海關商品名錄中白酒對應的英文更改為「Chinese Baijiu」。2021年12月30日,國務院關稅稅則委員會發布《中華人民共和國進出口稅則(2021)》。在《稅則》商品名錄第22章「飲料、酒及醋」中,中文列目「白酒」對應的英文是「Chinese Baijiu」。而在往年的稅則中,其英文名是「Chinese distilled spirits」。
  • 漢化組是個怎樣的存在,如果沒有漢化組,你能啃得動「生肉」嗎
    正是他們用愛發電,辛辛苦苦的翻譯,我們才能真正領會到精彩的動漫,而好的漢化組會帶給觀眾有趣的體驗,有些東西直譯,是無法體現出其中情感的,哪怕是在現在,很多動漫裡,都看得到用愛發電的漢化組們的努力,我相信,漢化組不會被時代拋棄的。
  • 柳江:看這個灌溉「神器」!家裡的田地再也不用愁了~
    柳江:看這個灌溉「神器」!家裡的田地再也不用愁了~ 信息來源:微柳江 發布日期:2021-01-07 11:26 【字體:大中小】
  • 為什麼日漫英文版採用橫排文字,而漢化版卻使用豎排?
    我因為個人習慣,喜歡找彩漫資源來看;但找JOJO第八部的時候遇到不小的困難,因為國內漢化組效率低下,彩漫資源僅僅翻譯到22話,導致我被迫去尋找外文版的生肉。 後來我在一個名為「Manga Dex」的網站上找到了彩漫資源,目前已更新到70話,總共有英語、義大利語、法語和波蘭語四種版本的生肉。
  • 為何人不能吃生肉,而動物卻能安全地吃生肉?原來是這樣!
    關於這個問題,獅子、老虎會咆哮著問你:我倒是想吃熟肉,關鍵誰給我煮,你們會用火,我不會呀。動物可以吃生肉有5個主要原因:新鮮,現殺現吃;胃酸多;免疫系統強;嗅覺強;沒得選;新鮮大草原上野生動物捕到食物往往就地分食。這意味著肉仍然是新鮮的,還沒有開始腐爛。
  • 訊飛翻譯機3.0新升級,追劇再也不用野生字幕組了
    不知道大家是否和我一樣有強迫症,平時追英、美劇的時候,一定要看最新出爐的那一集以免被網上一些「好心人士」劇透,但是最新的劇一般都是「生肉」還沒有被字幕組漢化,沒有一點外語基礎看起來的時候真是費勁。最近在科技圈的朋友給我推薦了一款產品——訊飛翻譯機3.0,沒想到從此我的追劇生活變得更加豐富了!
  • 順德全自動疫苗智能傳輸系統投用
    大良社區衛生服務中心迎來一套價值40餘萬的全自動疫苗智能傳輸系統,此系統是中區接種門診信息化、自動化、智能化的全新升級。全自動疫苗智能傳輸系統。  10月27日,城網君了解到,大良社區衛生服務中心的全自動疫苗智能傳輸系統是預防接種門診升級改造的重點工程,該系統最大的亮點是實現了疫苗從接種叫號到疫苗接種全自動智能化的疫苗冷鏈傳輸。
  • 升級EMUI 11體驗全能翻譯助手,掌上「同傳」你見過嗎?
    可以看到,在原文和翻譯旁邊,都有一個小喇叭標誌,點擊它,手機就能幫我們朗讀。比如,有時候我們準備演講,只查了單詞含義還不夠,還需要知道單詞的準確讀音,全能翻譯此時就是我們的英文小老師,能夠幫我們完美應對各類英文匯報。如果我們還想更深入了解某個單詞,只要將翻譯頁面上拉,就可以看到更詳細的單詞釋義和例句了。