黑科技!漫畫文字自動翻譯

2021-01-20 CSDN

【CSDN 編者按】相信不少漫畫迷都曾為了追漫畫特地去學習外語,學外語的時候很累,看漫畫的時候很爽。現在,東京大學兩位博士研發了漫畫文字自動翻譯的一個工具,追漫再也不累了!

作者 | 神經星星 責編 | 張文

內容概要:一項關於漫畫文字自動翻譯的研究,引發了熱議,由兩位東京大學博士組成的 Mantra 團隊發布了一篇論文,目前已被 AAAI 2021 收錄,該 Mantra 項目旨在為日本漫畫提供自動化的機器翻譯工具。

最近,由東京大學 Mantra 團隊、雅虎(日本)等機構聯合發布的《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》論文,引發了學界和二次元界的關注。

如圖所示:左一為日文原版,自動化輸出英文版(右二)和中文版(右一)

Mantra 團隊成功地實現了將漫畫的中的對話、氣氛詞、標籤等文字自動識別,並做到了區分角色、聯繫上下文,最後將翻譯文字準確替換、嵌入氣泡區域。

有了這個翻譯神器,估計翻譯組、追漫的小夥伴們都該偷著樂了。

發論文、公開數據集、商業化一條龍

在科研方面,目前該篇論文已經被 AAAI 2021 接收,研究團隊還開源了一個包含五部不同風格(幻想、愛情、戰鬥、懸疑、生活)的漫畫,所組成的翻譯評估數據集。

OpenMantra 漫畫翻譯評估數據集論文地址:https://arxiv.org/abs/2012.14271數據格式:帶注釋的 JSON 文件和原始圖像數據內容:1593 個句子、848 個場景、214 頁漫畫數據大小:36.8 MB更新時間:2020 年 12 月 7 日下載地址:https://hyper.ai/datasets/14137

在產品化方面,Mantra 計劃上線封裝好的自動翻譯引擎,不僅面向出版社提供漫畫的自動化翻譯與發行服務,也會發布面向個人用戶的服務。

具體的實現步驟,Mantra 研究團隊在論文《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》中進行了詳細的解釋。

定位文字

在實現漫畫自動化翻譯的第一步,就是提取文字區域。

但由於漫畫的特殊性,來自不同角色的對話、效果擬聲詞、文字標註等等,都會展現在一幅漫畫圖片裡,漫畫師會用氣泡、不同的字體、誇張的字體來展現不同效果的文字。

漫畫中的手繪、異形文字的識別成為了難點

研究團隊發現,由於漫畫中的這些各種字體和手繪樣式,即使使用最先進的OCR 系統(例如 Google Cloud Vision API),在漫畫文本上的表現很不理想。

因此,團隊開發了針對漫畫優化的文本識別模塊,通過檢測文本行和識別每個文本行的字符來實現對異形文字的識別。

內容識別

在漫畫中,最常見的文字就是角色之間的對話,對話文字氣泡還會被切割成多塊。

這就要求自動化機器翻譯需要準確區分角色,還得聯繫上下文注意主語的銜接、避免重複,這都對機器翻譯提出了更高的要求。

點擊放大查看場景分類、文本順序和情感識別流程

在這一步中,要通過上下文感知、情感識別等方式來實現,在上下文感知中,Mantra 團隊用了文本分組、文本閱讀順序、提取視覺語義三種方式,實現了多模態的上下文感知。

自動嵌字

Mantra 這一自動化引擎,不僅能夠區分角色、聯繫上下文準確翻譯以外,還很好地解決了漫畫翻譯中的耗時最久、人力成本最高的環節——嵌字。

在嵌字這一環節中,首先要擦除嵌字區域,再進行嵌字,由於日文、中文、英文字符的形態、拼寫、組合、連讀方式都不一樣,所以這一環節的難度也尤其大。

在這一步中,需要進行:頁面匹配→檢測文本框→文字氣泡的像素統計→拆分連接的氣泡→語言間的對齊→文字識別→上下文提取。

實驗: 數據集與模型測試

在論文中的實驗部分,Mantra 團隊提到目前並沒有包含多種語言的漫畫數據集,所以他們創建了 OpenMantra(已開源) 和 PubManga 數據集,其中OpenMantra 用於評估機器翻譯,包含 1593 個句子、848 個場景畫面和 214 頁漫畫,Mantra 團隊已經請專業翻譯人員將數據集翻譯成英文和中文。

OpenMantra 漫畫翻譯評估數據集(同上文)論文地址:https://arxiv.org/abs/2012.14271數據格式:帶注釋的 JSON 文件和原始圖像數據內容:1593 個句子、848 個場景、214 頁漫畫數據大小:36.8 MB更新時間:2020 年 12 月 7 日下載地址:https://hyper.ai/datasets/14137

PubManga 數據集用於評估構建的語料庫,該數據集包含注釋:

文本和框架的邊框日語和英語的文本(字符序列)框架和文本的閱讀順序為了訓練模型,團隊準備了 842097 對日文、英文版的漫畫頁面,共 3979205 對日語-英語的句子。具體的方法可以閱讀論文,最終的模型效果評估由人工完成,Mantra 團隊邀請了五位專業的日文-英文翻譯人員,以專業的翻譯評估程序給句子打分。

項目背後:有趣的靈魂一起學習

目前該篇論文已經被 AAAI 2021 收錄,產品化的工作也在穩步推進中,從 Mantra 團隊的推特中,我們看到已經有不少漫畫成功使用了 Mantra 進行自動化機器翻譯。

這樣的寶藏項目,是由兩位東京大學的博士生完成的,CEO石和祥之介 (Shonosuke Ishiwatari),CTO 日南涼太(Ryota Hinami) 同在東京大學博士畢業,在 2020 年創立了 Mantra 團隊。

Mantra CEO 石和祥之介(上)和 CTO 日南涼太(下)

CEO 石和祥之介,是東京大學信息科學系本科 2010 級入學,博士畢業於 2019 年。他主要專注於自然語言處理領域的研究和開發,包括機器翻譯和字典生成,也是本篇論文的第二作者。

值得一提的是,石和祥之介的研究經驗豐富,不僅曾經在 CMU 交流訪學,還曾於 2016-17 年在位於北京的微軟亞洲研究院實習半年,當時他在 MSRA 首席研究員劉樹傑團隊從事 NLC (Natural Language Computing) 自然語言計算的研究。

CTO 日南涼太石和祥之介同年入學,專注於圖像識別領域。在 2016-17 年同期和石和祥之介,一同在微軟亞洲研究院實習。

這樣的一對技能互補的小夥伴,完成了 Mantra 的大部分工作,是不是從發量到成果都很讓人羨慕呢?

如果想了解更多關於 Mantra 的信息,大家可以訪問論文(https://arxiv.org/abs/2012.14271)、項目官網(https://mantra.co.jp/)或下載數據集(https://hyper.ai/datasets/14137),進一步研究。

相關焦點

  • 翻譯「黑科技」語音識別晶片讓你無所顧忌
    打開APP 翻譯「黑科技」語音識別晶片讓你無所顧忌 電子發燒友 發表於 2019-03-11 17:16:20 準備來一場「說走就走的旅行
  • 華為手機自帶翻譯黑科技,按下這個按鈕,即可翻譯多國語言
    用過華為手機的朋友都知道,手機中有很多黑科技功能,除了一些經常使用到手機技巧。其實華為手機中還隱藏了一個非常實用的辦公黑科技。手機自帶大翻譯功能相信很少有人知道怎麼使用,下面就帶大家了解一下。一、手機拍照翻譯華為手機自帶的相機功能除了用來拍照以外,還可以當作翻譯功能。當我們遇到看到不懂的英文單詞,只要拿出手機打開相機對準需要翻譯的英文單詞進行拍照,等待2秒就可以將英文翻譯成中文,不但如此還可以實現互譯功能。
  • 同傳翻譯耳機咪咕莫比斯亮相黑科技展
    第二季杭州智能博覽會暨黑科技展已經落下帷幕,莫比斯耳機的亮相可謂是賺足了參觀者的眼球。出國旅遊,不懂英語也能通過耳機實現同聲傳譯。莫比斯耳機是咪咕聯合科大訊飛聯合出品的全語音人工智慧同傳翻譯耳機,也是今年咪咕主推的智能硬體產品。
  • 微信掃一掃翻譯功能使用方法 會自動將文字轉換成中文超給力!
    微信掃一掃翻譯功能使用方法 會自動將文字轉換成中文超給力!時間:2018-06-04 14:29   來源:皮皮網   責任編輯:沫朵 川北在線核心提示:原標題:微信掃一掃翻譯功能使用方法 會自動將文字轉換成中文超給力! 微信裡面是有一個掃一掃翻譯的功能的,方便快樂我們的生活了,那麼你知道這個功能是怎麼用的嗎?
  • 良心軟體,圖片轉成電子文字,自動翻譯朗讀
    沒有圖片識別軟體的助力,有些工作的完成時間會延長的,這可不符合我的脾氣,只好又找來一款圖片文字識別軟體。今天要分享的這款軟體名字叫「PandaOCR」,也可以叫熊貓識別。這是一個綠色軟體,不用安裝,下載解壓後,就可以使用了。雙擊運行,打開後,界面是這樣的。
  • 日均翻譯過萬張,「秒翻」探索自動化漫畫翻譯模式
    漫畫翻譯組使用的工具大多為Photoshop(簡稱「PS」)。作為專業修圖軟體,PS有較高的學習成本,且並不完全匹配漫畫翻譯的需求。漫畫翻譯組需要人工對圖片中的文字信息進行提取翻譯,擦除圖片中的原文後,再逐一對應嵌入譯文,將字體和排版調整至適合原畫面再導出。AI圖片翻譯平臺「秒翻」的出現,正是瞄準了這一痛點。
  • word翻譯功能:如何對文檔進行自動翻譯
    通常情況下,大部分人會Ctrl+C、Ctrl +V複製,然後將文本內容粘貼進行百度,或是翻譯網站、翻譯軟體APP進行翻譯,最後再把翻譯結果複製粘貼出來。如果一篇文檔太長,則需要多次反覆以上步驟,非常費時費力。其實,有一個非常簡單的方法就在我們身邊,只是被很多夥伴都忽略了,它就是Word自帶的「自動翻譯」功能。
  • ...4000億字資料庫 ,「譯訊科技」以精準語料資料庫切入AI文檔翻譯...
    圖源:譯訊科技 四川譯訊信息科技有限公司(以下簡稱「譯訊科技」),作為一家跨語言大數據和人工智慧技術的科技公司,擁有海量的資料庫、高覆蓋率的32+2(藏語和維語「目前我們平臺已積累了超百億句對(約4千億字)的翻譯數據。」「譯訊科技」創始人馬帥告訴36氪四川,「譯訊科技」推出的雲譯通智能文檔翻譯軟體,以PC平臺為基礎,利用大數據、人工智慧和雲技術,能做到1分鐘翻譯100頁,專業翻譯準確率高達92.8%。 海量的數據積澱,使得用戶可通過搜尋引擎與雲譯通後臺雲端儲存的數據進行快速比對。
  • 訊飛翻譯機亮相蘇州智博會,大秀翻譯黑科技
    2020全球人工智慧產品應用博覽會於8月14日至16日在蘇州國際博覽中心成功舉行,本次智博會以「萬物復甦·智啟未來」為主題,共設置12個展區,科大訊飛與華為、百度、阿里巴巴、商湯科技等國家新一代人工智慧開放創新平臺以及其生態鏈夥伴企業共同亮相。
  • 中國十大黑科技
    發布單位:阿里雲 中國十大黑科技之首,就是阿里雲發布的ET工業大腦人工智慧技術,它通過強大的智能算法,在國內的製造業工廠裡起到節省成本、減少廢品的作用
  • 怎樣自動翻譯英文視頻並添加字幕?
    最近需要學習一些英文的視頻教程,但是由於這些視頻文件全英文沒有字幕,學習起來很吃力,於是找了幾個能夠自動翻譯英文視頻並添加字幕的方法,小編經過多方驗證,發現4個免費且翻譯質量比較不錯的方法1、上傳到Youtube自動翻譯經常看Youtube的人都知道,Youtube上幾乎所有的視頻都有翻譯字幕,這是Youtube會使用AI自動為用戶上傳的視頻添加字幕
  • 三大AI黑科技翻譯,商務人士新寵,訊飛智能耳機全面評測
    日常通勤旅差佩戴,或許可以打發無聊時光,但在商務場合需要會議記錄、翻譯的時候,請人時間和金錢成本太高,自己又忙不過來,延誤商機造成的損失大家心裡都清楚。在瞬息萬變的現代社會,有了順暢無障礙的溝通,很多事情才能變得簡單。隨著AI和科技的發展,讓我們以前只能想像的事情變成了現實。如今一款TWS耳機就能實現轉寫、翻譯等翻譯、語音轉文字、和通話記錄?。沒錯!
  • 國內十大黑科技一覽(收藏)
    近日重慶國際博覽中心的創新產品黑科技吸引了眾多目光,其中的十大黑科技更是抓人眼球,讓我們一睹為快。1、ET工業大腦(阿里雲)人工智慧與大數據技術結合後,將之用在生產線上。不改變當前的生產線設施,利用這兩項技術助力工業流程優化,提高產品質量和生產效率。
  • 自動販賣機買冰箱、網購直接找工廠...智博會黑科技走一波!
    ▲智博會現場一年一度的智博會,是重慶人體驗智能應用,觀摩「黑科技」的一次盛會。從記者現場探館的體驗來看,依然是「黑科技」滿滿。那麼,展館中究竟有哪些有意思的黑科技呢?本著普通市民看個新奇熱鬧的原則,記者帶你走進智博會體驗一番,並邀請網友打開「腦洞」,隨便暢想。
  • Google推Fabricius,可將英文翻譯成古埃及文字!
    隨著科技進步,翻譯軟體功能也越來越多樣化。近日,Google推出了全球首個透過機器學習的埃及象形文字的數字翻譯工具(Fabricius)。無論是學者或是普通人都能透過這個工具體驗埃及象形文字。Google趁羅塞塔石碑(Rosetta Stone)出土紀念日宣布推出翻譯工具Fabricius。工具透過人工智慧(AI)技術解碼古代語言,更可將使用者所寫的文字,翻譯成埃及象形文字。不過較可惜的是,目前僅可用英文字翻譯,暫時未能將其他語言翻譯成象形文字。
  • 快手要怎麼自動識別文字 快手自動識別文字怎麼弄
    快手短視頻的人氣一直很高,那麼快手要怎麼自動識別文字?快手自動識別文字怎麼弄?和小編一起來看看吧。
  • 「樹洞」做翻譯的我,最後卻依賴上了人工智慧
    直到那一天,人們終於想起了被人工智慧支配的恐懼我是一個翻譯者,平時喜歡翻譯一些漫畫,偶爾也接一下廣告和海報的翻譯單子。前兩天,我找了一份輕鬆滿意還不錯的翻譯兼職,一份關於漫畫翻譯的工作,其實要求不高,就是進行漫畫排版,我是屬於比較獨來獨往的譯者,換言之自己沒有小組,所以經常都是用 PS 將文字提取、翻譯和排版一手抓。我所做過的作品就不給大家一一呈現了,只放一個簡單的例子:我感覺就是正常的水平吧,平時能保證一天翻譯 10 話內容不是問題。
  • 「黑科技」智能筆記本,到底是什麼樣的存在?
    看完紙張,再看一下它的「黑科技」體驗吧。到底,這個「黑科技」是一種什麼樣的體驗呢?01 可擦除怎麼樣?這樣的筆記本你見過嗎?寫完了擦一擦就「乾淨」了?沒錯,不僅擦一擦能幹淨,還有很多種方式可以讓你的書寫過的筆記本恢復如初。比如:像這樣書寫錯了的話,再也不用塗成小黑圈圈或者劃一道兒了,只要用筆一擦就乾乾淨淨了。
  • 即時翻譯、瞬間排版,這個基於漫畫的 AI 系統還想...
    左邊是日語原版,右邊是 Mantra 的機器翻譯版本,可以看到翻譯和排版的精度都相當高不過總的來說,翻譯的難度要大於識別難度,因為漫畫裡面經常出現口吃或者中途斷句等口語行為,還要處理好文字和表情的關係。目前,團隊也正在針對漫畫表情開發識別引擎。
  • 即時翻譯、瞬間排版,這個基於漫畫的AI系統居然想消滅漢化組?
    左邊是日語原版,右邊是Mantra的機器翻譯版本,可以看到翻譯和排版的精度都相當高不過總的來說,翻譯的難度要大於識別難度,因為漫畫裡面經常出現口吃或者中途斷句等口語行為,還要處理好文字和表情的關係要打造一個漫畫文字瞬間走向世界的未來石渡小哥介紹道,其實Mantra的開發也是純屬偶然。