黑科技!漫畫文字自動翻譯

2021-01-11 CSDN

【CSDN 編者按】相信不少漫畫迷都曾為了追漫畫特地去學習外語,學外語的時候很累,看漫畫的時候很爽。現在,東京大學兩位博士研發了漫畫文字自動翻譯的一個工具,追漫再也不累了!

作者 | 神經星星 責編 | 張文

內容概要:一項關於漫畫文字自動翻譯的研究,引發了熱議,由兩位東京大學博士組成的 Mantra 團隊發布了一篇論文,目前已被 AAAI 2021 收錄,該 Mantra 項目旨在為日本漫畫提供自動化的機器翻譯工具。

最近,由東京大學 Mantra 團隊、雅虎(日本)等機構聯合發布的《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》論文,引發了學界和二次元界的關注。

如圖所示:左一為日文原版,自動化輸出英文版(右二)和中文版(右一)

Mantra 團隊成功地實現了將漫畫的中的對話、氣氛詞、標籤等文字自動識別,並做到了區分角色、聯繫上下文,最後將翻譯文字準確替換、嵌入氣泡區域。

有了這個翻譯神器,估計翻譯組、追漫的小夥伴們都該偷著樂了。

發論文、公開數據集、商業化一條龍

在科研方面,目前該篇論文已經被 AAAI 2021 接收,研究團隊還開源了一個包含五部不同風格(幻想、愛情、戰鬥、懸疑、生活)的漫畫,所組成的翻譯評估數據集。

OpenMantra 漫畫翻譯評估數據集論文地址:https://arxiv.org/abs/2012.14271數據格式:帶注釋的 JSON 文件和原始圖像數據內容:1593 個句子、848 個場景、214 頁漫畫數據大小:36.8 MB更新時間:2020 年 12 月 7 日下載地址:https://hyper.ai/datasets/14137

在產品化方面,Mantra 計劃上線封裝好的自動翻譯引擎,不僅面向出版社提供漫畫的自動化翻譯與發行服務,也會發布面向個人用戶的服務。

具體的實現步驟,Mantra 研究團隊在論文《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》中進行了詳細的解釋。

定位文字

在實現漫畫自動化翻譯的第一步,就是提取文字區域。

但由於漫畫的特殊性,來自不同角色的對話、效果擬聲詞、文字標註等等,都會展現在一幅漫畫圖片裡,漫畫師會用氣泡、不同的字體、誇張的字體來展現不同效果的文字。

漫畫中的手繪、異形文字的識別成為了難點

研究團隊發現,由於漫畫中的這些各種字體和手繪樣式,即使使用最先進的OCR 系統(例如 Google Cloud Vision API),在漫畫文本上的表現很不理想。

因此,團隊開發了針對漫畫優化的文本識別模塊,通過檢測文本行和識別每個文本行的字符來實現對異形文字的識別。

內容識別

在漫畫中,最常見的文字就是角色之間的對話,對話文字氣泡還會被切割成多塊。

這就要求自動化機器翻譯需要準確區分角色,還得聯繫上下文注意主語的銜接、避免重複,這都對機器翻譯提出了更高的要求。

點擊放大查看場景分類、文本順序和情感識別流程

在這一步中,要通過上下文感知、情感識別等方式來實現,在上下文感知中,Mantra 團隊用了文本分組、文本閱讀順序、提取視覺語義三種方式,實現了多模態的上下文感知。

自動嵌字

Mantra 這一自動化引擎,不僅能夠區分角色、聯繫上下文準確翻譯以外,還很好地解決了漫畫翻譯中的耗時最久、人力成本最高的環節——嵌字。

在嵌字這一環節中,首先要擦除嵌字區域,再進行嵌字,由於日文、中文、英文字符的形態、拼寫、組合、連讀方式都不一樣,所以這一環節的難度也尤其大。

在這一步中,需要進行:頁面匹配→檢測文本框→文字氣泡的像素統計→拆分連接的氣泡→語言間的對齊→文字識別→上下文提取。

實驗: 數據集與模型測試

在論文中的實驗部分,Mantra 團隊提到目前並沒有包含多種語言的漫畫數據集,所以他們創建了 OpenMantra(已開源) 和 PubManga 數據集,其中OpenMantra 用於評估機器翻譯,包含 1593 個句子、848 個場景畫面和 214 頁漫畫,Mantra 團隊已經請專業翻譯人員將數據集翻譯成英文和中文。

OpenMantra 漫畫翻譯評估數據集(同上文)論文地址:https://arxiv.org/abs/2012.14271數據格式:帶注釋的 JSON 文件和原始圖像數據內容:1593 個句子、848 個場景、214 頁漫畫數據大小:36.8 MB更新時間:2020 年 12 月 7 日下載地址:https://hyper.ai/datasets/14137

PubManga 數據集用於評估構建的語料庫,該數據集包含注釋:

文本和框架的邊框日語和英語的文本(字符序列)框架和文本的閱讀順序為了訓練模型,團隊準備了 842097 對日文、英文版的漫畫頁面,共 3979205 對日語-英語的句子。具體的方法可以閱讀論文,最終的模型效果評估由人工完成,Mantra 團隊邀請了五位專業的日文-英文翻譯人員,以專業的翻譯評估程序給句子打分。

項目背後:有趣的靈魂一起學習

目前該篇論文已經被 AAAI 2021 收錄,產品化的工作也在穩步推進中,從 Mantra 團隊的推特中,我們看到已經有不少漫畫成功使用了 Mantra 進行自動化機器翻譯。

這樣的寶藏項目,是由兩位東京大學的博士生完成的,CEO石和祥之介 (Shonosuke Ishiwatari),CTO 日南涼太(Ryota Hinami) 同在東京大學博士畢業,在 2020 年創立了 Mantra 團隊。

Mantra CEO 石和祥之介(上)和 CTO 日南涼太(下)

CEO 石和祥之介,是東京大學信息科學系本科 2010 級入學,博士畢業於 2019 年。他主要專注於自然語言處理領域的研究和開發,包括機器翻譯和字典生成,也是本篇論文的第二作者。

值得一提的是,石和祥之介的研究經驗豐富,不僅曾經在 CMU 交流訪學,還曾於 2016-17 年在位於北京的微軟亞洲研究院實習半年,當時他在 MSRA 首席研究員劉樹傑團隊從事 NLC (Natural Language Computing) 自然語言計算的研究。

CTO 日南涼太石和祥之介同年入學,專注於圖像識別領域。在 2016-17 年同期和石和祥之介,一同在微軟亞洲研究院實習。

這樣的一對技能互補的小夥伴,完成了 Mantra 的大部分工作,是不是從發量到成果都很讓人羨慕呢?

如果想了解更多關於 Mantra 的信息,大家可以訪問論文(https://arxiv.org/abs/2012.14271)、項目官網(https://mantra.co.jp/)或下載數據集(https://hyper.ai/datasets/14137),進一步研究。

相關焦點

  • 人人譯視界:針對影視劇字幕組推出「視頻翻譯黑科技」,提高80%翻譯...
    近日,一款被稱為」視頻翻譯黑科技」的翻譯協作神器人人譯視界進入公眾視野。其背後的創始團隊在翻譯行業有著十四年的從業經驗,形成了一套完善的協作流程體系。而這款主打「高效協作」的翻譯平臺正是以此為基礎,集AI聽譯、分工協作、進度管理等功能於一身,結合AI技術幫助譯者利用「AI翻譯+人工校對」的方式快速完成翻譯工作。
  • 漫畫漢化超級黑科技!!!看漫畫有福了!
    熱愛看日本漫畫的你聽到一個名字都會肅然起敬!漫畫漢化組!
  • 日均翻譯過萬張,「秒翻」探索自動化漫畫翻譯模式
    漫畫翻譯組使用的工具大多為Photoshop(簡稱「PS」)。作為專業修圖軟體,PS有較高的學習成本,且並不完全匹配漫畫翻譯的需求。漫畫翻譯組需要人工對圖片中的文字信息進行提取翻譯,擦除圖片中的原文後,再逐一對應嵌入譯文,將字體和排版調整至適合原畫面再導出。AI圖片翻譯平臺「秒翻」的出現,正是瞄準了這一痛點。
  • 良心軟體,圖片轉成電子文字,自動翻譯朗讀
    沒有圖片識別軟體的助力,有些工作的完成時間會延長的,這可不符合我的脾氣,只好又找來一款圖片文字識別軟體。今天要分享的這款軟體名字叫「PandaOCR」,也可以叫熊貓識別。這是一個綠色軟體,不用安裝,下載解壓後,就可以使用了。雙擊運行,打開後,界面是這樣的。
  • 微信掃一掃翻譯功能使用方法 會自動將文字轉換成中文超給力!
    微信掃一掃翻譯功能使用方法 會自動將文字轉換成中文超給力!時間:2018-06-04 14:29   來源:皮皮網   責任編輯:沫朵 川北在線核心提示:原標題:微信掃一掃翻譯功能使用方法 會自動將文字轉換成中文超給力! 微信裡面是有一個掃一掃翻譯的功能的,方便快樂我們的生活了,那麼你知道這個功能是怎麼用的嗎?
  • 北京漫享文化科技有限公司 漫畫翻譯校對擔當(韓譯中)
    北京漫享文化科技有限公司漫畫翻譯校對擔當(韓譯中)公司簡介:     作為一家年輕的創業公司,漫享公司的業務已遍及漫畫版權代理與分銷、日韓漫畫翻譯製作、原創漫畫創作等多個領域 工作地點:北京市、瀋陽市(本職位為北京、瀋陽兩地招聘,應聘人員請在郵件中寫明本人期望工作的城市) 崗位名稱:漫畫翻譯校對擔當(韓譯中) 一.
  • 漫畫翻譯、嵌字 AI,東京大學論文被 AAAI』21 收錄
    內容概要:一項關於漫畫文字自動翻譯的研究,引發了熱議,由兩位東京大學博士組成的 Mantra 團隊發布了一篇論文,目前已被 AAAI 2021 收錄,該 Mantra 項目旨在為日本漫畫提供自動化的機器翻譯工具。
  • 漫畫翻譯、嵌字 AI,東京大學論文被 AAAI'21 收錄
    、氣氛詞、標籤等文字自動識別,並做到了區分角色、聯繫上下文,最後將翻譯文字準確替換、嵌入氣泡區域。計劃上線封裝好的自動翻譯引擎,不僅面向出版社提供漫畫的自動化翻譯與發行服務,也會發布面向個人用戶的服務。
  • 谷歌翻譯將升級:實時聽譯並轉文字
    導語:《紐約時報》網絡版周日刊文稱,Skype近期開始測試英語和西班牙語之間的實時語音翻譯,而谷歌也將對翻譯應用進行升級。這表明,全球主要科技公司仍在繼續嘗試消除人們之間溝通的主要障礙,並已經取得了不錯的成果。以下為文章全文:科技行業正在竭盡全力推翻阻礙全球之間相互交流的「巴別塔」。
  • 漫畫翻譯有什麼可聊的?
    他主張翻譯要放開手腳,不拘泥於原文的翻譯。翻譯在當今時代的重要性是不言而喻的,正是有了翻譯這座橋梁,才讓我們遇見更為廣闊的世界。而不同的翻譯觀,也總是影響著在翻譯一線辛苦勞作的人們。今天是「國際翻譯日」,我們再次聊聊「漫畫翻譯」,看看這和普通文字書的翻譯究竟有何異同和特別之處。
  • 怎麼操作才能做到拍照後自動翻譯?
    現在不同以前,我們工作中會有很多需要接觸到英文的機會,除了抓緊時間學習以外(但學習有一個過程,不是剛學就能看得懂英文了),還有一個見效更快的方法,就是通過拍照,把英文翻譯成中文。這時候,就有很多小夥伴說,平時自己也經常拿手機來拍照,咋沒發現還有翻譯的功能呢。大家可別誤會,想要實現翻譯的話,大家還要備一個可以拍照翻譯的工具。
  • 臺灣節目驚嘆大陸黑科技,能翻譯28種方言,網友:我們說普通話
    據報導,10月9日,臺灣一檔財經節目中,主持人又吹捧起了大陸「黑科技」——科大訊飛的即時翻譯軟體,不過這次網友的畫風卻偏了。主持人以「人大」為例,稱科大訊飛能翻譯28種方言。網友評論:有網友聽完吐槽:「頭一回聽說大陸沒有統一官方語言,真的太孤陋寡聞了。
  • 開車可自動躲避病毒 黑科技比"N99級"防護還豪橫
    而長安福特則另闢蹊徑,不僅擁有以上的防護措施,同時還具備四項黑科技提升駕駛時的舒適感受,其中有一項功能可以讓駕駛者在開車時自動躲避病毒區域,這樣的黑科技如同「開掛」一般。黑科技二:自動換風空氣更清新新冠病毒的主要載體是飛沫,長安福特旗下車型均配備了HE微米級高效濾芯,對於空氣中PM2.5顆粒物的過濾也擁有更好效果,去除率可達95%以上 ,同時還能實現送風、攔截和祛味性能的完美平衡,讓用戶隨時放心換新風。
  • 流浪地球 | 科幻黑科技
    想讓地球開始流浪,我們第一個任務,就是解決動力問題。   重元素的聚變是核聚變反應更高級的形式,產生的能量巨大。方向盤改為方向球可以顯著減小人體力量負擔,方便年紀更大的人開車,結合吳孟達的角色七十幾了還在開礦車,就很好解釋了,在那個背景下工作到老是正常的,所以相關配套科技也會考慮到老年人工作的情況。
  • 用AI重新定義翻譯,人人譯視界發布視頻翻譯黑科技
    5月28日,由人人譯視界聯合主辦的「AI翻譯與傳統翻譯共存並贏」主題發布會在北京東方花園酒店成功舉辦,本次發布會上人人譯視界、百聿集團和網易AI事業部強強聯手,三方就如何為語言服務行業帶來第一解決方案進行了深入探討。
  • 語音翻譯,拍照翻譯,這一波赫科技,出國再也不怕了!
    到外國旅遊,和當地人溝通需要語音翻譯?在餐廳吃飯,看不懂菜單需要拍照翻譯?就會跳轉到這個界面大家可以根據需要選擇什麼語言翻譯到什麼語言比如中文翻譯成日語或者日語翻譯成中文按住麥克風說話就可以識別然後翻譯啦
  • 即時翻譯、瞬間排版,這個基於漫畫的 AI 系統還想...
    左邊是日語原版,右邊是 Mantra 的機器翻譯版本,可以看到翻譯和排版的精度都相當高不過總的來說,翻譯的難度要大於識別難度,因為漫畫裡面經常出現口吃或者中途斷句等口語行為,還要處理好文字和表情的關係。
  • 怎樣自動翻譯英文視頻並添加字幕?
    最近需要學習一些英文的視頻教程,但是由於這些視頻文件全英文沒有字幕,學習起來很吃力,於是找了幾個能夠自動翻譯英文視頻並添加字幕的方法,小編經過多方驗證,發現4個免費且翻譯質量比較不錯的方法1、上傳到Youtube自動翻譯經常看Youtube的人都知道,Youtube上幾乎所有的視頻都有翻譯字幕,這是Youtube會使用AI自動為用戶上傳的視頻添加字幕
  • 唱吧小巨蛋黑科技:能自動美化聲音的神仙麥克風
    (原標題:唱吧小巨蛋黑科技:能自動美化聲音的神仙麥克風)
  • 科技英語的特點及翻譯要點
    三、科技英語中經常使用縮略語。隨著現代科學的高速發展,縮略語將日益增多,往往一個縮略語可代表幾十個詞義。由於翻譯無定論,所以在進行英語科技文章的翻譯時,先要明確翻譯的具體目的、翻譯文章的類型,然後對要翻譯的文章閱讀和相關資料的查找,接著才是研究並選擇相應的翻譯方法和策略。