漫畫翻譯、嵌字 AI,東京大學論文被 AAAI』21 收錄

2021-01-11 騰訊網

內容概要:一項關於漫畫文字自動翻譯的研究,引發了熱議,由兩位東京大學博士組成的 Mantra 團隊發布了一篇論文,目前已被 AAAI 2021 收錄,該 Mantra 項目旨在為日本漫畫提供自動化的機器翻譯工具。

關鍵詞:機器翻譯 情感識別 漫畫 AI

最近,由東京大學 Mantra 團隊、雅虎(日本)等機構聯合發布的《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》(論文地址https://arxiv.org/abs/2012.14271)論文,引發了學界和二次元界的關注。

如圖所示:左一為日文原版,自動化輸出英文版(右二)和中文版(右一)

Mantra 團隊成功地實現了將漫畫的中的對話、氣氛詞、標籤等文字自動識別,並做到了區分角色、聯繫上下文,最後將翻譯文字準確替換、嵌入氣泡區域

有了這個翻譯神器,估計翻譯組、追漫的小夥伴們都該偷著樂了。

發論文、公開數據集、商業化一條龍

在科研方面,目前該篇論文已經被 AAAI 2021 接收,研究團隊還開源了一個包含五部不同風格(幻想、愛情、戰鬥、懸疑、生活)的漫畫,所組成的翻譯評估數據集。

OpenMantra 漫畫翻譯評估數據集

論文地址:https://arxiv.org/abs/2012.14271

數據格式:帶注釋的 JSON 文件和原始圖像

數據內容:1593 個句子、848 個場景、214 頁漫畫

數據大小:36.8 MB

更新時間:2020 年 12 月 7 日

下載地址:https://hyper.ai/datasets/14137

在產品化方面,Mantra 計劃上線封裝好的自動翻譯引擎,不僅面向出版社提供漫畫的自動化翻譯與發行服務,也會發布面向個人用戶的服務。

下面是我們從 Mantra 官方推特上選取的日漫《周邊男子》的部分翻譯成果,這部多格、輕耽美風格的漫畫,以生活常用的數碼設備擬人化為背景,充滿歡樂與基情

滑動查看《周邊男子》日文原版及自動化機器翻譯的中英文版本

識別、翻譯、嵌字,一步也不能少

具體的實現步驟,Mantra 研究團隊在論文《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》中進行了詳細的解釋。

第一步 定位文字

在實現漫畫自動化翻譯的第一步,就是提取文字區域。

但由於漫畫的特殊性,來自不同角色的對話、效果擬聲詞、文字標註等等,都會展現在一幅漫畫圖片裡,漫畫師會用氣泡、不同的字體、誇張的字體來展現不同效果的文字。

漫畫中的手繪、異形文字的識別成為了難點

研究團隊發現,由於漫畫中的這些各種字體和手繪樣式,即使使用最先進的OCR 系統(例如 Google Cloud Vision API),在漫畫文本上的表現很不理想。

因此,團隊開發了針對漫畫優化的文本識別模塊,通過檢測文本行和識別每個文本行的字符來實現對異形文字的識別。

第二步 內容識別

在漫畫中,最常見的文字就是角色之間的對話,對話文字氣泡還會被切割成多塊。

這就要求自動化機器翻譯需要準確區分角色,還得聯繫上下文注意主語的銜接、避免重複,這都對機器翻譯提出了更高的要求。

點擊放大查看場景分類、文本順序和情感識別流程

在這一步中,要通過上下文感知、情感識別等方式來實現,在上下文感知中,Mantra 團隊用了文本分組、文本閱讀順序、提取視覺語義三種方式,實現了多模態的上下文感知。

第三步 自動嵌字

Mantra 這一自動化引擎,不僅能夠區分角色、聯繫上下文準確翻譯以外,還很好地解決了漫畫翻譯中的耗時最久、人力成本最高的環節——嵌字。

在嵌字這一環節中,首先要擦除嵌字區域,再進行嵌字,由於日文、中文、英文字符的形態、拼寫、組合、連讀方式都不一樣,所以這一環節的難度也尤其大。

在這一步中,需要進行:頁面匹配檢測文本框文字氣泡的像素統計拆分連接的氣泡語言間的對齊文字識別上下文提取。

實驗:數據集與模型測試

在論文中的實驗部分,Mantra 團隊提到目前並沒有包含多種語言的漫畫數據集,所以他們創建了 OpenMantra(已開源)和 PubManga 數據集,其中OpenMantra 用於評估機器翻譯,包含 1593 個句子、848 個場景畫面和 214 頁漫畫,Mantra 團隊已經請專業翻譯人員將數據集翻譯成英文和中文

OpenMantra 漫畫翻譯評估數據集

(同上文)

論文地址:https://arxiv.org/abs/2012.14271

數據格式:帶注釋的 JSON 文件和原始圖像

數據內容:1593 個句子、848 個場景、214 頁漫畫

數據大小:36.8 MB

更新時間:2020 年 12 月 7 日

下載地址:https://hyper.ai/datasets/14137

PubManga 數據集用於評估構建的語料庫,該數據集包含注釋:1)文本和框架的邊框;2)日語和英語的文本(字符序列);3)框架和文本的閱讀順序。

為了訓練模型,團隊準備了842097 對日文、英文版的漫畫頁面,共 3979205 對日語-英語的句子。具體的方法可以閱讀論文,最終的模型效果評估由人工完成,Mantra 團隊邀請了五位專業的日文-英文翻譯人員,以專業的翻譯評估程序給句子打分。

項目背後:有趣的靈魂一起學習

目前該篇論文已經被 AAAI 2021 收錄,產品化的工作也在穩步推進中,從 Mantra 團隊的推特中,我們看到已經有不少漫畫成功使用了 Mantra 進行自動化機器翻譯。

這樣的寶藏項目,是由兩位東京大學的博士生完成的,CEO石和祥之介(Shonosuke Ishiwatari),CTO 日南涼太(Ryota Hinami)同在東京大學博士畢業,在 2020 年創立了 Mantra 團隊。

Mantra CEO 石和祥之介(左)和 CTO 日南涼太(右)

CEO 石和祥之介,東京大學信息科學系本科 2010 級入學,博士畢業於 2019 年。他主要專注於自然語言處理領域的研究和開發,包括機器翻譯和字典生成,也是本篇論文的第二作者。

值得一提的是,石和祥之介的研究經驗豐富,不僅曾經在 CMU 交流訪學,還曾於 2016-17 年在位於北京的微軟亞洲研究院實習半年,當時他在MSRA 首席研究員劉樹傑團隊從事 NLC (Natural Language Computing) 自然語言計算的研究。

CTO 日南涼太石和祥之介同年入學,專注於圖像識別領域。在 2016-17 年同期和石和祥之介,一同在微軟亞洲研究院實習。

這樣的一對技能互補的小夥伴,完成了 Mantra 的大部分工作,是不是從發量到成果都很讓人羨慕呢?

如果想了解更多關於 Mantra 的信息,大家可以訪問論文(https://arxiv.org/abs/2012.14271)、項目官網(https://mantra.co.jp/)或下載數據集(https://hyper.ai/datasets/14137),進行進一步研究。

—— 完 ——

歡迎個人轉發到朋友圈

相關焦點

  • 漫畫文字自動翻譯
    【CSDN 編者按】相信不少漫畫迷都曾為了追漫畫特地去學習外語,學外語的時候很累,看漫畫的時候很爽。現在,東京大學兩位博士研發了漫畫文字自動翻譯的一個工具,追漫再也不累了!作者 | 神經星星 責編 | 張文內容概要:一項關於漫畫文字自動翻譯的研究,引發了熱議,由兩位東京大學博士組成的 Mantra 團隊發布了一篇論文,目前已被 AAAI 2021 收錄,該 Mantra 項目旨在為日本漫畫提供自動化的機器翻譯工具。
  • 日本東京大學教授在《科學》上論文被撤稿
    新華社東京9月6日電(記者華義)據日本媒體6日報導,東京大學教授渡邊嘉典在美國《科學》雜誌上發表的一篇論文被撤稿。今年8月,東京大學認定渡邊嘉典等人發表在《科學》和《自然》等刊物上的5篇論文存在學術不端問題。
  • 2018 年重磅復盤:中國產出全球 25% AI 論文、政府署名 AI 論文...
    2016 年,史丹福大學計算機科學院教授,前谷歌首席科學家 Yoav Shoham 決定退出「AI100」的領導小組,並和 Ray、Erik、Jack 和 Kelven 等人開始領導、開發一項旨在及時跟蹤並反映人工智慧當前發展的現狀的一個指標體系——AI Index。
  • 東京大學4名教授被指論文造假
    新華社東京9月1日電 日本東京大學醫學系4名教授發表在英國《自然》等雜誌上的11篇論文被舉報造假,東京大學日前已經對此事展開初步調查。 據日本時事社1日報導,8月17日有人匿名向東京大學和日本文部科學省發送舉報材料,舉報東京大學醫學系4個研究室從2003年到2015年發表在《自然》等雜誌上的11篇論文涉嫌篡改圖片。
  • 360搜索4篇論文被KDD 2018收錄 「股票精選AI助手」驚豔
    近日, 2018國際知識發現與數據挖掘大會(KDD)公布了今年論文收錄情況,360搜索實驗室共有4篇論文(2篇長報告論文,2篇短報告論文)從近千篇投稿中脫穎而出,被KDD 2018收錄(長文錄取率約10%
  • 西交利物浦大學多媒體實驗室論文被IEEE國際著名期刊收錄
    西交利物浦大學多媒體實驗室論文被IEEE國際著名期刊收錄 http://www.huaue.com  2012年4月24日  來源:華禹教育網
  • 日本東京大學正式調查22篇涉嫌造假論文
    原標題:日本東京大學正式調查22篇涉嫌造假論文日本東京大學20日宣布,對日前被舉報涉嫌造假的6個研究室的22篇論文進行正式調查。東京大學指出,今年8月中旬至下旬,校方兩次接到關於該校6個研究室的22篇論文涉嫌造假的匿名舉報。舉報涉及醫學系和生命科學系,稱這些論文有捏造和篡改嫌疑,相關論文已發表在《自然》等雜誌上。東京大學此前已經進行初步調查,為弄清舉報真偽,決定啟動正式調查。
  • AI 垂直文本翻譯國產網文規模將達 300 億
    在起點國際收購原本在粉絲翻譯網站排名第二的Gravity Tales,Wuxiaworld收購排名第三的Volare Novels之後,正式形成雙峰並峙的局面。北大中文系的博士研究生吉雲飛曾寫過一篇論文深入分析過Wuxiaworld與起點國際的兩條傳播路線。
  • 大學畢業論文談網遊:大陸和臺灣遊戲中的英漢翻譯
    網上熱傳 驚呆答辯老師的論文題目  畢業季來臨,除了難忘的大學生活,準備畢業的同學們還要面對大學的最後一關——畢業論文答辯。可這畢業論文的創作可不是個簡單的事,首先選題要新穎,還要保證論文能夠順利通過答辯。
  • 2012大學英語四級詞彙表(帶音標):I開頭的單詞(1)
    I/ ai/ pron.(主格)我   ice/ ais/ n.冰,冰塊 vt.冰鎮   ice-cream/ 『ais』kri:m/ n.冰淇淋   idea/ ai』diə/ n.想法;思想;意見   ideal/ ai』diəl/ a.理想的;觀念的   identical/ ai』dentikəl/ a.完全相同的;同一的   identify
  • 日本東京大學4名教授多篇論文被指造假
    新華社東京9月1日電(記者華義)日本東京大學醫學系4名教授發表在英國《自然》等雜誌上的11篇論文被舉報造假,東京大學日前已經對此事展開初步調查。  據日本時事社1日報導,8月17日有人匿名向東京大學和日本文部科學省發送舉報材料,舉報東京大學醫學系4個研究室從2003年到2015年發表在《自然》等雜誌上的11篇論文涉嫌篡改圖片。  這些有關生活習慣疾病研究的論文分別以4名教授為第一作者發表。由於舉報內容相當具體,東京大學日前決定展開初步調查,一旦初步調查發現確實存在造假,將成立專門調查委員會進行正式調查。
  • 中日科技論文翻譯系統上線 翻譯率達97%
    中日科技論文翻譯系統發布會現場 人民網北京7月30日電(陳思)近年來,隨著深度學習和神經網絡的廣泛應用機器翻譯能夠大大提高科研人員獲取外文信息的效率,使外文科技文獻的深度閱讀成為可能。中國科學技術信息研究所27日召開發布研討會,宣布中日兩國共同開發的中日科技論文翻譯系統研製成功,其翻譯率可達97%。 網際網路和大數據時代,科學技術發展速度越來越快,科技論文、專利和科技報告等不同類型的科技文獻數量呈爆發式增長。
  • 安徽祁門嵌字豆糖登上《舌尖上的中國》
    人民網合肥2月25日電(汪瑞華)2月24日晚,央視1套、9套並機首播的第三季《舌尖上的中國》第6集中,安徽祁門的嵌字豆糖,憑藉5分多鐘的鏡頭,成功誘惑了天南海北的廣大食客。雖然早已經知道其中的「劇情」,但當真正在電視中看到嵌字豆塘出現的時候,汪鎮華依舊難以掩飾自己的激動心情,因為在他看來,這一天等待的時間實在太久了。 汪鎮華並非從事食品行業出身,但對於嵌字豆糖,卻有著不一樣的情感。從學徒開始,到親自製作成品,歷時兩年之久。
  • 爽文+AI翻譯,全球老外正在同步修仙
    02 一級棒的爽文翻譯 2016年底,谷歌翻譯的一次革命性升級,讓AI翻譯初具與人工翻譯搶飯碗的能力。 而短短一年之後,一家名叫funstory.ai的中國人工智慧公司就在某個垂直領域吊打了谷歌翻譯,這個垂直領域就是爽文翻譯。
  • 留學論文自動生成reference及查重軟體推薦
    寫論文的時候,只有3000字還好,剛到國外讀書時,3000字論文要一個月才能寫完,各種緊張焦慮不懂,後來不一樣了,一周寫6000字也沒問題,特別是靈感來的時候,一天就能寫幾千字了,最重要能引出靈感的,就是多看相關書籍、新聞、期刊等等了,而這些就是論文裡的reference。
  • 無需翻牆,寫論文時有哪些比較神的網站?
    HighWire 斯坦福學術文獻電子期刊 網址 https://www.highwirepress.com/HighWire Press 也是很多人寫論文時的必備參考軟體,它提供免費全文的學術文獻,是在1995年由美國史丹福大學圖書館創立
  • 資源| 史丹福大學NLP組開放神經機器翻譯代碼庫(附論文)
    選自斯坦福機器之心編譯參與:吳攀、杜夏德近日,史丹福大學自然語言處理組(Stanford NLP)發布了一篇文章,總結了該研究組在神經機器翻譯(NMT)上的研究信息。在這篇文章中,他們還放出了在多種翻譯任務上(比如英德翻譯和英語-捷克語翻譯)實現了當前最佳結果的代碼庫(codebase)。
  • 【漢化】櫻色的心(林靜一)翻譯:小狽 / 嵌字:Vita
    編者按:林靜一這篇漫畫的對白十分晦澀,漢化組反覆推敲後還是選擇了直譯,如果無法理解,可以參考意譯的解說,歡迎討論。閱讀順序:從右向左←櫻迷路,惡之花解說:胡曉江長期以來,異常漫畫始終有個原則:確保漫畫可以被讀懂。這是為了打破讀者和藝術漫畫之間的隔閡,大家都是人,創作都是腦內造物,人和人之間有什麼不能理解的呢?
  • 小i翻譯功能大升級 變身在線翻譯專家
    小i機器人作為一款應用於即時通訊工具上的網絡機器人,翻譯服務近期實現了大升級,用戶僅僅通過與機器人對話,就能夠得到精準翻譯,同時通過「小i機器人伴侶」所提供的「外語助手」功能,用戶可以實現在線對話直接翻譯功能,足不出戶隨時隨地與外國友人進行暢談。