追番神器 + 1!即時翻譯、瞬間排版,這個基於漫畫的 AI 系統還想...

2020-12-23 IT之家

看番,周更太慢!

想看原版漫畫,不會日語,愁死個人!

雖然現在在各大社交媒體上都有民翻,但是想看的漫畫偏偏太過小眾,沒人翻譯!

別急別急,救星來了。

去年,一位叫作石渡祥之佑的小哥開發了一個 AI 系統 Mantra,該系統結合了特定於漫畫的圖像識別技術、機器翻譯和外語排版自動化技術,也就是說,能夠直接在漫畫原文上實現翻譯

要知道,在日本,漫畫的出版佔到了整體出版物的 40%,人工翻譯費用更是高達每本 200,000 到 300,000 日元。

這項 AI 技術不僅提升了漫畫翻譯的速度,翻譯的成本也降低了 60-70%

說到這,文摘菌想到 AI 也曾幫助中國爽文成功出海,看來 AI 對文化產業仍然有十分重要的貢獻。

這個項目在開發初期就接受到了來自東京大學 FoundX 計劃、IPA、東大 IPC 計劃的支持。最近,DEEPCORE、DMM VENTURES、Legend Co、天使投資等更是對其投資 8000 萬日元。

看得出來,大家對漫畫出海抱有十分強烈的信心和希望。

而且敲黑板劃重點,Mantra 服務預計將在 7 月正式對外開放,本年度的精神支柱就靠它了。

劍指海外發行,Mantra 實現的不只是簡單的文本翻譯

Mantra 主要實現了兩項功能,首先是機器翻譯,在這方面,研究人員對 Mantra 進行了特定於漫畫的技術處理,在這個基礎上,Mantra 能夠實現多語言無障礙翻譯。

針對漫畫的機器翻譯技術到底是怎麼回事,石渡小哥介紹道,簡單來說,Mantra 就是把傳統的手動翻譯自動化了。

人為翻譯漫畫主要有以下三個步驟:

對文本轉錄;

填充語言氣泡的文本部分並進行翻譯;

把翻譯好了的文本進行正確地排版。

看得出來,漫畫的機器翻譯就不只是語言的轉換,還包括了翻譯後的排版工作。

要實現這兩項功能,首先要準確定位到語言氣泡,然後再對其中的文本進行識別與翻譯。

聽起來容易,但是要知道,漫畫中的氣泡文本排版沒有能夠總結的規律,還存在字體大小和樣式的差異,這些都將使得漫畫的機器翻譯比傳統商業翻譯更為困難。

要解決這個難題,石渡小哥開發了專用於漫畫字符識別的 OCR 引擎,在 OCR 引擎的助力下,系統可以準確地檢測和識彆氣泡中的文本,即使漫畫圖像十分擁擠也不在話下。

左邊是日語原版,右邊是 Mantra 的機器翻譯版本,可以看到翻譯和排版的精度都相當高

不過總的來說,翻譯的難度要大於識別難度,因為漫畫裡面經常出現口吃或者中途斷句等口語行為,還要處理好文字和表情的關係。

目前,團隊也正在針對漫畫表情開發識別引擎。

要完全實現漫畫翻譯想必也十分耗時耗財,也正是因為如此,團隊的目標首先就是降低人工翻譯的花費,目前的翻譯仍然需要人工修正,為了更好地進行編輯,團隊也正在開發一種新工具更好地將機器翻譯和人工翻譯結合起來。

對於 Mantra 的潛在發展目標,石渡小哥表示,希望能將該技術利用到出版行業,拓展漫畫的海外市場,以及將其用於個人使用,有助於漫畫作者在社交媒體上自由地發布作品。

要打造一個漫畫文字瞬間走向世界的未來

石渡小哥介紹道,其實 Mantra 的開發也是純屬偶然。

在博士階段,他曾向 ACL 大會提交了一篇機器翻譯的論文,當時他的一位同期日亞正在攻讀圖像識別領域的博士學位,他也曾向相關領域的頂會投了一些論文。

於是在他博三的暑假,他們兩人一拍即合,決定一起做個副業,用機器翻譯一本漫畫書,這也是他們做了一些用戶訪談之後定下來的方向。

「如果能好好利用機器翻譯漫畫相關技術,也許就能打造一個讓文字漫畫在瞬間走向世界的未來。」

後來,我們對這個項目越來越上心,博士畢業之後,決定以創業的方式進行正式的研究。

在 Mantra 的開發過程中,他們也遇到了不少困難,比如,石渡小哥就分享道,首先在訓練數據上就是缺失的,當時並沒有基於雙語的漫畫數據。

本著萬事開頭難的信念,他們決定抽選很少一部分已經被翻譯成外語的漫畫作品,從中提取出雙語文本數據,這樣就以很低的成本創建了首個漫畫翻譯領域的雙語資料庫。

如今,在漫畫翻譯上,還存在很多問題有待解決,比如有時候人物對話會突然被打斷,中間出現一個文本氣泡,以及在漫畫對話中經常會省略主語和賓語。

最近,他們也正在針對這些問題進行逐一攻克,目前的譯文準確率還不是很高,在完全沒有人為修正的情況下,能勉強讀懂 30% 的內容,他們的目標是實現 70%-80% 的可讀性。

Mantra 的目標是確保所有的漫畫作品都能即時傳送到全世界粉絲手上,如果一位日本漫畫家的作品發布在了平臺上,就會被瞬間翻譯成 5-10 種不同的語言,這樣的平臺能夠實現,相信也能從技術上消滅盜版。

為了讓更多的人能夠使用,他們也正計劃把平臺支持的語言擴展到目前的英文和中文之外。

漢化不能少!B 站手把手教你安裝,追劇不停

不要以為翻譯只有輸出國的技術人員在著急,輸入國的粉絲簡直眼睛都要望穿了,這其中,中國肯定要佔上一席。

於是,漢化組們可能要哭了,因為 B 站上有一個 UP 主開源了一款 OCR 翻譯軟體。

根據介紹,當在屏幕上設定好翻譯框後,出現在框中的外語都會被自動識別並快速翻譯成中文,不僅支持漫畫,還支持遊戲、番劇、PDF 文獻等。

在 GitHub 上,官方人員總結了這款翻譯軟體的六大優缺點:

適用範圍全面,幾乎所有出現在屏幕的東西都可以翻譯;

翻譯接口多,目前有 12 個翻譯接口;

簡潔美觀的界面;

及其簡單傻瓜的操作方式;

相比較其他 OCR 翻譯器配置有自動翻譯模式;

需要聯網,可能視網速不同翻譯速度有差。

不過總的來說,還是很香的,網友們也紛紛表示,太香了太香了,簡直比 YouTube 還香!

在使用上,有人表示,雖然需要付費,但是免費額度已經足夠打遊戲用了。不過看到這麼香的翻譯軟體真的能控制住想要打錢的衝動嗎?

在 B 站上,開發人員也上傳了視頻對如何安裝進行了手把手的教學:

正好,端午到了,出得去的出不去的,都浪起來!

GitHub 連結

相關焦點

  • 漫畫翻譯、嵌字 AI,東京大學論文被 AAAI'21 收錄
    有了這個翻譯神器,估計翻譯組、追漫的小夥伴們都該偷著樂了。在科研方面,目前該篇論文已經被 AAAI 2021 接收,研究團隊還開源了一個包含五部不同風格(幻想、愛情、戰鬥、懸疑、生活)的漫畫,所組成的翻譯評估數據集。
  • 漫畫翻譯、嵌字 AI,東京大學論文被 AAAI』21 收錄
    如圖所示:左一為日文原版,自動化輸出英文版(右二)和中文版(右一)Mantra 團隊成功地實現了將漫畫的中的對話、氣氛詞、標籤等文字自動識別,並做到了區分角色、聯繫上下文,最後將翻譯文字準確替換、嵌入氣泡區域。有了這個翻譯神器,估計翻譯組、追漫的小夥伴們都該偷著樂了。
  • 漫畫文字自動翻譯
    【CSDN 編者按】相信不少漫畫迷都曾為了追漫畫特地去學習外語,學外語的時候很累,看漫畫的時候很爽。現在,東京大學兩位博士研發了漫畫文字自動翻譯的一個工具,追漫再也不累了!如圖所示:左一為日文原版,自動化輸出英文版(右二)和中文版(右一)Mantra 團隊成功地實現了將漫畫的中的對話、氣氛詞、標籤等文字自動識別,並做到了區分角色、聯繫上下文,最後將翻譯文字準確替換、嵌入氣泡區域。有了這個翻譯神器,估計翻譯組、追漫的小夥伴們都該偷著樂了。
  • 免費手機追漫神器下載
    這是一款漫畫愛好者們的免費手機追漫神器,可以讓你隨時隨地的看漫畫,睡覺前、上廁所、等公交就可以秒看超多有趣的「輕漫畫」;熱門作品同步更新,快來下載試試~
  • 翻譯公司可以提供怎樣的桌面排版服務?
    瑞科翻譯可提供超過 100 個語種的多語言排版服務,助您實現翻譯文檔的高顏值輸出。DTP 是翻譯和本地化完美結合的一個工作環節,瑞科翻譯能夠為基於 Windows、Linux 和 Mac 平臺的多語言桌面排版提供全面支持。無論您的排版目的是用於屏幕瀏覽,辦公列印,還是用於印刷出版,我們都能實現您的需求。
  • 翻譯狗:超實用的PDF翻譯工具,文檔翻譯神器!
    不管是看外文文獻,還是處理工作中的英文資料,都會遇到要翻譯PDF文檔的情況。平時我們用PDF傳輸資料的好處不用多說,但是一旦遇到需要翻譯的時候,缺點也很明顯:需要轉換格式、排版錯亂、圖表公式丟失…怎麼辦?這個超實用的PDF翻譯工具——翻譯狗,就能幫你解決所以問題。
  • 即時翻譯神器ili面世,能否取代人工翻譯?
    日本一家科技公司Logbar在近日推出了一款能夠隨時隨地即時翻譯的工具,外形有點類似於我們的錄音筆,這個翻譯工具命名為ili。ili可以實現中、日、英三種語言之間的高精度互譯,而翻譯速度僅需要0.2秒。
  • Google 翻譯「即時相機翻譯」功能更新升級
    NO.1 | 語種擴容支持88種語言,可譯成100多種語言「即時相機翻譯」功能新增了60餘種支持語言,包括阿拉伯語、印地語、馬來語、泰語和越南語。88種支持語言的完整名單,請見 這裡 。不僅如此,Google 還為中文用戶帶來了更多驚喜。
  • 全網最新動漫追番神器
    全網最新動漫追番神器 今天給大家分享的是一款動漫追番神器 櫻花動漫 支持Android
  • 追番神器來襲!無限制觀看全網動漫番劇!
    今日資源:櫻花動漫適用系統:iOS/安卓/網頁相信很多喜歡看動漫追番的小主們,B站可以說是必備的了。今天趣哥就給大家分享一款追番神器。基本囊括全網的動漫番劇,無任何限制觀看,支持緩存下載、在線播放、高清畫質,投屏播放。目前只有iOS版和網頁版,Android的用戶可以用之前分享的三款,一樣牛掰:有了這三款神器,暑假還愁啥?進入軟體首頁,會推薦一些比較熱門的動漫番劇,這樣不知道看什麼的小主們可以以此來做一個參考;和一些最新更新的動漫,更新非常的及時,基本和B站同步更新。
  • 翻譯神器,餓死翻譯?
    。  不過今天小編並不是在關注娛樂新聞,其實生活中有很多需要「即時翻譯」的地方,但不同於在電影裡看到中文字幕。假如有一天與老外溝通不再需要學習對方的語言,並且系統能夠直接讓我們看到聽到翻譯後的結果,那將是一件非常愜意的事情。
  • 日均翻譯過萬張,「秒翻」探索自動化漫畫翻譯模式
    作為漫畫迷,王洪祥看到了如今漫畫翻譯存在的問題,決定自己成立公司,做一個提高漫畫翻譯效率的輕量工具。與市面上已有的OCR(圖片文字識別)翻譯工具不同,秒翻瞄準漫畫、海報等圖像文件翻譯的使用場景,在字體、自動排版、識別背景和板塊方面下功夫,並開發出批量翻譯排版的功能。
  • 關於漫畫翻譯,說明一下我的立場
    現在快兩年的時光了,那個女孩曾經答應大家,只要漫畫還未完結,她就會繼續做翻譯工作。那個女孩是我沒錯。然而,隨著漫畫的不斷推送,這部漫畫好像有點出圈了。很多壓根就不認識正泰的人也關注了公眾號只為了追這部漫畫,這讓我很不安,本人創建公眾號的初衷只是圈地自萌。
  • 推薦5款高質量漫畫app,更新還很快
    ✪所有資源都支持緩存,能自由的切換到離線閱讀的方式✪平臺的更新速度很穩定,追番很輕鬆✪系統可以自動屏蔽掉所有的廣告信息推薦指數: ★★★​​​​​②6漫畫app ​應用大小: 5.4M6漫畫app是一款最近在漫畫圈很多人都在推薦的免費漫畫軟體,上面為漫畫迷們囊括了全網最全最新最熱的漫畫資源
  • [首發] 二次元的追番神器 - 布丁動畫 #iOS #Android #AppStory
  • B 站 up 主開源視頻字幕自動翻譯神器!
    ,我想先問大家一個問題,在你在追日番或美劇的時候,是否曾因日語或英語能力不佳,而飽受苦等熟肉視頻發布的痛苦?不久前,一位朋友突然給我分享了一個 B 站視頻,起初我沒怎麼在意,不料當我到了晚上打開一看的時候,心情立刻變得激動萬分,這 TM 的就是我夢寐以求的翻譯神器啊!並且它還是開源的!在稍作整理之後,小 G 打算今天好好跟大家介紹一下。
  • 四款看小說漫畫神器,千萬別錯過了!
    手機技巧 | 軟體應用  | 實用乾貨 | 視頻教程 加星標 不斷電今天趣哥給大家分享四款小說漫畫神器
  • 手機漫畫+拍照翻譯
    咕咕漫畫(安卓&蘋果)以前推送過很多免費影視APP,但很少有免費的漫畫APP,今天就滿足大家!拍照翻譯(安卓)拍照翻譯,您的翻譯利器,支持英日韓拍照翻譯,比較優秀的翻譯利器!主要功能功能1.本APP實現英文拍照翻譯成中文2.本APP實現日文拍照翻譯成中文3.本APP實現韓文拍照翻譯成中文4.新增多國語言互相翻譯,支持多國/地區語言互轉,中文、粵語、文言文、英語、日語、韓語、俄語、德語、法語、泰語界面如下:
  • 28種語言互譯、語音翻譯、掃描翻譯 百度輸入法用AI玩轉翻譯
    選擇識別語種和翻譯語種,再輸入文字,屏幕中便能迅速出現對應語言,實現即時翻譯,讓用戶需要線上跨語言溝通時,可以一鍵翻譯外語資料、發送外語消息,提升工作和學習效率。 (百度輸入法「快捷翻譯」功能)在滿足文本翻譯需求的基礎上,百度輸入法還考慮到如今日益流行的語音輸入習慣,將多模態語音技術結合翻譯技術,打造了語音實時翻譯功能,幫用戶提高翻譯效率。
  • 追番必看!2021新番,我全都想追!
    1000+3、美腿參考合集壓縮包6.7G 領取方式:點亮「在看」截圖後公眾號後臺領取受今年新冠疫情影響的太多了對於很多喜歡追番的小夥伴們來說應該也是充滿災難大家今年宅家一定看了很多番吧?追番不嫌多!馬上看看2021新番我全都想看!