所謂「生肉」,即未經翻譯操作、無字幕的純視頻;相對應的,就是已添加字幕、可直接下載觀看的視頻節目。很多資深影迷常因為影片出爐後無字幕,而無法享受及時的觀影體驗。如果存在一款可以直接翻譯視頻的工具呢?
網易人工智慧旗下的「網易見外」平臺在AI技術加持下,支持一鍵生成雙語字幕。用戶可以瀏覽海外熱門短視頻,通過人工智慧聽寫英文、同步翻譯成中文。也可以自己上傳中/英文短視頻進行翻譯,一般等上3-4分鐘,機器就能把一段20分鐘左右時長的視頻翻譯完成。
2018年伊始,網易見外再一次公示新動作——與人人影視(字幕組)籤訂戰略合作,並與立青映畫(歐洲電影)、迪幻字幕組(迪士尼)、松鼠字幕組(英劇)籤訂深度合作計劃。
網易見外方面人士對雷鋒網表示,四家字幕組將使用網易見外來為視頻翻譯字幕,此舉可達到節省聽寫、翻譯和切軸環節的效果,只需要進行人工校對便可,可以讓劇集字幕更早上線,也可以提高產出、節省人力成本。對於公益性字幕組來講,人力資源方面更為珍貴。
網易見外方面表示,雖然均是與字幕組合作,但與人人影視(字幕組)籤訂合作的不同之處在於,人人影視自己在開發一款名為「人人譯視界」的字幕協作翻譯平臺,將和網易見外進行產品級的合作,見外把AI視頻翻譯的API接口開放給人人譯視界,人人譯視界上的眾包譯者只需要校對完成字幕,不需要重新翻譯,而校對好的字幕回傳給網易見外,進一步提升人工智慧的精確性。
技術支撐與差異化競爭點據雷鋒網(公眾號:雷鋒網)了解,技術方面,網易見外主要由三大核心技術支撐:
1.NMT神經網絡機器翻譯;
2.智能語音識別轉寫文字;
3.自動解析語音並即時切分時間軸
通過視頻聽翻功能,等待翻譯完成便可獲得精準切分時間軸的雙語字幕,其主要應用場景包括電視臺、視頻網站、字幕組等機構為視頻添加字幕或翻譯。
另一項功能為直播聽翻,即在上方區域可實時獲得經過智能斷句的中文文字內容,下方區域可實時獲得對應的英文翻譯內容。應用場景包括同聲傳譯、直播字幕、會議速記等。
網易機器視頻翻譯負責人Robin 對雷鋒網表示,網易見外是國內首個集成語音識別、機器翻譯、智能斷句、字幕生成全維度功能並同時滿足直播和錄播視頻翻譯場景的產品,具備顯著的差異化競爭優勢。
具體包括:
功能差異:產品接口提供語音聽寫、自動切軸、視頻翻譯校對等全流程服務,能快速滿足視頻行業相關客戶的翻譯需求;
服務差異:提供視頻聽翻全套API定製接口,能夠快速接入並實現功能;
語種差異:專注於中英翻譯,在中文識別和中譯英領域,準確度優於競品。
實際上,據雷鋒網了解,國內外已有不少廠商深入挖掘視頻翻譯技術,包括微軟Skype Translator、Google Word Lens、中譯語通的字幕通等。對此,Robin對雷鋒網表示,友商有的是針對單詞打時間戳,有的只能一段段識別、無法切分或斷句,而網易見外可以針對視頻、在一分鐘內切分出幾句話,「是首個針對視頻產品做出差異化和優化的公司。」Robin表示。
進化與布局據雷鋒網了解,作為網易人工智慧旗下神經網絡機器翻譯產品,網易見外在匯集海外資訊的基礎上,實現視頻的高精度語音識別與即時翻譯功能,能夠一鍵生成雙語字幕,並自動壓制在視頻中。
而其視頻翻譯功能,主要體現在上傳視頻之後,通過AI自動完成字幕聽寫、翻譯和時間軸切分等最耗時的環節,可以在平臺上進行人工校對後,自動把字幕壓制在視頻裡,便於批量製作字幕,降低人力成本,提高產出效率。
商業模式上,該產品負責人對雷鋒網稱,網易見外會結合語音識別 、切軸等一系列技術,提供視頻即時翻譯服務,也可以同步添加字幕,應用到電視臺採訪、電影字幕、智能錄音筆功能。未來也會針對聽力障礙人群,提供視頻字幕服務等。
據了解,網易見外產品於2017年5月份開始規劃,基於當時人工智慧正處於最火熱元年的大背景。
但實際上,早在2011年,網易即成立感知與智能中心部門,系網易人工智慧事業部前身,主要為網易提供人工智慧技術方面的支撐,包括提供給有道的翻譯技術、提供給例如大話西遊等遊戲部門的語音識別技術、提供給雲音樂部門的AR技術等。
網易人工智慧事業部從去年獨立為網易一級事業部後,從純粹技術支持的公共基礎支撐定位,轉變為業務部門。
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。