Youtube自動字幕已識別環境音 國內還在靠字幕組

2021-01-11 網易科技

2017-03-27 09:09:52 來源: 雷鋒網

舉報

本文作者:叨叨

在國內,下載好電影後,再去字幕網站搜索外掛字幕,已經是影迷們的固有動作。這種習慣的養成,歸功於近10年來逐漸形成的野生網絡字幕組,用業餘時間為影迷們貢獻了大量、快速的免費字幕。

相比國內的野生字幕組,谷歌的技術宅們在2009年為Youtube上線了一個自動字幕系統(Automatic Captioning System),藉助人工智慧技術,在視頻裡實時生成字幕。時隔7年後,YouTube宣布已經有10億多條視頻採用了該系統生成的字幕,而全球日活躍用戶也達1500萬。

在Google給定的視頻中,可以在設置中選擇開啟自動字幕,之後視頻下方會隨著視頻中的人聲,逐個顯示對應字幕。另外,在字幕開啟菜單中,也有「自動翻譯」的選項,包括中文繁體、簡體在內的上百種語言均可翻譯。

此外,雷鋒網(公眾號:雷鋒網)3月23日還報導過,由Accessibility、Sound Understanding和YouTube三個團隊共同完成了,通過深度神經網絡(DNN)模型,在自動字幕增加音效信息的技術,進一步提升了觀眾的「看片」體驗。

其中,Google Accessibility團隊致力於讓每個人都能夠享用網際網路帶來的便利,尤其是殘障人士,他們主要負責監控Google產品的無障礙狀況,協調開展無障礙培訓、測試並提供諮詢服務。Accessibility產品團隊需要接受相關培訓,以在產品的設計和發布過程中體現無障礙原則。此外他們還努力與各類用戶和致力於推廣無障礙功能的團體建立密切的關係,以便徵求反饋意見。

而Youtube的自動字幕系統,在很大程度上實現了視頻觀看的「無障礙」,尤其是聽不到聲音的聾人,也能通過自動生成的字幕進行高質量的視頻信息獲取。

Google Sound Understanding團隊,此前曾負責AudioSet數據集,致力於教學機器,通過建立狀態機器學習模型,生成大規模的音頻事件數據集,並定義聲音之間存在的層次關係,來準確地感知音頻。

目前,國內主流視頻網站均未推出過自動字幕系統,不過在坊間流傳著一個能夠自動生成字幕的軟體——Autosub,最初該軟體只幫助字幕組成員自動對軸,後來的更新版本調用了谷歌的API,支持自動生成字幕,不過效果不佳,此後鮮有更新。

雷鋒網還了解到,2011年《電子學報》的一篇論文稱,以《新聞聯播》為語料進行訓練,實現了音頻提取、音頻分類與切分、說話人識別、大詞彙量連續語音識別、視頻文件播放、文本字幕自動生成等功能,從而實現「全自動中文新聞字幕生成」。但此論文中並未提及是否可以做到「實時」。

這項技術的難點在於,一方面一條視頻中的聲音有很多,包括對白和混合在一起非常複雜的環境聲,要辨別哪個聲音是我們想要的,並把幾個同時產生的聲音區分開來相當不易;另一方面視頻實時字幕生成,需要在極短的時間內做出反饋,對於計算速度考驗巨大。

針對分辨聲音而言,搜狗CEO王小川就表示過,目前語音識別已經有了較高的準確度,接近實用,但還有很多的限制。比如需要安靜的環境,當有噪音的時候同時有兩個人說話機器就搞不定了。搜狗的做法是預先錄製,比如在汽車環境裡面,預先錄製發動機引擎的聲音,把沒有見過的環境變成機器能夠見過的環境,就能夠做識別。針對計算速度而言,則需要依靠硬體和算法的進步。

現在能實現的程度,需要歸功於過去幾年間,DNN技術、Residual/Highway 網絡技術和粗粒度建模單元技術的進展。但環境音非常複雜,想要把所有的獨立聲音預先錄下來,是一項巨大的工程。即便是谷歌自動字幕系統的研究人員們,也只是選取了「鼓掌、音樂、笑聲」三種語義清楚的背景聲。

視頻之外,在語音轉文字這項技術上,國內外企業多有涉及。比如微軟幫助聾人通話實時將語音轉換為文字的RogerVoice,比如百度新近推出的SwiftScribe、再如國內企業科大訊飛等,還有各類錄音、速記應用程式,都能夠不同程度的支持語音轉文字的技術。一般來說環境越安靜,識別的準確率越高。

科大訊飛相關人士向雷鋒網表示,視頻字幕需求分為兩類,一類為已錄製視頻的字幕配置,另一類為直播視頻的字幕配置,科大訊飛的識別技術均可實現上述兩類字幕需求。

目前訊飛開放平臺已對外提供第一種已錄製視頻字幕配置需求的"語音轉寫"產品,準確率可達95%,而對於第二種直播視頻的字幕配置產品將在今年年中對外提供。

本文來源:雷鋒網 責任編輯: 郭浩_NT5629

相關焦點

  • Youtube自動字幕系統已能識別環境音,但國內還在依靠字幕組
    這種習慣的養成,歸功於近10年來逐漸形成的野生網絡字幕組,用業餘時間為影迷們貢獻了大量、快速的免費字幕。相比國內的野生字幕組,谷歌的技術宅們在2009年為Youtube上線了一個自動字幕系統(Automatic Captioning System),藉助人工智慧技術,在視頻裡實時生成字幕。
  • 字幕組可解散YouTube自動字幕可識別場景
    無論美劇、英劇、日本動漫還是國外遊戲,我們都需要感謝字幕組,讓我們可以在外語水平不足的情況下看懂國外的作品。可是在谷歌不停的為YouTube引入強大的自動字母功能後,字幕組可能要下崗了。在最新的升級後,這套系統以及可以識別出場景音效了。
  • 這家「不存在的視頻網站」已能生成自動字幕
    雖然一個射手倒下了,千千萬萬個字幕組依舊還在,可當Youtube自動字幕已能識別環境音的時候,純粹靠興趣愛好聚集在一起的字幕組還有存在的必要嗎?強大的Youtube自動字幕過去幾年,Google已不停地YouTube引入了相當強大的自動字幕功能。而在最新升級之後,這套系統甚至能夠識別出場景音效了!Sourish Chaudhuri在一篇博客中寫到:「儘管語音是用來溝通的最熟悉方式,但環境音效也是人們感知這個世界不可或缺的一環。
  • YouTube玩轉的自動字幕,為什麼被國內視頻網站「主動錯過」?
    那麼這一自動字幕的功能為何沒有被我們國內的視頻網站「Copy」?也許你第一反應會想到技術原因。也是也不全是。畢竟近幾年,我國在自動語言識別上面的技術早已成熟,在視頻網站上應用也許早已不成問題。「是不為也,非不能也。」如果孟老夫子在世,可能還會說出這句話來。
  • YouTube發展自動字幕,聽障人士受惠,為何國內視頻網站不感冒?
    YouTube作為世界最大的視頻網站,一直以來都被模仿和學習,至於商業模式和很多設置上面的特別性,我們今天在這裡就不展開來談論,我們今天主要要來聊的就是YouTube網站上面的自動字幕,這個國內視頻網站不感興趣的實用性功能。
  • 怎麼下載YouTube視頻中自動生成/翻譯的字幕
    字幕有利於我們更好地理解視頻的內容!作為國外最大的視頻網站,YouTube有個非常強大的功能就是可以通過語音識別技術自動為視頻生成字幕,用戶還可以根據自己的需求將字幕翻譯成中文、英文、 法語、德語、日語、韓語、西班牙語等不同的語言,觀看起來非常方便!
  • 谷歌推出YouTube字幕自動生成功能(圖)
    YouTube字幕自動生成功能界面  新浪科技訊 北京時間3月5日上午消息,據國外媒體報導,谷歌周四發布了一項新功能,可以為YouTube視頻自動生成字幕。  谷歌去年11月便面向部分視頻推出了字幕自動生成功能。
  • 視頻智能提取字幕工具:單文件版!支持雙語字幕識別、自動翻譯、導出歌詞格式
    本期神器妹分享一款視頻智能提取字幕工具,綠色單文件版,免安裝、免註冊、免登陸,直接打開exe程序就可以使用,支撐雙語字幕智能識別、自動翻譯,還可以導出歌詞格式
  • 業界| 谷歌為YouTube添加新功能:利用機器學習自動生成音效字幕
    自 2009 年以來,YouTube 就開始為視頻提供自動生成的字幕了,而這主要是專注於語音轉錄以使 YouTube 上託管的內容能觸及到更多人。但是,沒有對視頻中背景聲音的類似轉錄,視頻中的很多信息和效果都無法單獨使用語音轉錄獲取。為了解決這個問題,我們宣布為 YouTube 視頻中的自動字幕增加音效信息,從而讓人們能更大程度地獲取豐富的音頻內容。
  • 業界 | 谷歌為YouTube添加新功能:利用機器學習自動生成音效字幕
    自 2009 年以來,YouTube 就開始為視頻提供自動生成的字幕了,而這主要是專注於語音轉錄以使 YouTube 上託管的內容能觸及到更多人。但是,沒有對視頻中背景聲音的類似轉錄,視頻中的很多信息和效果都無法單獨使用語音轉錄獲取。為了解決這個問題,我們宣布為 YouTube 視頻中的自動字幕增加音效信息,從而讓人們能更大程度地獲取豐富的音頻內容。
  • Pr如何快速添加字幕?用繪影字幕自動識別,批量高效製作
    通常我們使用Pr製作字幕時,不論製作內嵌字幕還是外掛字幕,都需要一句一句去打。但是這種方式有很大的弊端:1.打字幕的時候非常慢,很耗時間。2.還需要對齊時間軸,非常麻煩。很多人都在尋找如何快速加字幕,所以今天就跟大家介紹Pr快速加字幕的方法。使用自動識別語音轉換成文字,自動打軸,直接生成字幕,製作非常簡單高效。
  • 免費輕鬆讓你的短視頻自動識別語音生成字幕
    而且各大短視頻或vlog平臺也明確的要求視頻中最好添加字幕,提高視頻的專業性,將獲得平臺系統更多的推薦,以得到更高的播放率,同時提高申請原創標籤時的通過率。曾看到過Facebook報導稱,根據其大數據統計分析,在視頻中添加字幕,可為視頻增加12%的播放量,由此可見添加字幕的重要性,而且它自己也上線了自動字幕功能。
  • 我們欠哪些國內字幕組一聲感謝?
    但在國內大家往往只關注字幕,不怎麼了解製作字幕背後的那些人。所以喵君今天就想跟大家介紹一些在國內影響力較大的字幕組(Fansub group),也算是對那些辛勤耕耘的筆譯和聽譯者的一次致敬。Ps.記得以後下片就認準他們喔~
  • 聊聊字幕組(一)
    LL在字幕組群裡曾請大傢伙低調行事,不然他會被抓,沒想到一語成讖。LL在我的記憶中是個瘦弱的男人,發言永遠有錯別字,做字幕組認識了現在的老婆,可以說字幕組改變了他的人生吧。由於不熟悉他人,不予評價。我與字幕組之緣  大二那年在偶然的機會下看到了字幕組招工啟事,經過兩輪的試譯考核進入了美劇翻譯組,從此一發不可收拾,最多的一天做了3個0day劇(後文會詳細解釋什麼是0day),沒有報酬,完全是「用愛發電」,結識了一群好玩的小夥伴,至今還在微博上熱聊。
  • 超全超有用:youtube、英語電影的字幕閱讀和查詞技巧(附超實用「遮字幕」軟體+5個字幕網站)
    我很欣賞北外李晨老師的一句話:「學英語、教英語,不上youtube,就失去了整個世界」。下面介紹youtube視頻字幕閱讀查詞的吊炸天的幾個技巧:(1)搜索有字幕視頻一定要觀看有字幕的youtube視頻。若沒字幕,看了也不能閱讀查詞,就失去了意義。
  • 人人「復活」,但字幕組的黃金時代已成過往?
    而到了2006年,美劇《越獄》的熱播,讓國內出現了無數劇迷在藉助字幕組追劇的熱潮,也正式讓字幕組進入了主流視野。這一現象在當時吸引到了《紐約時報》的注意,在一篇《打破文化屏蔽的中國字幕組》的報導中,記者採訪了國內風軟字幕組的組長「泰的」,並毫不吝嗇的稱字幕組的作品很可能被當作學術研究,「因為它們既不收費,也不以盈利為目的」,在國內引起了一陣轟動。
  • 字幕組:浮沉與轉身
    相比網友的「高調」反應,現役字幕組成員則顯得尤為「低調」,甚至「謹小慎微」。  射手網創始人沈晟至今沒有回應採訪邀約,其他字幕組的相關負責人也表示「現在是風口浪尖,接受採訪會不會成為下一個射手?」並透露字幕組內部有些「人心惶惶」。
  • 「公益」字幕組的生與困
    今年年初,日劇《將戀愛進行到底》和韓劇《梨泰院class》火上了國內微博熱搜。這樣的「外劇狂歡」並非起於一時,2019年,日劇《輪到你了》與美劇《致命女人》播出期間同樣雄霸熱搜榜,受到了眾多網友的關注並引發無數話題討論。這些電視劇並未公開出現在國內某電視臺的排片當中,也沒有被主流視頻網站引入,僅靠字幕組的搬運,它們便引發了兩撥追劇熱潮。
  • 人人「復活」,但字幕組的黃金時代已成過往?
    而到了 2006 年,美劇《越獄》的熱播,讓國內出現了無數劇迷在藉助字幕組追劇的熱潮,也正式讓字幕組進入了主流視野。這一現象在當時吸引到了《紐約時報》的注意,在一篇《打破文化屏蔽的中國字幕組》的報導中,記者採訪了國內風軟字幕組的組長「泰的」,並毫不吝嗇的稱字幕組的作品很可能被當作學術研究,「因為它們既不收費,也不以盈利為目的」,在國內引起了一陣轟動。
  • 人人影視字幕組「涼了」,野生字幕組時代終結?
    但如果字幕組未經授權翻譯國外的影視作品在國內網絡上傳播,毫無疑問這種行為是侵犯他人版權的行為。也有網友認為「哭錯人」了,「人人影視(字幕組)內嵌廣告太多意圖牟利,對業內風氣影響不好,被查並不冤枉。」字幕組成員是如何看待自己的工作身份的?「實際上,絕大多數的字幕組都沒有收入,只是單純憑藉興趣愛好『用愛發電』。」2月4日,字幕組知情人士這樣告訴新京報貝殼財經記者,「我們都知道字幕組的工作處於『灰色地帶』,存在風險。」