YouTube玩轉的自動字幕,為什麼被國內視頻網站「主動錯過」?

2021-01-07 鈦媒體APP

圖片來源@視覺中國

文 | 腦極體

成為中國YouTube,這估計是每一家國內視頻網站都曾經設想過的目標。

現在,無論是從全球市場規模、還是從營收規模上來說,YouTube都已經是一個龐然大物。而在國內,至今已難以找到一家能夠與YouTube實力相當,甚至說模式相似的視頻網站了。

差異是如何產生的,已經成為一個可以寫成商業專著的選題了。而這一次我們則關心一個更為細節的產品技術問題,那就是在YouTube上早已實現的自動字幕功能,為何沒有在國內的主流的視頻網站上出現?

據報導,在2017年初,以UGC起家的YouTube已經為10億條視頻提供了自動添加字幕的服務,使用者每天的播放次數超過 1500 萬次,而且目前已支持全球10種語言的自動字幕加載,以及支持包括簡體中文在內的上百種語言的機器翻譯。

那麼這一自動字幕的功能為何沒有被我們國內的視頻網站「Copy」?

也許你第一反應會想到技術原因。也是也不全是。畢竟近幾年,我國在自動語言識別上面的技術早已成熟,在視頻網站上應用也許早已不成問題。

「是不為也,非不能也。」如果孟老夫子在世,可能還會說出這句話來。但原因究竟是啥,恐怕還是要繼續追問下去,而最終我們其實還是想對這些國內視頻網站的新老玩家們提問下:

這麼「香」的技術,到底要不要學習一下呢?

自動字幕:從Goodness到Business

YouTube的自動字幕功能是在2009年由谷歌的工程師們開發的,那時離谷歌收購YouTube已經過去三年了。

這一功能的初衷是,通過將視頻聲音轉化成文字字幕,為全世界有聽力障礙的用戶提供便利。而開發這一功能的軟體工程師肯·海倫斯坦也正是一位聾啞人士。

眾所周知,YouTube是從用戶UGC視頻內容起家的,目前仍然是全球最大的UGC視頻網站。當前月用戶訪問數可以達到18億,用戶每分鐘上傳視頻時長達到400小時,並且時長還在增長。

這同時意味著,有大量上傳的UGC視頻中是沒有主動添加字幕的。這對於正常聽力的用戶來說,並沒有什麼影響,而對於有聽力障礙的人來說,則相當於缺少了極其重要的音頻信息。

而自動字幕的加入,則在一定程度上幫助了聽障用戶獲取更多的信息渠道。

目前,谷歌和YouTube團隊正在利用機器學習為自動字幕增加音效信息,從而更大程度地豐富音頻內容的表達。通過添加如鈴聲、狗叫聲、敲門聲等音效字幕,也正是出於改善聾啞或聽障人士的觀看體驗而進行的技術改進。

這樣一項出於社會責任感和用戶公平體驗的技術,也帶來了額外的市場推廣價值。

隨著自動字幕可以識別的語種的增加,以及自動翻譯功能的加入,這一項技術成為一項全球用戶都可以受益的功能。比如,大量優質的英語原聲知識分享視頻可以通過自動添加英語字幕,再轉為其他語種,供非英語區的用戶觀看學習。這顯然對YouTube的全球化推廣產生了積極的推動作用。

在每天上千萬次的自動字幕的使用中,語音識別難免會出現一定錯誤,但隨著YouTube社區用戶對這些自動字幕信息進行評論和編輯後,這些信息又會再進入機器學習的流程,從而幫助自動字幕系統更好地提高準確率。同時,自動字幕及機器翻譯準確度的提升,又推動內容推薦的精準度的提升,進一步增加用戶粘性和使用時長。

一項幫助提升用戶體驗的AI技術,又在用戶的海量數據的幫助下變得更加強大,很好地印證了「科技向善」可以帶來更多意想不到的好處。

當然,這裡有一點比較遺憾的地方是,如果你有機會使用YouTube的中文簡體的自動翻譯功能的時候,你可能並不好理解翻譯出來的中文到底在表達什麼意思?

一來,可能視頻中中文口語化的音頻內容確實不好翻譯;二來,由於你懂得的原因,這個自動翻譯的數據模型並沒有得到有效的訓練。

那麼,自動字幕如此得天獨厚的市場空白、如此巨大的應用規模,以及如此現成的技術條件,為什麼沒有國內的視頻網站主動去使用呢?

為什麼國內視頻網站們「主動」錯過這一技術?

想要回答幾大國內視頻網站「為啥沒有採用自動字幕」這一小問題前,需要先回答「他們為啥沒有繼續發展UGC的內容模式,而是轉向了影視劇版權購買的模式」?

十年多前的中國還不是一塊UGC的沃土,相比較於美國家庭掀起的家庭錄像及生活視頻的製作消費的浪潮,當時的國人對於優秀影視作品的需求更為強烈。UGC內容並沒有實現更好的商業變現方式,堅持以UGC為定位「土豆網」成了早早出局的元老級玩家。

而影視劇作品是不缺少優質的人工字幕翻譯的。在國家嚴格把控版權問題之前,在這些視頻網站上,大量的海外電視劇電影被以「用戶上傳」的名義免費播放。同時,提供國外影視劇翻譯的字幕組的出現,也讓視頻網站們可以以極低的成本獲得優質、準確的字幕。

2010年之後,隨著愛奇藝、騰訊視頻的出現,優酷土豆合併後又被阿里收購為標誌的BAT巨頭入場,視頻網站們徹底進入了以PGC影視劇內容生態為主的「版權」燒錢爭奪戰。這時的巨頭們已經開始嚮往Netflix的自製會員付費模式了。

UGC內容當中的字幕添加問題,從商業價值上也就再也沒有進入這些網站的決策範圍了。

再者,中國自身市場的數億的用戶紅利,使得當時的視頻網站們在爭奪存量市場都有些自顧不暇,自然也沒有動過「出海」的念頭。沒有出海需求,也就沒有海外用戶。而統一的中文語言環境並不需要對中文音頻進行多語種的翻譯。即使隨著機器學習、自然語言處理技術的出現,也沒有視頻大廠們想要費力去應用。

對於長期處在燒錢虧損狀態的玩家們,照顧聽障者等弱勢人群的觀看體驗,看來也沒有進入到他們的產品目標當中。畢竟主流的影視劇視頻資源和PCG內容資源都已經使用了人工添加的字幕。邊緣化的UGC內容和特殊的少數用戶群,似乎並不需要投入過多精力。

從以上種種的原因看來,動力不足,正是這些視頻大廠們不願玩轉「自動字幕」的最好解釋。而無所作為並不代表他們未來也不需要這項技術。

在當前人口紅利消失、用戶增加趨緩的情況下,出海成為近兩年來幾大視頻網站玩家們的集體行動。除了將國內優秀的影視劇內容對外輸出外,吸引海外用戶製作分享大量的優質UGC內容,成為產品海外市場本地化發展的必由之路。

而從YouTube的啟示來看,增加這一自動字幕以及自動語言翻譯功能,將會對UGC內容生態帶來非常積極的正面作用。

十年來,狂飆突進中落下的功課,是不是該補一補了?

破解出海困境,自動字幕可助一臂之力

當前,以海外版抖音TikTok為代表的短視頻應用出海方興未艾,而國內以騰訊、愛奇藝為代表的長視頻網站巨頭也已經開啟出海模式。當前,主要扎堆進入東南亞市場。

TikTok這類更具興趣屬性和娛樂表演屬性的短視頻應用,沉浸式的算法推薦也同樣在海外取得了極大的成功;帶版權的背景音樂、炸裂特效和簡單方便的字幕特效和傻瓜式的剪輯手法,使得海外年輕人們的接受和製作門檻更低。TikTok很快在日韓、美國以及東南亞等國家快速流行起來。

相比之下,依靠精品內容出海的視頻網站則顯得進展緩慢,需要步步為營,穩紮穩打。

我國視頻網站的出海時間不長,但已經經歷了三個階段。先是經歷了海外優質內容的引入;然後再複製這一模式加強自身版權內容的對外輸出。而在去年,則開始主導搭建海外的自有媒體平臺,並開始與海外各個國家的主流媒體、運營商等達成長期戰略合作。

華語內容的輸出成為本次出海的重點,但是想要在海外市場真正取得成功,那必然還是要吸引本地化的視頻內容。據調查,海外視頻用戶更會為帶有本地文化印記和本土語言的視頻內容進行付費。因此,鼓勵海外本地的UGC內容的製作和分享,培養和建成規模化和規範化的本地內容生態,才能最終留存住本地化用戶,形成長期使用習慣。

除了進行一定的原創內容補貼,或者參照YouTube的廣告分成模式外,降低UGC製作的使用門檻,提升海外用戶的觀影體驗,也是更為根本的解決方案。

這時候,基於語音識別和機器翻譯的能力,增加自動字幕以及自動翻譯的功能,可以更好地幫助製作者完成字幕的添加工作,同時幫助大量用戶快速翻譯其他國家的視頻內容。

一、通過加入對視頻內容的自動字幕的加入,可以吸引海外用戶更願意主動創作本土內容,增進海外用戶對本土內容的觀看和消費。

二、通過引入多語種之間的字幕翻譯,來提升和優化海外用戶的內容推薦體系,從而形成豐富的海外生態,從而提高視頻內容的國際化推廣的力度。

當然,自動字幕和自動翻譯功能的實現還受到語料資料的限制,國內的視頻網站們除了自身所熟悉的中文視頻外,還要對東南亞各國的音視頻的語音進行大量地採集和訓練。

出海難題無數條,起碼這一技術可以作為在出海中打拼的「騰愛們」必須要補上的一門基礎課,而視頻內容的本地化UGC可以成為下一輪出海重點發力的新嘗試。

欲戴王冠,必承其重。眾所周知,YouTube在全球獲得的巨大流量,來自於YouTube的強大的技術能力、廣告營銷體系以及谷歌的軟硬體支持……從今天YouTube的成功去倒推原因,我們會列出一串長長的清單。在這份清單的一行裡,我們注意到了出於社會責任而添加的一項小小的功能,而這一功能卻帶來每天上千萬人的使用。

對於國內的視頻網站來說,這確實是值得學習的一個經驗。即使一開始並沒有特別緊要的應用場景,也沒有明顯的商業利益,但是可以通過技術,特別是AI技術,來大規模地、以無限降低邊際成本的方式,來改善用戶體驗,那一定是值得去嘗試的。

而現在,國內視頻網站、短視頻已經處在揚帆出海的風口,語音識別以及機器翻譯的技術也現成可用,而全球文化多元化交流的需求也正在井噴。出海的這些玩家們想要抓住這場新的全球UGC內容爆發的紅利,自動字幕技術大有可為。

相關焦點

  • 陳佼:國內仿youtube視頻網站首頁分析
    不知道國內門戶是否有類似的部門(據我所知,多數網站的這一工作,被用戶體驗部門和應用平臺技術部門包辦了),但我想這項工作對任何商業站點都有非常重要的意義。恰好最近網易和奇虎已經完成首頁及各頻道的改版,而新浪和搜狐也正在對頁面進行調整,不知道它們又是憑什麼做「Face-Lift」的。  言歸正傳,本文重點是分析國內仿youtube視頻網站首頁的設計。
  • YouTube:自動字幕將推廣到更多語言的視頻
    北京時間7月21日消息,據國外媒體報導,在日文版YouTube推出自動字幕之後,YouTube方面日前透露,日文只是第一步,YouTube計劃未來在更多語言的視頻中推出自動字幕,這將惠及包括漢語使用者在內的全球網民。
  • 有沒有可能讓外語字幕自動翻譯成為中文?自動翻譯視頻字幕的功能...
    很多朋友都會看外語視頻,無論是大電影還是小製作,看外語視頻的障礙在於字幕。然而,很多片子只能找到外語字幕,這就很頭疼了。而隨著AI的進步,自動翻譯的效果越來越好,有沒有可能讓外語字幕自動翻譯成為中文?還真別說,就有廠商推出了以翻譯為賣點的產品。
  • 怎樣自動翻譯英文視頻並添加字幕?
    最近需要學習一些英文的視頻教程,但是由於這些視頻文件全英文沒有字幕,學習起來很吃力,於是找了幾個能夠自動翻譯英文視頻並添加字幕的方法,小編經過多方驗證,發現4個免費且翻譯質量比較不錯的方法1、上傳到Youtube自動翻譯經常看Youtube的人都知道,Youtube上幾乎所有的視頻都有翻譯字幕,這是Youtube會使用AI自動為用戶上傳的視頻添加字幕
  • 高壓「淨網」|字幕組|視頻網站_網易財經
    在成為淨網行動的打擊對象之前,迅雷雲播選擇主動自我「淨化」。而自查的成果清晰地體現於林中的帳號上。這位27歲的婚禮視頻剪輯師是迅雷超過400萬付費會員中的一位。僅一年光景,他就在迅雷的雲播空間上積攢了容量超過10T的視頻,其中過半是「愛情動作大片」。「男生看這些再正常不過了。」
  • 視頻語音自動生成字幕怎麼做?分享一個視頻字幕生成器—繪影字幕
    很多人都對語音轉文字有所了解,其實視頻加字幕和語音轉文字,前期使用的技術手段是一樣的。都是通過機器對人聲進行識別,轉成文字。不過,生成字幕還需要對字幕切分和給字幕添加時間戳。所以視頻加字幕會在語音轉成文字的基礎上,機器精準切分時間軸,給文字加上時間戳生成字幕。
  • 國內熱門字幕網站關閉 「免費追劇」時代或終結
    海外影視劇迷們,不管字幕網站曾經給你帶來多少難忘的回憶,眼下的這個消息您必須接受,國內兩個最熱字幕網站陸續關閉或暫時關閉。  人人影視22日暫時關站,發布公告稱正在清理內容,「感謝大家的厚愛和支持」。隨後,以電影中文字幕為主的主題資訊交換平臺射手網也關閉了,並發布公告稱,「需要射手網的時代已經走開了。」  這意味著什麼?字幕組時代會不會就此終結?
  • 剪映app在哪怎麼添加字幕 自動識別視頻中語音轉為字幕教程
    現在不少人都喜歡拍視頻剪輯vlog,而剪映就是一款非常實用的視頻剪輯工具。功能非常齊全,能滿足大家的需求。而當你使用剪映app時,該怎麼添加字幕呢?看看下文。  剪映APP添加字幕的方法  1、其實給視頻添加字幕的方法並不算複雜,而且「剪映」APP還為大家提供了自動識別字幕的功能,可以將視頻中的語音自動識別製作為字幕。
  • 國內主流視頻網站為什麼不像YouTube一樣「5秒後可以跳過廣告」?
    同為視頻網站,YouTube在視頻廣告模式上選擇的是TrueView廣告,即五秒後可以跳過;而國內主流視頻網站則大為不同,那麼它們為什麼會存在這種差異呢?背後又有哪些產品知識呢?圖片來源:知乎截圖那為什麼YouTube會這麼做呢?國內視頻網站與之做法相悖呢?先上結論:大家的視頻廣告模式會不一致的根本原因在於利益驅動,大家分別選了視頻平臺利潤最大化的廣告形式。
  • 教程:如何給沒有字幕的視頻添加字幕
    我們常常會下載到沒有字幕的視頻,請不要一臉沮喪的fuxx別無話說,這時我們可以自己手動添加字幕,江湖人稱:外掛字幕。字幕網首選我們需要去字幕網站下載字幕如:字幕庫:http://www.zimuku.cn/Sub HD 字幕站:http://subhd.com/字幕組:http://www.zimuzu.tv/射手網(偽):http://assrt.net/(直接搜索你想要的字幕)電腦添加字幕
  • 還在羨慕YouTube?國內視頻網站早已超過
    中美環境迥異導致發展路徑不同從發展背景來看,兩國的在視頻網站出現之前,有線電視的發展狀況就已各不相同,這也直接導致了用戶習慣和未來視頻公司行業地位的不同。在美國,早於視頻網站,有線電視就奠定了不可動搖的江湖地位,它們有著成熟的內容,成熟的商業模式,觀眾們也習慣於支付收視費用收看電視節目。
  • 玩轉高清視頻!5款最常用的HDTV播放器
    玩轉高清視頻!並且BD/HD-DVD視頻在網絡上開始大規模泛濫也促進了HDTV的普及。    隨著高清視頻逐漸流行起來,網絡上也出現了一個又一個有著功能非常強大的HDTV視頻播放器,並且競爭也越來越大。今天,筆者主要給大家推薦幾款常用的高清視頻播放器,如果你還在為找一款播放HDTV的播放器而苦惱的話,相信在本文中一定能找到你想要的。
  • 史上最強音視頻下載神器youtube-dl回歸,GitHub75k星
    2006發布,一開始只能從YouTube下載視頻和音頻,後來經過創作人員的不斷完善,下載支持的站點達到了1000多個,成為最受歡迎的下載神器。△ 支持下載的網站列表從國外的YouTube、BBC、CBS、Twitter、Facebook上的音視頻下載,再到國內的愛奇藝
  • 無須特殊姿勢,國內可以直接看的Youtube
    圖片來源網絡,侵刪記得將老王添加成星標老司機開車,千萬不要錯過喲❤各位新老司機朋友晚上好,我是隔壁老王!Youtube也稱油管,想必大家都聽說過,它是谷歌旗下的視頻網站,也是全球最大的視頻分享平臺。由於某些特殊的原因,在國內是訪問不了的。
  • 為什麼中國觀眾愛「原聲加字幕」|大象公會
    21世紀的第一個十年裡,各類影視下載網站逐漸發展至鼎盛,包括BT搜尋引擎、資源發布網站、論壇以及字幕分享網站。終於與世界接軌的國內影迷,開始自行翻譯字幕,改善同好的看片體驗。 2005年左右陸續成立的各家字幕組,更是把零敲碎打的「同人漢化」提升到了集團化作業,其翻譯效率足以跟上國外電視臺每周更新劇集的進度,中國觀眾從此不必「落伍」。
  • 為什麼國外視頻網紅爭著要進中國市場?
    為什麼國外視頻網紅爭著要進中國市場? 發布時間:2017-07-17 07:19:51.0科技訊       (原標題:為什麼國外視頻網紅爭著進入中國?)      除了這種由國外專業管理團隊Yola負責包裝、運營的之外,近兩年來,類似Slivkishow這樣的Youtube個人博主也紛紛選擇進入國內的社交網絡,其中包括微博,頭條等平臺。為什麼Youtuber這麼重視國內市場呢?
  • GitHub CEO霸氣回應:把youtube-dl還給開發者!
    【新智元導讀】視頻下載神器youtube-dl上個月被指控違反了DMCA《千年數字版權法》,遭到GitHub官方的下架,但是11月16日,GitHub CEO宣布已經成功恢復!更神奇的是,該項目最近逆勢漲星數千,難道也是套路?前一陣子,開源視頻下載神器youtube-dl遭下架,惹了眾怒。
  • YouTube為Billie Eilish的壞傢伙製作了基於AI的無限視頻循環
    因此,現在,YouTube已將所有這些封面視頻放到一起,以創建一個基於AI的交互式交互式實驗網站,這非常了不起。這個機器學習(ML)的網站被稱為「無限壞傢伙」,其創建目的是慶祝所說歌曲的官方音樂視頻的10億觀看裡程碑。
  • YouTube上有哪些值得推薦的頻道?(知乎熱門回答集錦)
    為什麼說YouTube是神器YouTube有超過十億用戶,每天觀看上億小時的視頻;每分鐘有300小時的視頻被上傳到YouTube。只要你想得到的,YouTube上基本就有;你想不到的,YouTube上更多。YouTube就是更大的世界,就是真實的虛擬實境。
  • 用prcs6給視頻加字幕
    給視頻加字幕,類似的MV音樂視頻、微電影等,在prcs6中可以很快速方便的為視頻加上自己想要的字幕,包括字幕的字體、顏色、方位、特效等。首先要有一臺win7電腦,性能配置高的,其次安裝prcs6專業剪輯軟體,最後準備視頻素材。