騰訊多媒體實驗室劉杉:萬物皆媒的5G時代,多媒體打開新場景

2020-12-23 IT168

  12月19至20日,由騰訊主辦的2020 TECHO PARK開發者大會在北京時尚設計廣場舉辦。在大會主論壇上,騰訊傑出科學家、多媒體實驗室負責人劉杉帶來了主題為《從視頻編解碼到互動沉浸式媒體》的演講,重點分析了視頻編解碼技術的演進迭代以及騰訊在新媒體及互動沉浸式媒體方向所進行的探索和嘗試。

  劉杉表示,世界性的疫情讓很多領域的活動從線下轉為線上,而如何在保持高質量服務的同時降低網絡數據帶寬的壓力,向多媒體技術提出更高要求。騰訊作為一家網際網路科技公司,旗下的很多業務和多媒體技術密切相關,因此視頻編解碼技術是騰訊所必備的重要核心能力。

  騰訊傑出科學家、多媒體實驗室負責人 劉杉

  在多媒體技術革新方面,騰訊在不斷尋求突破。自2018年參與H.266/VVC標準制定以來,騰訊多媒體實驗室約有100項技術被標準採納,數量位居全球領先;為積極推動AV1商業化,騰訊雲於2019年11月率先成為中國第一家支持AV1轉碼的雲服務商;今年10月,騰訊在標準截稿3個月內在國內率先發布了H.266高清/超高清實時播放器。

  在新媒體和沉浸式互動媒體方面,劉杉認為,隨著5G時代的來臨,深度沉浸式媒體廣闊的應用場景和商業空間將被全面激活,而沉浸式媒體技術與實時媒體傳輸技術結合,可以生成更多沉浸式應用。目前騰訊已上線多個沉浸式媒體解決方案,以滿足不同業務的開發需求。

  在演講最後,劉杉表示,未來騰訊將繼續積極投入多媒體技術的研發,擁抱開源生態建設,為開發者和合作夥伴提供有效的服務和支持。

  在展區,騰訊多媒體實驗室沉浸式媒體解決方案亮相,吸引眾多觀眾體驗VR360、點雲等3DoF到6DoF沉浸式媒體技術與產品。場外觀眾更可登陸Techo官方小程序,通過5G+VR360技術體驗會場實時動態,360度任意自由角度感受會展現場。

  以下為劉杉演講實錄:

  各位領導,各位同事,各位嘉賓,大家好。我是劉杉,來自騰訊多媒體實驗室。非常遺憾今天不能夠到現場,那麼我就通過視頻這個形式和大家做一個分享。今天分享的題目是「從視頻編解碼到互動沉浸媒體」。

  去年的techo我做了一個「視頻編解碼技術與應用」的分享。那麼今天分享的第一個主要內容,我會和大家簡單介紹一下在這一年當中視頻編解碼技術的一些演進和迭代。在這之後,我會介紹騰訊多媒體實驗室和騰訊雲,在新媒體及互動沉浸式媒體方向的一些探索和嘗試。

  今年是特殊和具有挑戰性的一年。世界性的疫情為我們的生活帶來了巨大的改變,教育、辦公、娛樂、銷售等領域的很多活動都因為疫情的關係從線下變為線上,多媒體技術則為這些雲服務提供了必不可少的支持。自三月以來全球視頻流量激增,網絡帶寬面臨巨大壓力,世界各地屢次出現因網絡壓力過大而導致的區域性斷網。歐盟委員會不得不約談netflix 等網絡影音服務商,要求在高峰期降低畫質,將寶貴的數據帶寬留給居家辦公和學習。有調查結果顯示,流媒體軟體市場加速增長19%,如何在保持高質量服務的同時降低網絡數據帶寬的壓力也為各項多媒體技術提出更高要求。

  而與此同時,人們對視頻觀感質量的要求也在持續攀升。更高的解析度,更高的亮度和色度動態範圍,和更高的幀率等技術指標,配合VR360, Freeview等新媒體方式,在提升視頻觀感質量的同時,也對數據帶寬提出更高的要求。網際網路流量數據顯示,在2017年標清和高清視頻內容大約各佔一半,到了2019年標清內容佔比下降到大約1/3, 高清內容成為主流,超高清內容佔比開始攀升;預計到2022年超高清內容佔比會進一步提升到約總流量的1/4。同時,根據中國產業信息網,中國VR內容市場自2016年以來持續以每年2-3倍的速度增長。這些都使得視頻編解碼(即視頻壓縮)這一個已經存在了很多年的技術領域,即使在今天也依然具有其重要性和必要性。

  而騰訊作為一家網際網路科技公司,旗下的很多業務都和視頻這一媒體形式密切相關,例如:騰訊視頻,微視,微信,QQ,教育,泛娛樂等等,還有在這次疫情中為在線教育和遠程辦公作出巨大貢獻的騰訊會議和騰訊課堂等產品。因此領先高效的視頻編解碼技術也是騰訊公司所需要和必備的一項重要核心能力。

  簡單回顧一下,在過去三十多年裡,全球很多企業和研究機構投入巨大資源,研發了許多視頻編解碼技術,並形成了幾代視頻編解碼標準。其中主流的標準有: ISO/IEC和ITU 制定的國際標準,像我們熟知的 MPEG-2, H.264/AVC, H.265/HEVC 和今年七月結稿的H.266/VVC. 騰訊於2018年初開始參與H.266/VVC標準制定,在歷時兩年多時間裡,向標準組織提交幾百個技術提案,其中約有100項技術被標準採納,數量位居全球領先。

  與此同時,自去年正式加入AOMdia,成為進入AOMedia 董事會的第一家中國公司以來,騰訊和其他AOMedia成員公司一起積極拓展開源生態,推動AV1商業化,騰訊雲已於去年十一月率先成為中國第一家支持AV1轉碼的雲服務商。在下一代開源視頻編解碼標準AV2制定方面,騰訊貢獻了大量重要提案,包括通用測試條件,AV2需求文檔等,並貢獻了大量技術,涵蓋了塊劃分,幀內預測,變換,量化,環路濾波等多項核心技術領域,累計貢獻壓縮比提升居世界前列。騰訊專家在AOMedia組織中和Google專家一起共同擔任技術孵化組主席,並和Facebook專家一起共同擔任軟體實現工作組主席。

  我們也大力投入國標AVS的建設,推廣,和應用落地。目前騰訊雲支持AVS2和AVS3高清/超高清實時轉碼,我們也為電視臺等單位做了AVS私有化部署。

  今年十月,在H.266/VVC標準第一版截稿僅三個月後,騰訊在國內率先發布了H.266高清/超高清實時播放器。這個播放器內置騰訊自研H.266軟體解碼器,可以支持高清、超高清以及屏幕內容分享等場景的實時解碼,各項性能指標國際領先。

  大家現在看到的就是用我們發布的H.266播放器在播放標準測試序列。

  每套視頻編解碼標準制定,都需要有一套標準測試序列,用來檢驗各項提案技術的性能,來幫助決定該項技術是否應當被採納進入標準。

  騰訊的標誌性序列,同時也是對我們業務具有代表性的內容,王者榮耀,也被VVC標準納入測試序列集。

  這個播放器目前已面向開發者開源。

  騰訊雲積極投入開源社區的建設,同時也將騰訊先進的技術能力通過騰訊云為各個行業開發者提供服務。在產品設計上,不僅針對國內市場,騰訊對海外業務也有充分的布局與考量,針對海外OTT市場,騰訊雲打造了媒體服務系列產品,為國內產品國際化以及海外開發者和服務商提供充分的技術產品支持,媒體服務系列產品可提供RTP/HLS/DASH等8種海外常見流媒體協議,7天24小時全天候穩定直播服務,支持60多個國家和地區的本地化部署。

  在科學技術迅速發展的今天,人們已經不滿足於只是觀看傳統二維視頻,而是渴望更真實更具沉浸感的體驗。而沉浸式媒體,通過實現物理世界和虛擬世界的融合共生,被認為是改變未來生活和工作方式的顛覆性趨勢之一。以VR為代表的沉浸式媒體內容市場在近幾年顯著增長,應用產業鏈迅速擴展,應用領域也越來越廣泛,滲透到例如文旅,教育,娛樂,醫療和製造等行業。預計到2025年沉浸式媒體市場規模發展可達到161B usd(1611億美元)因此更多的公司和廠家也正在加大沉浸式媒體技術研發和生產的投入。

  更深度的沉浸式體驗,主要體現在真實場景的6DOF、更清晰和流暢的內容顯示、多通道交互等方面,依賴VR、AR、點雲、Freeview等核心技術,配合圖片、視頻、文字、聲音等傳統媒體格式,結合壓縮、傳輸、顯示、交互等環節,通過手機、電腦、頭戴式、大屏等不同設備進行最終呈現。從沉浸式應用場景來看,正在從面向個人娛樂的消費類市場深化發展到企業級市場的垂直行業應用場景。未來隨著5G的大規模普及,沉浸式媒體硬體及技術的進一步突破、製作成本的下降以及更多優質內容的開發,將推動沉浸式媒體產品和服務被主流群體採納,深度沉浸式媒體廣闊的應用場景和商業空間將被全面激活。

  一個高質量高效率的互動沉浸式系統包含了從採集,處理,壓縮,傳輸,到解壓縮,後處理,渲染和交互等多個技術模塊。裡面包含的技術有例如投影,採集拼接,FOV,自適應傳輸等技術,涉及的傳輸協議有HLS, DASH, RTC等。因為沉浸式媒體內容的數據量比傳統高清/超高清視頻更龐大,比如這裡展示的VR360演唱會,和freeview 籃球比賽,那麼如何將所有這些技術模塊有效結合,綜合優化,對提供優質的端到端體驗就更為重要和關鍵。

  將沉浸式媒體技術與實時媒體傳輸技術結合,可以生成更多沉浸式應用。比如,傳統的視頻會議只能採用單一固定鏡頭,視野和互動性都具有一定局限性。通過融入沉浸式技術,可以創造出三自由度和六自由度的視聽效果,結合虛擬會議室設置,為與會者提供更加全面的會議信息和更加豐富的會議體驗。

  點雲是沉浸式媒體領域又一項具有代表性的技術,近兩年也正在得到更多的關注。點雲端到端系統包括點雲數據的處理、壓縮、模型重建和渲染、互動等技術模塊。騰訊自研點雲系統可以通過視頻、圖片、深度等信息進行三維物體和空間重建,可用於如會展和房地產等業務場景。由於點雲採用三維空間點陣的方式來表達真實物體和場景,可想而知構建一個高精度點雲模型所需要的數據量是非常巨大的。因而點雲數據壓縮也是點雲系統中不可缺少的一個環節。騰訊多媒體專家積極參與點雲壓縮國際標準制定並有技術提案被國際標準採納,同時擔任AVS點雲專題組聯合組長。

  騰訊雲現已上線多個沉浸式媒體解決方案,包括VR視頻解決方案,騰訊臨境沉浸式解決方案等,以滿足不同業務的開發需求。騰訊臨境沉浸式解決方案可以提供完整空間建模能力,並支持H5頁面、安卓、IOS手機端、小程序端全平臺展示和分享。

  我們已經逐步進入5G時代。5G網絡提供給我們超強的帶寬,超低的延遲,使得更多的應用觸手可及,也使得萬物互聯成為可能。在5G的影響下,媒體內容的生產,獲取和傳播方式都在發生變化。無論是4K/8K,還是VR/AR/MR/點雲,這些在過去因為受限於網絡帶寬的應用,在5G的推動下可能會迎來突破。騰訊將繼續積極投入多媒體技術的研發,擁抱開源生態建設,為開發者和合作夥伴提供有效的服務和支持。

  謝謝大家。

相關焦點

  • 騰訊多媒體實驗室劉杉:萬物皆媒的5G時代多媒體打開新場景
    12月19至20日,由騰訊主辦的2020 TECHO PARK開發者大會在北京時尚設計廣場舉辦。在大會主論壇上,騰訊傑出科學家、多媒體實驗室負責人劉杉帶來了主題為《從視頻編解碼到互動沉浸式媒體》的演講,重點分析了視頻編解碼技術的演進迭代以及騰訊在新媒體及互動沉浸式媒體方向所進行的探索和嘗試。
  • 製造「空間魔術」:為未來取暖的騰訊多媒體實驗室
    但在會議場景中,卻很難找到相對理想的統一解決方案。尤其從鍵盤打字這種近音幹擾噪音如何優化,到多人通話的低時延保持,再到視頻流與音頻流結合的優化,往往都是移動會議場景才會面對問題。如果沒有針對性的解決措施,用戶很難找到替代方案。而騰訊會議這款產品,就是針對這一場景的驚人「空間魔術」。空間魔術:騰訊多媒體實驗室如何把同事「變」到你身邊?
  • 騰訊多媒體實驗室天籟AI音頻技術「破圈」背後的「密碼」
    【天極網IT新聞頻道】10月31日,由LiveVideoStack舉辦的以「多媒體開啟新視界」為主題的LiveVideoStackCon 2020北京站如期召開。肖瑋指出,為了解決實時音視頻應用場景下的各種挑戰,騰訊多媒體實驗室圍繞音頻通信核心體驗的技術和框架進行了多年的探索。在今年9月份舉辦的騰訊全球數字生態大會上,正式發布了「面向實時音視頻應用的新一代實時音頻技術品牌」——騰訊天籟。該解決方案旨在提供實時端到端音頻通信的完整解決方案,致力於讓用戶在實時音視頻會議時可以「聽得見,聽得清,聽得真」。
  • 騰訊多媒體實驗室:讓騰訊天籟「下行最後一釐米」,聚焦打造端到端...
    原標題:騰訊多媒體實驗室:讓騰訊天籟「下行最後一釐米」,聚焦打造端到端音頻通信體驗——   10月31日,由LiveVideoStack舉辦的以「多媒體開啟新視界」為主題的LiveVideoStackCon 2020北京站如期召開。
  • 騰訊多媒體實驗室首次對外推出5G+VR直播方案
    鈦媒體11月27日消息,在日前舉辦的中國移動全球合作夥伴大會上,騰訊多媒體實驗室將其5G+VR直播以及創新夥伴的競技機器人、AR眼鏡、VR影院首次對外展出。其中,騰訊多媒體VR360直播是一套從採集壓縮到播放的完整解決方案,支持VR眼鏡、大屏、手機等多個終端。騰訊多媒體實驗室通過研發採集,拼接,處理,壓縮,傳輸,解碼,渲染,互動等各模塊,打造端到端VR360系統,其自研切塊技術可在相同視覺質量情況下節省超過50%帶寬。
  • 騰訊多媒體實驗室重磅開源視頻質量評估算法DVQA
    近日,騰訊多媒體實驗室設計的基於深度學習的全參考視頻質量評估算法DVQA在Github上正式開源,該算法模型的性能目前在公開測試數據集上取得業界領先成績。開源地址:https://github.com/Tencent/DVQA國內鏡像地址:https://git.code.tencent.com/Tencent_Open_Source/DVQA(登錄後才能訪問公開項目)騰訊工蜂源碼系統為開源開發者提供完整、最新的騰訊開源項目國內鏡像視聽時代,音視頻應用越來越廣泛:直播
  • 騰訊多媒體實驗室:探索圖像視頻降噪,還原你眼中的高清「視界」
    會上,來自騰訊多媒體實驗室的李松南總監帶來了題為 《圖像視頻降噪的今天與未來:從經典方法到深度學習》的主題演講,對圖像視頻降噪技術的現狀及發展前景進行了深入淺出的闡釋。騰訊多媒體實驗室,融合經典方法和深度學習技術,在圖像視頻降噪領域已經積累多年,研究成果已經在騰訊雲、全民K歌、微視等騰訊內外部產品、場景中廣泛應用。探索圖像視頻降噪技術,經典方法+深度學習雙管齊下據李松南介紹,騰訊多媒體實驗室在圖像視頻降噪領域已經積累多年。
  • 騰訊多媒體實驗室商世東:天籟技術讓人工耳蝸語音清晰度和可懂度...
    9月27日,值國際聾人日之際,騰訊多媒體實驗室聯合騰訊公益慈善基金會、深圳市信息無障礙研究會等機構召開發布會,宣布發起「天籟行動」,面向公益開發者、設備廠商、相關機構開放騰訊天籟AI音頻技術,應用於聽障人群無障礙建設等相關社會責任領域。會上,騰訊多媒體實驗室高級總監商世東發表了《AI,讓天籟無界》的主題演講,分享了騰訊天籟AI音頻技術研發的原理及應用。
  • 2020 Techo開發者大會召開,騰訊多媒體實驗室推出AI媒體內容生產...
    作為騰訊旗下頂尖科技實驗室,也是全球多媒體技術的領先者,智慧媒體是騰訊多媒體實驗室的重點研究領域之一。李松南表示,近期多媒體實驗室推出了AI媒體內容生產平臺——智慧媒體,可以通過搭建基於跨模態(圖像、音頻、文本、語音)算法的多媒體內容分析和理解框架,實現媒體標籤、分類、檢測、摘要、內容描述等功能。   論壇上,李松南重點介紹了智慧媒體的內容生產。
  • 騰訊多媒體實驗室推出智慧媒體內容生產平臺
    作為騰訊旗下頂尖科技實驗室,也是全球多媒體技術的領先者,智慧媒體是騰訊多媒體實驗室的重點研究領域之一。李松南表示,近期多媒體實驗室推出了AI媒體內容生產平臺——智慧媒體,可以通過搭建基於跨模態(圖像、音頻、文本、語音)算法的多媒體內容分析和理解框架,實現媒體標籤、分類、檢測、摘要、內容描述等功能。
  • 騰訊多媒體實驗室推出AI媒體內容生產平臺「智媒」
    作為騰訊旗下頂尖科技實驗室,也是全球多媒體技術的領先者,智慧媒體是騰訊多媒體實驗室的重點研究領域之一。李松南表示,近期多媒體實驗室推出了AI媒體內容生產平臺——智慧媒體,可以通過搭建基於跨模態(圖像、音頻、文本、語音)算法的多媒體內容分析和理解框架,實現媒體標籤、分類、檢測、摘要、內容描述等功能。論壇上,李松南重點介紹了智慧媒體的內容生產。
  • 騰訊開源國內首個視頻質量評估算法DVQA,騰訊會議就在用
    視聽時代,音視頻應用越來越廣泛:直播、短視頻、視頻節目、音視頻通話……近期由於新冠疫情帶來的在線協同辦公、在線教育類產品的崛起,更帶來了線上音視頻需求的爆發,用戶對音視頻質量訴求也愈加強烈。有沒有高效又有「質保」的方法?騰訊最新開源來了。
  • 專訪騰訊多媒體實驗室商世東:咬咬牙也要跟上新版本的發布
    近日,騰訊多媒體實驗室高級總監商世東接受LiveVideoStack專訪,圍繞騰訊會議及其背後的故事進行了分享。以下為採訪實錄:1. 選擇離開杜比從來都不是一個困難的決定剛剛畢業的時候,我在摩託羅拉做音頻方面的工作,一做就是將近十年的時間。
  • 北郵喬秀全:5G XR將真正實現萬物皆媒的「物媒」新時代
    在論壇上,北京郵電大學網絡與交換技術國家重點實驗室喬秀全教授表示,在疫情的影響下,在線新經濟凸顯其重要性,利用人工智慧、5G、物聯網、大數據、區塊鏈等相關技術,與傳統行業結合起來,在線新經濟將助力文化、教育、流通、智能製造等領域的智能化建設。5G和XR結合將真正實現萬物皆媒體的「物媒」新時代。什麼是物媒傳播技術?
  • 騰訊5G開放平臺亮相2020中國移動合作夥伴大會
    5G築基,共贏數位化新時代騰訊生態合作部總經理、青騰大學總經理王蘭在中國移動全球合作夥伴大會上表示:「騰訊希望專注做好連接器、工具箱、生態共建者三個角色,成為各行各業最好的數位化助手。5G作為國家新基建戰略的重要部分,是支撐經濟社會數位化、網絡化、智能化轉型的關鍵。
  • 透過騰訊雲,窺探神秘的全真網際網路
    沒有人願意被時代拋棄,可究竟什麼是「全真網際網路」,現在也沒有一個清晰的定義。此時,若透過騰訊的一些業務布局,或許可以窺探到馬化騰所說的新網際網路時代。 騰訊傑出科學家、多媒體實驗室負責人劉杉表示,騰訊於2018年初開始參與H.266/VVC標準制定,在歷時兩年多時間裡,向標準組織提交幾百個技術提案,其中約有100項技術被標準採納。 王慧星則透露,在H.266/VVC標準制定中,騰訊和華為兩家公司貢獻的專利,在中國是名列前茅的。
  • 西交利物浦大學多媒體實驗室論文被IEEE國際著名期刊收錄
    西交利物浦大學多媒體實驗室論文被IEEE國際著名期刊收錄 http://www.huaue.com  2012年4月24日  來源:華禹教育網   近日,西交利物浦大學多媒體實驗室論文
  • 小尺寸,連接5G大時代 - SIM8202G-M2 助力萬物智聯
    在第十四屆國際物聯網展期間,芯訊通推出了最新的超小尺寸5G模組SIM8202G-M2,為萬物互聯注入新動力。隨著3GPP宣布5G R16標準正式凍結, 5G 第一個演進版本標準完成,5G 相關技術進一步明確。此次全球首發的SIM8202G-M2模組, 充分滿足這一標準的要求。
  • 騰訊Techo Park開發者大會正式召開,重磅發布雲原生線路圖、雲梯計劃
    騰訊雲還重磅升級和發布了八款產品,以成熟穩定的服務方式,推動雲原生新技術能快速落地。目前,SuperEdge 已在騰訊雲 IECP、WeMake、WeTransport、WeCity和WeLink等產品和解決方案廣泛應用,落地場景覆蓋物聯網、工業網際網路、交通、能源、零售、智慧城市、智慧建築、雲遊戲、互動直播等。
  • 什麼是多媒體?多媒體與媒體的區別,知識普及
    什麼是多媒體,媒體與多媒體有什麼區別?我們已經處於多媒體時代,那麼什麼是多媒體呢?多媒體與媒體有什麼區別呢?如果要你細細的說一下,大部分人可能都會摸稜兩可,有些東西我們知道,但是讓我們去解釋可能還需要一定的知識,今天我們就來學習一下,什麼是多媒體,什麼是媒體,媒體與多媒體有什麼區別。隨著計算機技術,網絡通訊,數位電視的快速進步,多媒體數據的獲取,生存處理和展現技術也得到了迅速的發展。