經典的開源編碼器X264/X265是否真的無法超越?

2020-12-07 中國網科學頻道
  近日,由莫斯科國立大學組織連續舉行13年的視頻編碼器大賽成績公布,引發網絡對H.264/H.265標準技術、以及曾經在該項大賽封王的開源軟體X264/X265性能的熱議。筆者特意整理相關資料,與大家分享討論——被奉為經典的開源編碼器X264/X265是否真的無法超越?

 

X264何以一戰成名?

什麼是H.264?H.264是ITU(International Telecommunication Union,國際通信聯盟)和MPEG(Motion Picture Experts Group,運動圖像專家組)聯合制定的視頻編碼標準。而X264是一個開源的H.264視頻編碼函數庫,是最好的有損視頻編碼器。其最大的優勢是具有很高的數據壓縮比率,在同等圖像質量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。

X264開發者團隊也頗為神秘,自2003年開始,初創十幾位成員中,僅有ChenMin一位華人,Dark Shikari加入開發後,X264逐漸成為了最好的視頻編碼器。

X264打響知名度是在2005年第2屆視頻編碼器大賽上。該比賽在視頻編碼行業具有極高影響力,X264在眾多編碼軟體中脫穎而出,獲得第二名。憑藉這屆比賽,X264在業內已小有名氣。而在2010年第6屆視頻編碼器大賽中,不斷完善的X264在三個檔次均獲得第一名,並大幅領先其他參賽者,從而一戰成名。

X264的壓縮效率成為H.264的巨大優勢,對比其他編碼軟體,如業內某知名雲公司使用的openh264是WebEx的開源項目,僅能做到與X264的superfast檔次上速度相當,但壓縮效率落後超過20%。而當今的手機編碼晶片的壓縮效率落後X264高達20%以上。

X264的開源和完備功能,使得H.264得以大規模商用。迄今,無論是在直播、點播、還是在視頻社區(如字幕組)中,都可以找到X264的身影。可以說,X264使網際網路視頻全面迎來H.264的時代,X264也成為移動直播、視頻壓制等領域的必備之選。

雖然X264被奉為行業經典的編碼技術,但其制定距今已經過了13年。隨著網絡技術和終端處理能力的不斷提高,高清、3D、移動網際網路的需求日益增加,人們對視頻編碼標準提出了更高的編碼效率上的要求。而視頻壓縮技術經過這麼多年的發展,也已經具備推出更新一代視頻編碼標準的技術基礎。

X265能否滿足H.265的核心訴求?

生活源於對美好的嚮往,創造源於對未來的渴望。

H.265正是帶著我們對美好生活的嚮往而來,H.265的核心目標是在H.264的基礎上有更高的壓縮率,更高的圖像質量。H.265標準於2013年正式推出,如圖1所示,在同等圖像質量下,H.265壓縮率提高了50%,即體積減少50%;等價於在同等體積下,擁有更高的圖像質量,畫質更清晰。H.265技術對於移動網際網路應用的首要意義在於,移動直播時碼率更低、減少對網絡的衝擊、大幅度節省帶寬費用。

圖1:H.265相比H.264在相同主觀質量下的碼率節省

值得注意的是,H.265在壓縮效率提高的同時,在參考模型中,其實是在編碼端提高了較多的計算複雜度。在標準發布之後,市場上迫切需要一款快速高效的、能夠給H.265商用提供支撐的編碼軟體,於是,X265應運而生。X265在2015年的MSU大賽中獲得綜合評估結果第一的成績,意味著H.265商用開始破冰。然而,如表1所示,目前開源H.265編碼器X265相比於X264仍有如下問題:

比較X265 ultrafast vs X264 veryfastX265 placebo vs X264 placebo

視頻分類相同質量下的碼率編碼速度相同質量下的

碼率編碼速度

表1:X265和X264的編碼性能比較

(1)在視頻直播應用(X265 ultrafast vs X264 veryfast速度級別)上,X265僅有12%的碼率節省。由於視頻直播格式的升級會帶來一連串的從播放端到CDN到服務端的連鎖反應,不足以誘惑直播APP升級編碼格式為H.265。

(2)無論是視頻直播還是離線轉碼(X265 placebo vs X264 placebo),X265在編碼速度上,相比於X264有較大劣勢。不僅難以支撐視頻3.0時代移動視頻直播場景中對編碼速度的需求,在離線轉碼服務上也太過耗時,無法支持大規模、強頻率上傳至伺服器的短視頻轉碼服務。

這無疑給H.265在移動網際網路的視頻應用潑了冷水。因而,視頻3.0時代亟需一款能夠全方位支持視頻直播和離線轉碼的高性能高速H.265編碼器。

無法超越還是過於「神話」?

混跡於中國的開源社區,在視頻壓縮類的項目中,很大一部分從業者會認為X264/X265已經臻於完善,想從頭搭建一個全新的跨越性的中國自己的編碼器是不大可能的。因而,大部分的中國網際網路公司都以X265或H.265的參考軟體為基礎,直接使用或簡單優化來完成H.265視頻的壓制。直播類的X265編碼器則有可能以X264為基礎來實現X265快速編碼。儘管有迭代升級,但仍存在技術門檻無法突破,壓縮速度上仍嚴重影響視頻的體驗度。

令人驚喜的是,近日公布結果的2016年視頻編碼器大賽中出現了一匹黑馬。據大賽官方數據顯示結果,金山雲完全自主研發的KSC265編碼器跑贏X264/X265奪得編碼軟體冠軍。

圖2:2016視頻編碼器大賽綜合評價結果

首先,上圖速度/效率綜合曲線中(橫軸為編碼速度,縱軸為編碼效率,以X264為基準,注意箭頭better的方向),KSC265在編碼速度、編碼效率兩方面,相比於X265/X264,均有明顯的優勢。跟INTEL GPU硬體編碼器相差無幾,且更具速度優勢。基於INTEL GPU編碼器受限於INTEL GPU晶片的使用,一般很難在移動終端(例如ARM手機)中應用,KSC265無疑在商用範圍上更廣。而這對中國編碼界來說無疑是一個巨大的驚喜。

驚喜後回望,這其實是必然結果。為什麼這麼說呢?

因為中國的視頻編碼軟體是在無數的工程實踐中走出來的。縱觀中國網際網路市場,作為中國的雲計算企業,更專注於如何為客戶節省帶寬成本、提高視頻質量,面對激烈的市場競爭,這也是視頻編碼軟體所研究的重點。中國編碼軟體通過網際網路迭代而產生,已經經歷了成熟的商用實踐過程,實際服務於數百個直播平臺和上億用戶,這是任何一個國際上的編碼軟體都不具備的先天優勢。

以當下「帶寬大戶」直播行業為例,排名前200位的直播APP有一半以上是金山雲的合作夥伴。業務基礎為其提供了充足的直播流量、峰值帶寬,支撐數幾千萬人並發等寶貴實踐機會。

除此之外,金山雲H.265編碼器表現出以下明顯優勢:

1) 金山雲H.265編碼是純粹的軟體編碼,在ARM\X86\X64等多個平臺均可以編譯執行,有利於H.265編碼在多種平臺下的推廣和應用。

2) 金山雲H.265編碼碼率控制能力能夠更好地適應帶寬受限下的應用需求。

3) 從金山雲公開的測試數據看,金山雲H.265的編碼速度可以接近X264的veryfast檔次(同時達到30%以上碼率節省),相比於其他H.265編碼具有很大的速度優勢和效率優勢,能夠方便H.265在移動直播等環境下的推廣,使得H.265的生態環境得到了明顯的提升。

在X264/X265過後,金山雲KSC265成為再一個視頻編碼器大賽認定的「最強視頻編碼軟體」,這個消息足以使中國編碼界振奮,基於大賽的權威性,可以大膽預測這可能會成為中國編碼軟體在國際上嶄露頭角的開端。相信在不久的未來,中國的編碼軟體將會在國際舞臺上發揮更大的作用。

相關焦點

  • StaxRip 2.1.6 發布,開源視頻轉換工具 - OSCHINA - 中文開源技術...
    StaxRip 是一個開源的視頻轉換工具,可以將藍光光碟或 DVD 中的視頻轉換成 PC 常用的視頻格式,具有一系列解復用器,復用器,編碼器和解碼器。需要在 .NET Framework 和 DirectX 的 Windows 環境下運行。
  • Biss磁編碼器
    BiSS是來自iC-Haus公司的開源協議。它定義了適用於致動器和傳感器(如旋轉編碼器或位置編碼器)的數字雙向串行接口。BiSS允許單向或雙向模式(被稱為BiSS-C連續模式)下的串行同步數據通信。BiSS接口與串行同步接口(SSI)硬體兼容。       BiSS磁編碼器的電氣接口是基於開放的BiSS Line和BiSS-C通訊標準的。
  • 超越BERT 和 GPT,微軟亞洲研究院開源新模型 MASS!
    對於這些任務,使用編碼器-注意力-解碼器框架是主流方法。圖 1 編碼器 - 注意力 - 解碼器框架如圖 1 所示,編碼器將源序列 X 作為輸入並將其轉換為隱藏表示的序列,然後解碼器通過注意力機制從編碼器中抽象出隱藏表示的序列信息,並自動生成目標序列文本 Y。
  • 它的這幾部經典作品漫威永遠都無法超越!
    如今說到超級英雄,影迷們一定不約而同的想到漫威系列電影,畢竟這十年來漫威電影的崛起大家是看在眼裡的,從《鋼鐵俠》到《復仇者聯盟》,漫威逐漸佔據了「超級英雄」電影市場,甚至早已超越DC,在超級英雄風格的商業電影中一家獨大。
  • 光速為什麼無法被超越?
    1905年,愛因斯坦出狹義相對論,認為以太不存在,光速不變並且無法被超越我們知道光速約為30萬公裡每秒,為什麼我們無法超越這個速度呢,光速真的無法被超越嗎?1、 為什麼光速無法被超越為了回答這一問題,我們不得不提相對論以及最著名的質能方程式
  • 絕對零度真的無法超越嗎?關於絕對零度幾個有趣的事實!
    絕對零度真的無法超越嗎?關於絕對零度幾個有趣的事實!絕對零度是熱力學的最低溫度,這是根據理想氣體狀態方程推導出來的,也可以說是理想氣體分子停止運動時的溫度,這個時候理想氣體的體積將減少到0,分子和原子的運動已不再遵從經典物理的物理學統計規律。
  • 谷歌開源JPEG編碼器Guetzli,壓縮35%也能生成高質量圖片
    雷鋒網消息,谷歌近日開源了用於數字圖像和網絡圖形的JPEG編碼器 Guetzli( [guɛtsli], 在瑞士德語中被翻譯為餅乾)。與現有的方法相比,它能將高質量圖片的大小縮小35%。這就使網站管理員可以使用更少的數據更快地加載網頁,此外,它能兼容現有的瀏覽器、圖像處理應用和JPEG標準。
  • 編碼器分類
    那下面我們根據不同種類的光電編碼器進行說明。,旋轉增量式編碼器以在轉動時輸出脈衝,通過計數設備來知道其位置。此編碼器原理構造簡單,機械平均,並且壽命可達幾萬小時,具有較強的抗幹擾能力,可靠性高。但是是無法輸出軸轉動的絕對位置信息。  二、絕對式編碼器  絕對式編碼器每一個位置對應一個確定的數字碼,因此它的示值只與測量的起始和終止位置有關,而與測量的中間過程無關。其位置是由輸出代碼的讀數確定的。當電源斷開時,絕對型編碼器並不與實際的位置分離。重新上電時,位置讀數仍是當前的。
  • 編碼器應用問答
    一 增量旋轉編碼器選型有哪些注意事項?  應注意三方面的參數:  1 械安裝尺寸  包括定位止口,軸徑,安裝孔位;電纜出線方式;安裝空間體積;工作環境防護等級是否滿足要求。  2 解析度  即編碼器工作時每圈輸出的脈衝數,是否滿足設計使用精度要求。
  • 什麼是SeetaFace開源人臉識別引擎?
    可是令人尷尬的是,這個領域迄今尚無一套包括所有技術模塊的、完全開源的基準人臉識別系統!我們希望改變現狀,因此開源了SeetaFace人臉識別引擎。該引擎由中科院計算所山世光研究員帶領的人臉識別研究組研發。代碼基於C++實現,且不依賴於任何第三方的庫函數,開源協議為BSD-2,可供學術界和工業界免費使用。
  • 光速無法超越的宇宙鐵律是真的嗎?在它面前,光速慢如蝸牛
    可是當人類走出地球之後,看到浩瀚宇宙的時候,不少會產生了這樣的一個懷疑:人類真的有希望走遍宇宙的每一個角落嗎?我們都知道,浩瀚的宇宙距離以光年為基本單位,太陽系算上奧爾特星雲直徑範圍超過了一光年,即使以人類現在最快的離子推進器,想要飛出太陽系也需要至少6000年,更不要說探索直徑達10萬光年的銀河系了,而人類目前的可觀測宇宙範圍達920億光年,這需要什麼樣的速度才能夠探索完啊?
  • 谷歌開源語義圖像分割模型:該領域當前最優模型
    剛剛,谷歌開源了語義圖像分割模型 DeepLab-v3+,DeepLab-v3+結合了空間金字塔池化模塊和編碼器-解碼器結構的優勢,是自三年前的 DeepLab 以來的最新、性能最優的版本。今天,谷歌開源了其最新、性能最優的語義圖像分割模型 DeepLab-v3+ [1],該模型使用 TensorFlow 實現。DeepLab-v3+ 模型建立在一種強大的卷積神經網絡主幹架構上 [2,3],以得到最準確的結果,該模型適用於伺服器端的部署。
  • 單晶片編碼器實現精確運動控制
    在圖2中,獨立封裝編碼器方案被單晶片編碼器設計取代。這個例子用的是一個iC-MH磁編碼器IC.採用這種類型設計,可以通過一個數字接口來調整編碼器的配置。  如圖中所示,編碼器晶片感知電機軸旋轉的方法是通過一個徑向磁化的圓柱狀磁鐵來實現的。
  • 告訴你編碼器如何分類?
    那下面我們根據不同種類的光電編碼器進行說明。,旋轉增量式編碼器以在轉動時輸出脈衝,通過計數設備來知道其位置。此編碼器原理構造簡單,機械平均,並且壽命可達幾萬小時,具有較強的抗幹擾能力,可靠性高。但是是無法輸出軸轉動的絕對位置信息。  二、絕對式編碼器  絕對式編碼器每一個位置對應一個確定的數字碼,因此它的示值只與測量的起始和終止位置有關,而與測量的中間過程無關。其位置是由輸出代碼的讀數確定的。當電源斷開時,絕對型編碼器並不與實際的位置分離。
  • 磁性角度編碼器晶片入門精講一(收藏版)
    早期國內的磁編碼器晶片市場被歐美以及日本廠商所壟斷,2016年,上海麥歌恩微電子推出了第一代自主研發的基於AMR磁阻技術的磁編碼器晶片MT6801,經過多年的持續研發和積累,麥歌恩微電子已先後推出了三代磁編碼器晶片產品,最新一代的MT6825晶片性能已經達到了業界的頂尖水平。
  • VPF:適用於 Python 的開源視頻處理框架,加速視頻任務、提高 GPU...
    雷鋒網 AI 開發者按:近日,NVIDIA 開源了適用於 Python 的視頻處理框架「VideoProcessingFramework(VPF)」。該框架為開發人員提供了一個簡單但功能強大的 Python 工具,可用於硬體加速的視頻編碼、解碼和處理類等任務。
  • 旋轉編碼器原理/安裝
    旋轉編碼器一般說來有增量式旋轉編碼器,絕對式旋轉編碼器,正弦輸出旋轉編碼器,馬達旋轉編碼器這幾種!一般很多高級的煤礦在井下電動機的控制的時候採用PLC系統的時候有應用  旋轉編碼器應用注意事項:  應注意三方面的參數:  1). 械安裝尺寸,包括定位止口,軸徑,安裝孔位;電纜出線方式;安裝空間體積;工作環境防護等級是否滿足要求。  2). 解析度,即編碼器工作時每圈輸出的脈衝數,是否滿足設計使用精度要求。
  • 絕對式編碼器精度最高到好多_提高絕對式編碼器精度的途徑
    打開APP 絕對式編碼器精度最高到好多_提高絕對式編碼器精度的途徑 發表於 2019-10-10 10:05:54   絕對式編碼器精度最高到好多   單圈的可以達到16位,多圈的可以達到25位。
  • 旋轉編碼器原理
    在接合數字電路特別是單片機後,增量式旋轉編碼器在角度測量和角速度測量較絕對式旋轉編碼器更具有廉價和簡易的優勢。其缺點是無法輸出軸轉動的絕對位置信息。(5)彈性聯接器:編碼器軸與用戶軸聯接時,存在同軸誤差,嚴重時將損壞編碼器。要求採用彈性聯接器(編碼器廠家提供選件),解決偏心問題,一般可以做到允許扭矩 <1N.m, 不同軸度<0.2mm,軸向偏角 <1.5度。