H.264中低複雜度的快速多參考幀選擇算法的應用研究

2021-01-11 電子發燒友
H.264中低複雜度的快速多參考幀選擇算法的應用研究

董海燕,張其善 發表於 2021-01-06 09:56:15

運動估計是去除視頻序列相鄰幀之間冗餘信息的有效方法,對整個視頻編碼效果有重要的影響。由兩大國際標準化組織(ISO/IEC的MPEG和ITU-T的VCEG)共同制定的最新的國際視頻編碼標準H.264/AVC仍然採用成熟的基於塊的混合編碼框架,但由於引入了很多新的編碼技術,如多參考幀預測運動估計,從而可以提供更高的編碼效率。

以前的視頻編碼標準如MPEG-4和H.263等都只支持一個參考幀預測。H.264不同於以前的標準,採用了多參考幀預測技術,使得運動搜索範圍從原來的一個參考幀擴展為多個解碼後的參考幀,這樣通常能找到更精確的匹配,從而有助於獲得更高的編碼效率。但是多參考幀預測技術同時也存在一些缺點,對存儲空間和計算能力要求更高。

H.264中引入的拉格朗日率失真最優策略採用窮盡搜索在所有候選參考幀中選擇率失真成本最低的參考幀。拉格朗日率失真最優模式選擇問題可表述為:

其中m=(mx,my)T表示某個運動矢量,REF表示某個參考幀,Jmotion(s,c,m,REF\f1λMotion)表示在運動矢量m和參考幀REF下的率失真成本,s為原始的視頻信號,c(m,REF)為在運動矢量m和參考幀REF下的重構視頻信號,λmotion為拉格朗日乘子,R(m-P)表示編碼運動矢量m的比特數,R(REF)表示編碼參考幀REF的比特數,SAD(s,c,m,REF)(Sum Absolute Difference)為原始信號和重構信號之間的絕對差和,採用(2)式計算:

其中B1,B2表示塊的水平和垂直像表數,可以取值16,8或4。

設m表示運動矢量搜索範圍,若只允許一個參考幀進行預測,那麼每個宏塊需要搜索(2×m+1)2個候選點;若允許N個參考幀進行預測,那麼每個宏塊總共有N×2×m+1)2個候選搜索點。這意味著,運動搜索的計算量、編碼時間隨著預測中總參考幀數成倍增長。允許的參考幀數越多,運動搜索的計算量、編碼時間就越大。

為了減少上述多參考幀預測技術中存在的問題,本文利用相鄰幀間很高的相關性提出了一種低複雜度的快速多參考幀選擇算法。

1 快速多參考幀預測算法

在H.264運動估計中,多參考幀運動搜索過程在7種不同的塊大小和形狀條件下進行,執照從16×16到4×4的順序依次進行。對於每一個塊編碼大小,需要在所有可能的參考幀中找出率失真成本最低的參考幀和其相應的運動矢量。多參考幀運動搜索過程首先從概率較高的參考幀REF(0)開始,一直進行到距離當前編碼幀最遠的參考幀REF(N-1)。

由於視頻序列相鄰幀間存在很強的時域相關性,一般情況下,最優的匹配通常位於與當前編碼幀緊密相鄰的參考幀,本文採用REF(0)表示這一參考幀;其餘的參考幀(在本文中表示為REF(i),i=1,2,…,N-1,設允許的最大參考幀數為N)被選中的概率遠遠小於第一個參考幀REF(0)。

為了進一步了解不同參考幀在實際視頻序列中被採納的情況,本文選擇了幾個典型的視頻測試序列,並利用拉格朗日率失真最優搜索策略,在不同參考幀數條件下統計不同參考幀的被選中概率,實驗數據如表1所示。從表1可以看出,在所有參考幀,REF(0)成為最優參考幀的概率最高,概率高達88.67%,而其餘所有參考幀被選中的概率遠遠小於REF(0)。

從上述分析可知,參考幀REF(0)成為最終預測幀的概率最高,在這一參考幀中獲得的運動搜索結果對整個編碼性能有著重要的影響。因此,可以認為在REF(0)中的搜索範圍越大,對整個編碼性能的改善也會越大。相比較,由於其餘的參考幀被選 中的概率很低,而且每增加一個參考幀就會增加很大一部分計算量,所以在一定條件下合理地減少在這些參考幀中運動搜索的計算量,

對整個編碼性能不會產生顯著影響。由於相鄰幀間存在很強的進域相關性,前一個參考幀中運動搜索後得到的運動信息可以用來預測下一個參考幀的搜索中心。根據運動矢量的中心偏置定理,最優的運動矢量通常位於搜索中心周圍的小範圍裡,利用螺旋搜索順序,只需搜索這一小部分區域。

減少多參考幀預測計算量的思路如圖1所示。在最重要的參考幀REF(0)中,搜索範圍較大以保證取得較高的預測精度;而在其餘不很重要的參考幀中,可以選擇較小的搜索範圍,同時利用前一幀已得到的運動信息預測下一幀的搜索中心。這樣既能減少計算量,同時又不會顯著影響整個編碼性能。

本文提出了一種減少多參考幀預測計算量的快速算法。本算法不僅利用了運動矢量的空域相關性來預測第一個參考幀REF(0)的搜索中心,即利用當前宏塊周圍的三個空域相鄰塊的中值運動矢量來預測REF(0)的搜索中心;而且利用了運動矢量的時域相關性,即利用前一幀REF(i-1)所得到的運動信息對下一個參考幀REF(i)的搜索中心進行修正。由於相鄰 幀間存在很高的時域相關性,下一幀的最優運動矢量很可能就位於修正後的搜索中心附件,只需對搜索中心周圍的很少一部分候選點進行匹配運算。這樣就省略了很大一部分運算量。

2 模擬結果和分析

為了測試本文算法的性能,本文採用H.264參考軟體JM7.0作為實驗平臺。實驗參數設置如下:6個典型的視頻測試序列(Ailent、Mobile、Foreman、Template、Bus和Suzi)、CIF(352×288)或QCIF(176×144)圖像格式,每個序列150幀,幀率為30f/s,運動矢量搜索範圍為16,量化參數為32,採用Hadamard transform,GOP結構為IPPP。

表2列出了本文提出的算法與原始的採用窮盡搜索的拉格朗日率失真最優模式選擇方法的比較結果。在表2中,ΔPSNR表示平均峰值信噪比(PSNR)下降值,單位為Db, Δbits表示平均碼率增長百分數,Δtime表示運動估計編碼時間的減少百分數。Δtime和Δbits分別採用式(3)和式(4)得到:

其中Toriginal和Borigind分別表示採用原始方法時所用的運動估計編碼時間和總比特數;Tproposed和Bproposed分別表示採用本文提出的方法時所用的運動估計編碼時間和總比特數。

從表2中的實驗數據可以看出,與原始的採用窮盡搜索的拉格朗日率失真最優模式選擇方法相比,本文提出的算法可以使運動估計編碼時間平均減少15.18%,同時平均PSNR僅僅下降0.077dB,碼率增長僅僅1.56%(5個參考幀情況下)。此外,對比不同參考幀數的實驗結果,很容易發現允許的參考幀數越多,節省的編碼時間就越多。

模擬結果表明本文提出的算法可以節省H.264多參考幀運動預測的計算複雜度,同時對率失真性能的影響很小。這對H.264編碼的實時實現很有利。

責任編輯:gt

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 基於TMS320DM6446的H.264編碼器實現與優化
    此外,DM6446還集成有多種適用於視音頻多媒體處理的片內資源和接口,如用於和外部解碼器連接的視頻處理前端模塊VPFE、和視頻顯示設備連接的視頻處理後端模塊VPBE、多通道音頻串口等。 DM6446不僅在處理性能上完全滿足H.264標準要求。而且在內部結構、片內資源和外部接口上對視頻處理應用專門優化,大大降低視頻應用的開發難度和成本。
  • bemd信號處理算法_bemd算法 - CSDN
    畢竟已經在當前的應用中佔統治地位)。因此總體上H264的表現還是相當優秀的。但是在後續的發展中面臨一下問題 1. 再通過計算複雜度來換取編碼效率的空間變小了。 2. 大量的低端編碼設備需要使用低複雜度的編碼算法,例如監控,救援,傳感器網絡等。 3. 在無線等高誤碼,高延遲,多經傳播的網絡無法很好的適應。
  • 基於FPGA的幀內預測編碼器硬體架構設計詳解
    基於FPGA的幀內預測編碼器硬體架構設計詳解 工程師青青 發表於 2018-07-17 10:42:00 針對幀內預測的快速算法,由於DSP 架構軟體順序執行的局限性難以滿足實時性要求
  • 一種基於FPGA高性能H.264變換量化結構設計
    264作為最新的視頻編碼標準具有很高的壓縮性能,對它的研究具有重要的意義。根據H.264的變換量化算法設計一種基於FPGA的高性能變換量化處理結構,該結構採用流水線操作和分時復用技術。而FPGA器件採用流水控制策略和並行處理方式,可為H.264複雜的編碼模塊提供硬體加速引擎。變換量化模塊在H.264編碼算法中被頻繁調用。因此研究在儘量合理控制其資源消耗的前提下,提高變換量化模塊的工作頻率及處理數據的吞吐量,並完成變換量化一系列完整功能的變換量化結構具有重要的實際意義,也成為當前研究的首要問題。
  • 智能駕駛車載雷射雷達關鍵技術與應用算法
    由於車載系統難以提供較高的驅動電壓,因此目前車載雷射雷達中主要應用的電光材料為液晶與光波導。液晶光學相控陣是一種基於液晶電控雙折射性和閃耀光柵原理的實時可編程光束偏轉器,多採用驅動電壓低、相位調製深度大的向列相液晶。
  • 計算機視覺中,有哪些比較好的目標跟蹤算法?(上)
    這點其實並不意外,大多數情況檢測識別算法複雜度比較高不可能每幀都做,這時候用複雜度更低的跟蹤算法就很合適了,只需要在跟蹤失敗(drift)或一定間隔以後再次檢測去初始化tracker就可以了。其實我就想說,FPS才TMD是最重要的指標,慢的要死的算法可以去死了(同學別這麼偏激,速度是可以優化的)。
  • 如何用圖像質量分析儀快速測量高清圖像的系統性能?
    一個壓縮系統中的圖像質量可能隨數據率、圖像複雜度以及所採用的編碼算法不同而動態變化。測試信號的靜態本質並不能反映圖像質量的真實特徵。此時,可以採用帶有正常內容與運動圖像的測試場景來測量信號質量,並根據觀眾的報告確定測量結果,但這種評估壓縮視頻系統性能的方法效率低得可憐。泰克公司的圖像質量分析儀PQA500則為圖像質量的主觀評估提供了一種快速、實用、可重複並且客觀的測量方案。
  • 智能視頻監控系統及其在Blackfin處理器上的應用
    得益於計算機視覺的研究成果,智能視頻監控系統開始得到產業化應用。  從上世紀90年代中期開始,以卡耐基梅隆大學(CMU)和麻省理工學院(MIT)為代表的,多家美國高校所參與的,由美國國防高級研究項目署設立的視覺監控重大項目VSAM(Visual Surveillance and Monitoring),以及其它科研機構的研究成果,使得智能視覺分析取得了快速發展。
  • 基於機器視覺的典型多目標追蹤算法應用實踐
    視頻目標追蹤算法是機器視覺中一項很實用重要的算法,視頻目標追蹤算法應用場景很廣,比如智能監控、機器人視覺系統、虛擬實境(人體跟蹤)、醫學診斷(細胞狀態跟蹤)等。本文由滴普科技2048團隊AI產品部算法工程師朱曉麗介紹基於機器視覺的典型多目標追蹤算法應用實踐。
  • 星光級低照度攝像機的研究與應用
    目前監控使用的紅外燈多為LED,發出的紅外光較散,在加透鏡的情況下,最遠距離只能達到100-120米。  (3)紅外燈壽命的局限性。目前紅外燈的標稱壽命為5萬小時-10萬小時不等,但實際應用中還要短一些,發熱過高、功率過大是現階段應用普遍存在的問題[2]。
  • 一種新的變步長波束形成算法
    式中yi(h)和ri(h)分別為yi(t)和ri(t)的第h次採樣。H為採樣數據塊,大小等於LS-DRMTEM算法中一個比特周期內的採樣數。  在LS-DRMTCMA算法中,對接收信號進行了解擴頻、判決、再擴頻的過程,文獻[2]在此基礎上引進了需要參考信號的LMS算法,即在接收信號解擴重擴後,再應用LMS算法進行自適應,即把LS-DRMTCMA中的LS算法替換為LMS算法。並稱其為DR―LMS算法,可描述如下
  • 滴普技術薈:基於機器視覺的典型多目標追蹤算法應用實踐
    視頻目標追蹤算法是機器視覺中一項很實用重要的算法,視頻目標追蹤算法應用場景很廣,比如智能監控、機器人視覺系統、虛擬實境(人體跟蹤)、醫學診斷(細胞狀態跟蹤)等。本文由滴普科技2048團隊AI產品部算法工程師朱曉麗介紹基於機器視覺的典型多目標追蹤算法應用實踐。
  • 怎麼樣更好地理解排序算法
    :平均時間複雜度是 O(n^2),最佳情況是 O(n),最差情況是 O(n^2);空間複雜度 O(1);穩定的排序算法(相等元素的前後順序排序後不變);02選擇排序選擇排序的基本思想就是:每次從未排序的列表中找到最小(大)的元素,放到已排序序列的末尾
  • 美團技術解析:自動駕駛中的決策規划算法概述
    這一過程類似於我們生活中經常用到的「導航」功能,區別在於自動駕駛中使用的高精地圖與我們常見的地圖不太一樣,在高精地圖中包含了每條車道在內的更多信息。常見的全局路徑規划算法包括Dijkstra和A算法,以及在這兩種算法基礎上的多種改進。Dijkstra算法[3]和A*算法[4]也是在許多規劃問題中應用最為廣泛的兩種搜索算法。
  • 用機器學習構建O(N)複雜度的排序算法,可在GPU和TPU上加速計算
    排序一直是計算機科學中最為基礎的算法之一,從簡單的冒泡排序到高效的桶排序,我們已經開發了非常多的優秀方法。但隨著機器學習的興起與大數據的應用,簡單的排序方法要求在大規模場景中有更高的穩定性與效率。中國科技大學和蘭州大學等研究者提出了一種基於機器學習的排序算法,它能實現 O(N) 的時間複雜度,且可以在 GPU 和 TPU 上高效地實現並行計算。
  • 深度長文:計算機視覺中,目前有哪些經典的目標跟蹤算法?
    這裡說的目標跟蹤,是通用單目標跟蹤,第一幀給個矩形框,這個框在資料庫裡面是人工標註的,在實際情況下大多是檢測算法的結果,然後需要跟蹤算法在後續幀緊跟住這個框,以下是VOT對跟蹤算法的要求:通常目標跟蹤面臨幾大難點(吳毅在VALSE的slides):外觀變形,光照變化,快速運動和運動模糊,背景相似幹擾:平面外旋轉,平面內旋轉,尺度變化,遮擋和出視野等情況:
  • 詳談Turbo碼特點及應用分析
    這些算法在複雜度上和性能上具有一定的差異,系統地了解這些算法的原理是對Turbo碼研究的基礎,同時對這些算法的複雜度和性能的比較研究也將有助於Turbo的應用研究。  Turbo碼的仿真一般參考吳宇飛的經典程序。  此外,要想在移動無線系統中成功的使用Turbo碼,首先要考慮在語音傳輸中最大延遲的限制。
  • PNAS:如何定量描述複雜度?新方法來了
    自然界和人工產生的圖像對應的複雜度圖2. 自然界和人工產生的圖像對應的複雜度上圖中從左到右,該方法計算出的複雜度依次升高,這展示了使用該方法,可以衡量圖像的複雜度,符合人類直覺。具體對的計算方法和公式,請參考原文。
  • 我國科學家確定自旋玻璃三維伊辛模型的計算複雜度下限研究
    日前,中國科學院金屬研究所我所張志東研究員在解決鐵磁性三維伊辛模型精確解這個物理學難題後,又在計算機領域計算複雜性理論研究方面取得重要進展。在近期的研究工作中,張志東研究員確定了自旋玻璃三維伊辛模型的計算複雜度的下限,為一個絕對極小核模型的計算複雜度,它包含一個與其最近鄰平面相互作用的自旋玻璃二維伊辛模型,是亞指數時間,超多項式時間。
  • 實踐|在電力數據網中利用快速力導向算法進行網絡元素布局的研究
    這種方法的缺點是是網狀圖的節點數、連線數多時,計算所用的時間呈指數上漲,效率很低,用戶體驗較差。現有少部分電力數據網網絡管理系統布局使用力導向布局算法,但均使用的是傳統力導向布局算法,力導向布局算法使各個網絡設備節點布局的位置不會重疊,各連線的長度幾乎相等,且儘可能不相交。