bemd信號處理算法_bemd算法 - CSDN

2020-11-23 CSDN技術社區

當前視頻編碼的現狀和問題

視頻編碼本質上是一種有損壓縮,無損的壓縮極限是熵。有損壓縮的極限是人的視覺的差別感知能力 — Weber定理。

現在佔統治地位的編解碼方案都是基於塊的混合編碼架構。利用變換編碼, 預測編碼、熵編碼三類經典技術, 去除視頻信號的空域冗餘、時域冗餘及統計冗餘。在這個技術路線上,從ITU-T的h261/2/3/4/5系列,到ISO/IEC的MPEG1/2/4 都是通過升級這三個部分的技術來達到更大的壓縮效率。是典型的用複雜度來換取壓縮效率。

當前視頻的應用包括,視頻監控,便攜播放器,機頂盒,DVD,網絡視頻等。需要考察和權衡的編解碼的維度包括下面部分。

編碼複雜度-編碼效率-傳輸容錯性-解碼複雜度-編碼質量

H264為代表的主流方案的特點是,編碼複雜度遠遠大於解碼複雜度(5-10倍),編碼效率還是很可觀的SD(1-2Mbps)HD(4Mbps),傳輸容錯性(利用FEC/FMO等可以達到可以接受的程度,但是沒有辦法合理的降級處理錯誤,及按照誤碼的比例同比例的降低質量),解碼複雜度比較底(在主流的手機上可以達到高清解碼),編碼質量高(圖像效果還是很好的。畢竟已經在當前的應用中佔統治地位)。

因此總體上H264的表現還是相當優秀的。但是在後續的發展中面臨一下問題

1. 再通過計算複雜度來換取編碼效率的空間變小了。

2. 大量的低端編碼設備需要使用低複雜度的編碼算法,例如監控,救援,傳感器網絡等。

3. 在無線等高誤碼,高延遲,多經傳播的網絡無法很好的適應。

1.2問題雖然可以隨著晶片技術的發展得到部分解決,但是由於晶片發展也進入了一個平臺,所以新型的計算模型也需要改造編解碼,否則無法跟上編碼複雜度的要求,從H265可以看出來,雖然編碼效率提升了1倍,但是編碼複雜度比H264起碼提升了4倍以上,當前的編碼軟體/晶片還無法實時編碼高清。

視頻編解碼的其他值得注意方向

由於H265的巨大計算複雜度,因此不適合當前的應用場景,所以不在這裡介紹了,其他值得注意的研究方向有:

H264的流化改造

H264畢竟是成熟的編碼框架如何充分利用當前的硬體發展來加速H264的編碼也是一個很重要的方向。

加速的思路就是並行:

CPU級別的加速分為細粒度的並行就是用SIMD指令(x86的mmx,sse,sse4,avx,avx2等,arm的NEON)來加速。粗粒度的並行是利用多線程或者多核心來frame或者slice級別的並行。

快速發展的GPU計算技術,讓h264編解碼看到了曙光,可是GPU的並行方式是大規模的SIMD,而H264在編碼過程中依賴了相鄰的數據,因此並行度並不大,所以如何把H264進行改造適合GPU計算也是需要研究的方面,在這方面國防科技大學的張春元教授可以說走在了前沿。

流化H.264編碼的數據並行方法 文梅,任巨,伍楠,蘇華友,荀長慶,張春元

基於可視對象的編碼

H26x的編碼還是以像素為單位進行壓縮,可以說H265在這方面降低冗餘度的設計是登峰造極了。但是如果以對象為單位進行編碼感覺應該有更高空間,MPEG-4的思路就是這樣,但是由於要基於對象編碼就要進行圖像分割,這樣需要更高的技術,因此進展不大,所以後面又和ITU-T聯合起來搞了h264.

但是這條思路卻是非常有優勢的,由於相比像素為信息單位,視頻對象為單位自然熵值更小。因此極限的壓縮效率更高。當h26x遇到瓶頸的情況下,自然會走到這一步,而且如果能夠降低計算複雜度,那麼可以在較低的複雜度下獲取相當的或者更高的編碼效率。

全面的採用視頻對象的方法還是有技術瓶頸的但是在某個領域確有了突破性的進展,這裡要自豪的宣布一下「AVS-S2標準(2013年6月,包括AVS-S2 監控系統在內的AVS視頻編碼標準由IEEE頒布為編號1857的標準」 是的,就是中國提出的AVS標準系列,AVS-S2是AVS系列裡的監控擋,AVS-S2能夠以h264一般的複雜度,卻提高了編碼效率一倍,主要是利用了監控中背景長期不變,通過背景建模來降低「背景冗餘」。這實際上就是把編碼的層次從像素級提高到了前後景級別,已經是在可視對象級別的編碼了。

所以這個思路還是有巨大的研究空間。

參見:支持監控視頻高效壓縮與識別的IEEE 1857標準

分布式視頻源編碼

理論基礎:Slepian-Wolf無失真編碼理論和失真分布式編碼Wyner-Ziv理論

分布式編碼是指對兩個或多個相關的隨機過程進行編碼,每個過程分別使用不同的編碼器,編碼後的碼流送到同一個解碼器後,該解碼器利用信號間的統計相關特性對所有輸入的碼流進行聯合解碼,如圖所示。

若對兩個統計相關的獨立同分布隨機過程X和y,分別進行傳統的熵編碼/解碼,可以得到如下關係:
Rx≥H(X)
Ry≥H(y)
其中,Rx,Ry和H(x),H(y)分別為X,Y的碼率和信息熵。若利用x和y之間的相關性,對x和y,進行獨立編碼、聯合解碼,可以進一步降低碼率.

Wyner和Ziv將Slepian.Wblf理論結果進一步延伸到有失真的分布式編碼。於視頻壓縮編碼中一般使用有失真編碼,這樣Wyner-Ziv理論成為分布式視頻編碼的主要理論依據。

分布式視頻編碼系統

基於20世紀70年代Slapian和Wolf以及Wyner和Ziv提出的信息理論而建立的分布式信源編碼,近些年被應用於視頻壓縮技術中,稱為分布式視頻編碼。分布式視頻編碼算法被廣泛研究,比較典型的分布式視頻編碼系統是史丹福大學Bemd Girod小組提出的Wyner-Ziv視頻編碼系統,以及加州大學伯克利分校Kannan Ramchandran小組提出PRISM(Power-efficient,Robust,hlgh-compression,Syndrome.based Multimedia coding)系統。

史丹福大學的Wyner-Ziv視頻編碼系統 

伯克利分校的PRISM

分布式視頻編碼的特點

1. 運算複雜度轉移- 把運動預測等複雜度高的操作轉移到了解碼器端,因此編碼器的複雜度轉移到解碼器端。

2. 固有的視頻抗誤碼能力-分布式視頻編碼算法對視頻幀進行獨立編碼,編碼Wyner-Ziv幀時,僅考慮當前幀與預測邊信息之間的相關性統計,只要在解碼端使用符合相關性的邊信息即可正確解碼。因此信道傳輸導致的丟包或誤碼不會影響其它圖像幀的恢復,具有較強的容錯能力,而不像使用預測編碼的傳統視頻壓縮算法,網絡傳輸錯誤容易
造成編碼端和解碼端重構緩存不匹配,從而出現誤碼擴散現象,嚴重影響恢復視頻質量。

3.提高視頻編碼效率困難-分布式視頻編碼算法中,編碼器對各幀圖像進行獨立編碼,沒有考慮視頻序分布式視頻編碼的關鍵技術研究列的時間相關性,雖然大大降低編碼端的複雜度,但卻未能有效去除相鄰圖像的冗餘信息,這將降低分布式視頻編碼系統的編碼效率。

網際網路點對點視頻聊天的優化

現在網際網路點對點視頻聊天的軟體實際上都有。例如QQ,Skype,Facetime,還有眾多的廠家的系統。但是效率出眾,帶寬消耗少,點對點加密的開源聊天軟體還是有生存的空間。

因此為了本質上提升視頻聊天的競爭力,需要重新考慮編碼器的選擇和改造。需要滿足編碼效率高,編碼複雜度低等,良好的抗誤碼。

基於這樣的考慮。可行的方案為:把AVS-S2的方案合併進x264中,然後在當前的硬體上調優。DVC編碼近期看不到可以實用的可能性,只好暫時放棄。

相關焦點

  • 醫學信號與圖像處理算法中的並行化
    因此,醫學信息處理日益成為學者,行業人士和普通大眾關注的焦點。  對於傳統醫學信號與圖像處理大量依賴專用的硬體設備,不僅致使造價昂貴,而且很多性能瓶頸無法得到突破。眾所周知,信號處理上一些重要的變換,如FFT,希爾伯託變換等,在硬體實現上的成本異常驚人,達到難以接受的程度,只有在高端儀器上才會出現。
  • 一種基於實用AGC算法的音頻信號處理方法與FPGA實現的分析研究
    在音頻信號處理方法及FPGA實現中,採用AGC算法,可提高音頻信號系統和音頻信號輸出的穩定性,解決了AGC調試後的信號失真問題。本文針對基於實用AGC算法的音頻信號處理方法與FPGA實現,及其相關內容進行了分析研究。 1 實用AGC算法在實際應用中的原理 在通信設備使用過程中,語音通信是重要的組成部分,而在語言通信中音頻信號的質量,決定著人們對通信系統的選擇。
  • AM信號數位化解調算法分析與比較
    AM信號數位化解調算法分析與比較 張藝萌 發表於 2011-09-27 11:18:15 數位訊號與模擬信號相比有很多優點,因此信號的數位化處理應用越來越普遍。
  • 基於MUSIC算法的相干信號DOA估計改進及應用
    在空間譜估計中,經常會因相干信源信號的存在導致目標定位不精確或無法定位的問題。在面對相干信號時,MUSIC算法等子空間類算法已經無法滿足空間譜估計的性能。因此,本文提出了一種改進的MUSIC算法能夠較好的解決該問題。
  • 20世紀最偉大的10大算法
    近日接觸推薦業務,編寫代碼實現了集團部號稱是雅虎團隊某工提供的多樣化處理方案,可惜效果不盡如人意,不知是我寫的不對,還是算法本身的效率有局限,於是
  • 啟發式算法分類 - CSDN
    下面是一些學習到的算法,有些沒有具體用到,所以只是概念的解釋,方便自己以後回憶。一、粒子群算法1.1基本思想粒子群算法是模擬群體智能所建立起來的一種優化算法,粒子群算法可以用鳥類在一個空間內隨機覓食為例,所有的鳥都不知道食物具體在哪裡,但是他們知道大概距離多遠,最簡單有效的方法就是搜尋目前離食物最近的鳥的周圍區域。
  • 數位訊號助聽器_數位訊號處理在助聽器上的應用 - CSDN
    比如國內研製的人工耳蝸的一個特點便是在設計其算法時考慮到中文語音特點。國外助聽器廠商將在近期推出以中文語音為特徵算法的助聽器。加拿大在中國的一語音實驗室通過多年的研究和實驗,早在 2000 年運用領先的數位訊號處理 (DSP) 技術,在其數字助聽器中加入中文語音算法,並同時申請了相關專利。
  • 算法優化之道:避開鞍點
    實踐當中,許多流行的優化技術都是基於一階導的優化算法:它們只觀察梯度信息,並沒有明確計算Hessian矩陣。這樣的算法可能會陷入鞍點之中。在文章的剩下部分,我們首先會介紹,收斂於鞍點的可能性是很大的,因為大多數自然目標函數都有指數級的鞍點。然後,我們會討論如何對算法進行優化,讓它能夠嘗試去避開鞍點。
  • 示波器的波形算法
    2 幾個概念為了更直觀的說明波形算法這個概念,首先貼出圖1,從圖中可以看到在數據採集通道中,內插模式、抽取模式以及波形算法是在同一數據處理通道上,從ADC採集的數據經過內插模式或者抽取模式後,你可以根據測試需要選擇合適的波形算法對多次採集的波形進行算法處理,內插模式和抽取模式可以與波形算法自由組合,選擇比較靈活。
  • GPS/北鬥中頻信號採集系統設計及其捕獲算法研究
    利用已採集好的衛星信號中頻數據,在MATLAB平臺進行編程仿真,研究了基於FFT的信號捕獲算法,能夠同時處理GPS和北鬥兩種系統的中頻數據並實現信號捕獲。  軟體接收機的設計主要包括射頻前端,中頻信號處理和導航定位信號解算三大部分。射頻前端是所有後續信號處理的基礎,負責信號下變頻和A\D轉換,輸出的數位訊號用於後續中頻信號處理[2];中頻信號處理包括中頻信號的採集,捕獲和跟蹤等,中頻信號採集系統可以完整地保存GPS\BD兩種衛星的中頻信號數據,為下面的基帶信號處理算法提供基礎。
  • 哈工大碩士生用Python實現11種經典數據降維算法,原始碼庫已開放
    MNIST 手寫數字數據集但在實際應用中,我們所用到的有用信息卻並不需要那麼高的維度,而且每增加一維所需的樣本個數呈指數級增長,這可能會直接帶來極大的「維數災難」;而數據降維就可以實現:使得數據集更易使用確保變量之間彼此獨立降低算法計算運算成本去除噪音一旦我們能夠正確處理這些信息,正確有效地進行降維,這將大大有助於減少計算量,進而提高機器運作效率。
  • 什麼是一致性哈希算法
    這裡主要記錄一致性Hash算法如何將數據分配到各個機器中去。2,衡量一致性哈希算法好處的四個標準①平衡性。平衡性是指哈希的結果能夠儘可能分布到所有的緩衝中去,這樣可以使得所有的緩衝空間都得到利用。②單調性。單調性是指如果已經有一些數據通過哈希分配到了相應的機器上,又有新的機器加入到系統中。
  • 哈工大碩士生用 Python 實現了 11 種經典數據降維算法,原始碼庫已...
    >降低算法計算運算成本去除噪音一旦我們能夠正確處理這些信息,正確有效地進行降維,這將大大有助於減少計算量,進而提高機器運作效率。而數據降維,也常應用於文本處理、人臉識別、圖片識別、自然語言處理等領域。詳細步驟可參考《從零開始實現主成分分析 (PCA) 算法》:https://blog.csdn.net/u013719780/article/details/78352262 主成分分析(PCA)代碼實現
  • 大規模主題模型:對Spark LDA算法的改進
    一種新的在線變分學習算法 在線變分預測是一種訓練LDA模型的技術,它以小批次增量式地處理數據。由於每次處理一小批數據,我們可以輕易地將其擴展應用到大數據集上。MLlib按照 Hoffman論文裡最初提出的算法實現了一種在線變分學習算法。 性能對比 上表所示的話題是用新開發的在線變分學習算法訓練得到。
  • 易於工程實現的脈衝信號實時測頻算法
    易於工程實現的脈衝信號實時測頻算法 任季中 發表於 2017-11-17 17:12:57 脈衝信號是現代雷達主要採用的信號形式,脈衝信號頻率測量是雷達偵察中不可或缺的環節,對雷達對抗起著重要的作用。
  • 人工智慧之ICA算法
    對於盲源分離問題,ICA是指在只知道混合信號,而不知道源信號、噪聲以及混合機制的情況下,分離或近似地分離出源信號的一種分析過程。過程如下:  ICA算法流程:  已知信號為S,經混和矩陣變換後的信號為:X=AS。對交疊信號X,求解混矩陣B,使Y=WX各分量儘量相互獨立。求解W的過程並不一定是近似A的逆矩陣,Y也不是信號S的近似,而是為了使Y分量之間相互獨立。目的是從僅有的觀測數據X出發尋找一個解混合矩陣。
  • 人工智慧(59)–BP算法
    BP算法概念:BP算法(error Back Propagation)是由學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。1)邏輯函數圖如下:2)雙曲正切函數圖如下:BP算法原理:BP算法由信號的正向傳播和誤差的反向傳播兩個過程組成。
  • 傅立葉變換算法(一)
    計算複雜度的降低以及數字電路計算能力的發展使得DFT成為在信號處理領域十分實用且重要的方法。   下面,比較下上述傅立葉變換的4種變體,(有什麼問題,也懇請提出,或者批評指正)   ok, 本文,接下來,由傅立葉變換入手,後重點闡述離散傅立葉變換、快速傅立葉算法,到最後徹底實現FFT算法,全篇力求通俗易懂、閱讀順暢,教你徹底理解傅立葉變換算法。由於傅立葉變換,也稱傅立葉變換,下文所稱為傅立葉變換,同一個變換,不同叫法,讀者不必感到奇怪。
  • 數位訊號處理器的主要特點_數位訊號處理 - CSDN
    來源:東興證券,謝謝DSP 即數位訊號處理技術, DSP 晶片即指能夠實現數位訊號處理技術的晶片。 DSP晶片是一種快速強大的微處理器,獨特之處在於它能即時處理資料。
  • 自適應濾波算法理解與應用
    什麼是自適應濾波器   自適應濾波器是能夠根據輸入信號自動調整性能進行數位訊號處理的數字濾波器。作為對比,非自適應濾波器有靜態的濾波器係數,這些靜態係數一起組成傳遞函數。   對於一些應用來說,由於事先並不知道所需要進行操作的參數,例如一些噪聲信號的特性,所以要求使用自適應的係數進行處理。在這種情況下,通常使用自適應濾波器,自適應濾波器使用反饋來調整濾波器係數以及頻率響應。   總的來說,自適應的過程涉及到將代價函數用於確定如何更改濾波器係數從而減小下一次迭代過程成本的算法。