摘要: 本文針對基於內嵌編碼思想的嵌入式零樹編碼方案,並結合當前壓縮編碼方面的理論成果,提出了一種新的編碼模型,並進行了仿真實驗。實驗結果表明,所設計的編碼算法在信噪比和壓縮比方面都取得了良好的效果。
引言
信息是現代社會的主要特徵,而人們傳遞信息的重要媒介是圖像。隨著社會經濟的發展,科學技術的不斷進步,信息視覺化技術越來越受到人們的重視。數據量大是數字圖像的一個顯著特點,一幅具有中等解析度( 640 X 480)的彩色( 24bit/象素)數字圖像的數據量約為737Mbit。這給數字圖像的傳輸帶來很大的困難。因此,圖像處理及數據壓縮對現代化社會的發展起著不可忽視的作用。利用圖像壓縮編碼技術,在原有圖像損失一定精度(即有損圖像壓縮編碼)或不損失任何精度(即無損圖像壓縮編碼)的情況下,將原有圖像用比原始數據量少得多的數據將其表示出來,以提高圖像的存儲效率和傳輸效率,既是當代信息高速公路、高清晰度電視(HDTV)、可視電話、圖文傳真等技術的關鍵,又在航空偵察遙感、資源勘探及生物醫學工程等領域起著非常重要的作用。
小波變換壓縮編碼的現狀及當前的研究存在的問題
小波分析是近年來發展起來的一門新興的數學分析理論,其應用範圍包括數學領域本身的許多學科,利用小波變換的理論實現圖像的壓縮編碼已經從九十年代初起得到了廣泛與深入地研究,並逐漸成為圖像壓縮編碼領域的一個重要分支。小波變換的優越之處在於它在時域和頻域同時具有良好的局部化性質,從而可以更加有效地刻劃信號的特徵。對於圖像而言,如果從能量的角度來看,其大部分能量一般集中在低頻部分,並且其頻帶較窄,而其餘少部分能量則集中在高頻部分,其所佔頻帶較寬。對於高頻部分的能量,其中的大部分又則是由圖像中的邊緣或細節產生的。因此,一種有效的變換編碼技術應該具有這樣的特性,即圖像通過變換後,其能量應主要集中在少部分的低頻係數上,大部分高頻係數只佔有少量能量,而佔高頻中的能量應該減小,這是圖像變換編碼的一個基本的要求。小波變換恰好提供了這樣的特性,從而可以較好地適應圖像的固有特性,對圖像進行有效地分解、表徵與編碼。
儘管小波變換圖像壓縮編碼算法具有結構簡單、無需任何訓練、支持多碼率、壓縮比較大、圖像復原質量較理想等特點, 但在不同程度上存在壓縮與解壓縮速度慢、圖像復原質量不理想等問題, 為了進一步改善此算法的工作效率, 需要解決以下兩個主要問題。首先是正交小波基的選擇問題。正交小波基的選取對圖像壓縮效果有很大的影響。在實際應用中, 由於可供選擇的正交小波基很多 , 如何做出恰當的選擇是一個難題。理論和實踐表明, 理想的正交小波基應該具有下列性質:1、線性相位特性—能減少或消除重構圖像在邊緣處的失真;2、 緊支集特性—支集越短, 小波變換的計算複雜度越低, 便於快速實現;3、消失矩特性—即,一般來說, k 越大, 小波變換後能量越集中出現在低頻,而在其他子帶中, 會出現更多的0, 便於提高壓縮比。根據當前研究得知, 有緊支集的正交小波基除Haar 系以外, 其他都不具備線性相位特性。為了保持該特性, 可放棄正交性而採用具有緊支集的雙正交小波。其次是數據向量量化編碼算法的優化問題在整個圖像壓縮過程中, 對小波係數進行向量量化編碼會直接影響圖像的壓縮效果。同時,由於應用層面的需要,目前, 常用的數據向量量化編碼算法如零樹編碼算法等運算時間長,運算量大等特點。使它不易於實時系統的實現,嚴重限制應用的範圍。 而且也有不同程度地存在運算複雜、重構復原圖像效果不理想等問題。因此, 亟需尋找優秀的向量量化算法。 此外, 對活動圖像和網絡版的圖像壓縮編碼的研究以及對人眼視覺特性的充分利用等研究也是小波變換圖像壓縮編碼領域亟待解決的問題。圖像在傳輸中往往含有的噪聲,如果通過壓縮編碼後,有利於噪聲的去處,或者在解壓縮時,加入對圖像的去噪環節,並且把這個環節融入解壓編碼的過程也是當前研究的熱點之一。
嵌入式零樹編碼
嵌入式零樹編碼方法(Embedded Zerotree Wavelets Encoding)是1993年由美國學者Jerome M.Shapiro首先完整地提出的基於比特連續逼進的圖像編碼方法。它的思想來源於對自然圖像的觀察和理解。 自然圖像具有兩個特徵:第一,自然圖像通常具有相對重要的低頻信號,當一幅圖像進行小波分解後,圖像的能量集中在相對低頻的子帶內,所以低頻子帶的小波係數往往要大於高頻子帶內相關位置的小波係數;第二,絕對值大的小波係數對圖像的影響要大於絕對值小的小波係數。同時,在圖像小波係數經過量化後, 會出現大面積的零係數, 因此, 怎樣用最少的符號來表示這些零係數的位置, 則是圖像編碼提高壓縮比的關鍵,Shapiro 的嵌入式零樹編碼的優點是只要記住零樹根的位置, 就可記住零樹結構中所有零係數的位置。所以它可以極大提高壓縮比。正因為如此,現在的零樹編碼已經成為新的圖像編碼國際標準JPEG2000的一個組成部分。 通過實踐發現, 如果按一定的順序掃描,則零樹根會更容易連續出現;同時,如果我們可以採用多種編碼的方法來表示這些連續出現的零樹根,就可以進一步地提高圖像編碼的壓縮比和信噪比。
圖像數據經過小波分解以後, 得到塔式的數據結構, 由圖像的子帶分解可知, 按水平方向和垂直方向頻率的高低(低頻為L,高頻為H),對第n 層分解, 每層可以劃分為4 個子帶,、、、 分別表示第n分解層的低頻子帶、垂直子帶、水平子帶和高頻子帶,各解析度下的子帶圖像係數域對圖像信號而言有著不同的重要性。由於正交小波變換能有效去除圖像係數的相關性,使得無論是在同一分解層或是在不同的分解層小波係數的線性相關性均非常的小, 但不同的分解層內係數幅值之間仍然存在明顯的相關性, 相關性主要表現在小尺度上(低分解層) 的小波係數往往不大於在較大尺度的相同空間位置的小波係數,零樹就是基於此種係數幅值的相關性而提出的一種新型的數據結構,通過零樹結構,可以充分利用小波域各子圖像的特點有效地表示數據。
零樹結構的定義為: 對於給定的閾值T, 如果小波係數X<T, 則稱X是小係數; 如果一個處於低解析度(低頻尺度) 上的小波係數對於給定的閾值T是小係數, 而處於同樣空間位置的高解析度(高頻尺度) 上的小波係數都小於給定的閾值T, 則該結構就稱為零樹。對於給定的低頻子圖像中的係數而言, 與其對應的具有相同空間定位的高頻子圖像(如果存在的話) 中的係數稱為是它的子孫;同樣, 對於定位在高頻子圖像中的係數而言, 跟它對應的處於相同空間的低頻子圖像中的係數稱為是它的祖先。這樣就構成了父子關係。由此可見,對於一個分解層數為M的小波分解圖像來說,子圖像的每一個係數有3個子代係數; 其分解過程示意如圖1所示。
圖1 零數結構示意圖
新的壓縮編碼結構流程
不論什麼樣的壓縮編碼方法,其目的都是要在一定保真度的情況下,達到大的壓縮比。小波變換後係數的特點使人們提出各種方案來提高其壓縮比。零樹編碼量化就是利用小波變換後的樹結構提出的一種行之有效的編碼方法。當然,這種的在小波變換後的處理方法還有很多。但都達不到零樹編碼量化的效果。但這也並不是說,簡單的零樹編碼,就能達到理想的效果。小波變換在表示圖像方面有很大的靈活性、適應人類視覺特性(HVS) 以及圖像壓縮等方面有顯著的優勢。在圖像壓縮方面的優勢主要表現在如下幾方面:小波變換後的低頻子圖集中了圖像的大部分能量;高頻子圖集中了圖像的邊緣、輪廓對應位置的大部分能量;同一方向上各級高頻子圖係數幅度大體一致。小波變換能除去係數的相關性,使得同一尺度內和不同尺度間的小波係數相關性均非常小。但是,不同尺度的小波係數在幅度上仍然存在著一定的相關性。前面提到的基於零樹的嵌入式小波壓縮算法就是利用這種相關性來有效的編碼小波係數。它們是對高頻子圖和低頻子圖統一量化編碼,只利用了係數尺度之間、空間位置之間的相關性,而沒有利用人類視覺生理和心理的特性。通過大量的文獻我們可以了解到,人眼的特性是對高頻失真不敏感,特別是對角線方向的高頻失真最不敏感,而對低頻失真較為敏感。為了充分利用人的視覺的特性,我們對小波變換後的壓縮方案進行了選擇,如圖2所示。
圖2 小波零樹編碼框圖
首先對圖像進行四級小波變換,然後根據人眼對低頻失真較敏感,而且低頻分量集中了圖像絕大部分能量的特點,對最低頻子圖子帶單獨進行DPCM壓縮編碼,為了進一步提高壓縮比,我們採用自適應算術編碼對隨後的碼流進行編碼。根據人眼對45