谷歌開源JPEG編碼器Guetzli,壓縮35%也能生成高質量圖片

2020-11-26 雷鋒網

谷歌通過線上社區的形式創造了各種新的工具和工業標準,它們所衍生出的服務和產品旨在為使用者提供更好的線上體驗。

雷鋒網消息,谷歌近日開源了用於數字圖像和網絡圖形的JPEG編碼器 Guetzli( [guɛtsli], 在瑞士德語中被翻譯為餅乾)。與現有的方法相比,它能將高質量圖片的大小縮小35%。這就使網站管理員可以使用更少的數據更快地加載網頁,此外,它能兼容現有的瀏覽器、圖像處理應用和JPEG標準。

從實現的角度來說Guetzli 與Zopfli算法類似,並不需要引入新的格式就能生成更小的PNG和gzip文件。與前段時間谷歌推出的基於循環神經網絡(RNN)的圖像壓縮方法RAISR和WebP不同,它並不需要對客戶端和系統環境進行修改。

JPEG圖像的質量與多級壓縮過程直接相關:色彩空間轉換,離散餘弦變換以及量化過程。

在這一階段,為了得到更小的圖片,圖像質量也會隨之降低。Guetzli通過引入搜索算法來減小JPEG和Guetzli在視覺模型上的差別,試圖在最小的質量損失和文件大小之間找到平衡。Guetzli視覺模型用一種更全面和細緻的方式來完成色彩感知和視覺遮蔽,以此來代替簡單的色彩轉換和離散餘弦變換。但Guetzli生成更小文件的代價在於,這種搜索算法所需要的時間遠遠長於現有的壓縮方法。

圖1 16x16像素的合成示例:一根以藍天為背景的電話線,傳統的JPEG壓縮算法會產生加工的痕跡。左圖為未壓縮的原圖。相比於中圖(libjpeg),右圖(Guetzli)文件的大小更小,也更少出現振鈴現象。

Guetzli在不犧牲質量的條件下生成了更小的圖像文件。谷歌研究院在試驗過程中發現,如果把壓縮文件大小設為一個定值,相比於libjpeg圖像,人類受試者仍然更傾向於Guetzli生成的圖像,即使libjpeg文件大小與Guetzli相似或略大一點。

圖2 20x24像素的貓眼圖片。左圖為未壓縮的原圖。相比於左圖(libjpeg),右圖(Guetzli)呈現更弱的振鈴效應,並且文件大小也更小。

Guetzli 的目標用戶是網站管理員和圖形設計者。在多圖網站中,Guetzli能夠給用戶提供更順暢的體驗,並且減少移動用戶的加載時間和帶寬消耗。此外,谷歌還希望這種新的嘗試可以激勵大家在圖像和視頻壓縮領域的研究。

雷鋒網附上GitHub頁面:https://github.com/google/guetzli/

via googleblog,雷鋒網(公眾號:雷鋒網)編譯

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 74KB圖片也高清,谷歌用神經網絡打造圖像壓縮新算法
    最新的好消息是,谷歌團隊採用了一種GANs與基於神經網絡的壓縮算法相結合的圖像壓縮方式HiFiC,在碼率高度壓縮的情況下,仍能對圖像高保真還原。GAN(Generative Adversarial Networks,生成式對抗網絡)顧名思義,系統讓兩個神經網絡相互「磨鍊」,一個神經網絡負責生成接近真實的數據,另一個神經網絡負責區分真實數據與生成的數據。
  • 經典的開源編碼器X264/X265是否真的無法超越?
    近日,由莫斯科國立大學組織連續舉行13年的視頻編碼器大賽成績公布,引發網絡對H.264/H.265標準技術、以及曾經在該項大賽封王的開源軟體X264/X265性能的熱議。筆者特意整理相關資料,與大家分享討論——被奉為經典的開源編碼器X264/X265是否真的無法超越?
  • 圖片壓縮網站哪家強?
    這個網站可以幫我們解決壓縮圖片這個問題,而且壓縮之後的效果基本和原圖沒有什麼差別。 網站使用也非常簡單,只需要點擊虛線區域選擇圖片,或者將圖片拖拽至虛線區域,就可以幫我們壓縮,並且還支持批量壓縮功能。一般來說圖片體積越大,壓縮空間就越大。
  • 8K實時影音編碼器流暢傳輸高質量內容
    作者:DIGITIMES洪煥周視訊編碼器開發商Spin Digital宣布推出HEVC/H.265軟體實時編碼器Spin Enc Live,專為8K直播視訊設計,並提供串流媒體影音所需的影片質量、壓縮率和效能。
  • 基於DSP Builder的JPEG靜態圖像壓縮算法的實現
    設計人員能夠同時進行多個HDL模型或者QuartusII軟體設計工程的設計,為每一個模塊生成一個獨立的仿真模型,並且能夠在同一設計環境中,以標準Simulink/DSP Builder模型來仿真HDL模塊。此外,該工具可充分利用和重複使用現有設計,從而大大提高產品開發速度。
  • 谷歌地球企業版開源!
    谷歌地球企業版(Google Earth Enterprise,GEE) 最初在 2006 年發布。當時的目標是,讓企業客戶能在本地數據中心部署谷歌地圖以及谷歌地球。如今,隨著越來越多的服務被搬到雲端,這項業務已被關閉。
  • 谷歌開源語義圖像分割模型:該領域當前最優模型
    剛剛,谷歌開源了語義圖像分割模型 DeepLab-v3+,DeepLab-v3+結合了空間金字塔池化模塊和編碼器-解碼器結構的優勢,是自三年前的 DeepLab 以來的最新、性能最優的版本。今天,谷歌開源了其最新、性能最優的語義圖像分割模型 DeepLab-v3+ [1],該模型使用 TensorFlow 實現。DeepLab-v3+ 模型建立在一種強大的卷積神經網絡主幹架構上 [2,3],以得到最準確的結果,該模型適用於伺服器端的部署。
  • 深度學習自動編碼器還能用於數據生成?這篇文章告訴你答案
    什麼是自動編碼器自動編碼器(AutoEncoder)最開始作為一種數據的壓縮方法,其特點有:到了2012年,人們發現在卷積網絡中使用自動編碼器做逐層預訓練可以訓練更加深層的網絡,但是很快人們發現良好的初始化策略要比費勁的逐層預訓練有效地多,2014年出現的Batch Normalization技術也是的更深的網絡能夠被被有效訓練
  • 視頻編碼器的作用以及視頻編碼器能應用的場合
    從一開始的撥號上網到現在數字路由,網際網路的內容也已經從文字、圖片豐富到了視頻,網絡視頻在新傳媒時代佔據越來越主要的地位。網際網路在改變人們的行為習慣,然而高清晰的實時圖像數據量巨大,傳輸問題不斷凸顯。 為了實現在有限帶寬下傳輸如此高數據量的視頻圖像,音視頻應用系統通過使用編碼設備將圖像進行壓縮編碼大幅降低數據量後再通過網絡傳輸,目前這些編碼設備主要採用H.264編碼技術。
  • 圖片轉換:jpeg轉換png格式
    在我們生活當中,圖片的格式分為很多種,但比較常見常用的圖片格式是jpg格式,而有時候需要用到的圖片格式可能是其它,這個時候就需要想辦法將其轉換。之前小編因為參加某場考試需要在某個平臺系統上傳照片,但因為格式不符合而遲遲無法報名成功。
  • 代碼詳解:一文讀懂自動編碼器的前世今生
    全文共5718字,預計學習時長20分鐘或更長變分自動編碼器(VAE)可以說是最實用的自動編碼器,但是在討論VAE之前,還必須了解一下用於數據壓縮或去噪的傳統自動編碼器。變分自動編碼器的厲害之處假設你正在開發一款開放性世界端遊,且遊戲裡的景觀設定相當複雜。
  • 谷歌推出全新高質量拼接算法,可生成更清晰更順滑的360度視頻
    谷歌在2015年推出了Jump,以簡化從捕捉到回放的VR視頻製作。高質量的VR相機能讓視頻捕捉更容易,而Jump Assembler可以使VR內容製作者更快、更方便和更實惠的實現自動拼接。今天,谷歌在Jump Assembler中引入了一個選項,使用基於多視點立體圖的全新高質量拼接算法。這種算法能夠產生與谷歌標準算法一樣的無縫3D全景圖,但是它在具有複雜圖層和重複圖案的場景中留下的偽影更少。 它還會生成更清晰的物體邊界的深度圖,這對VFX很有用。先來看看谷歌的標準算法是如何工作的。它基於光流的概念,將兩幅圖像中的像素進行匹配。
  • 世界視頻編碼器大賽結果出爐
    騰訊科技訊 2018年9月5日,世界視頻編碼器大賽成績揭曉,騰訊自主研發的編碼軟體「香農編碼器」(Tencent Shannon Encoder,簡稱T265)首次參賽即獲得優異成績,躋身世界一流視頻編碼軟體行列。
  • 谷歌地球企業版開源可在雲端免費部署
    北京時間3月29日,谷歌地球企業版(Google Earth Enterprise,GEE)在本周開始逐步開源,其原始碼將會在 GitHub上以Apache2協議開源。谷歌地球最早在2015年6月發布, 企業版在2006年發布。
  • 1Mb壓縮成100k,圖片無損壓縮我選擇它
    相比之前分享的[ TinyPNG ]智能壓縮工具,增添了好幾種壓縮格式,如果想要獲取更加進階的功能就需要訂閱專業版,專業版提供更加強大的壓縮、圖片尺寸調整、圖片重命名等等,需要的可以訂閱,但是對於輕度用戶來說現在的功能已經基本滿足圖片壓縮的需求了。
  • 谷歌幾乎完全開源 Chrome For Android
    近日,谷歌Chrome工程師在reddit上宣布,目前,Chrome For Android已經把能開源的部分實現開源了,包括用戶界面在內,代碼超過100000行。而未開源的部分主要是因為某些媒體解碼器和第三方插件不是谷歌提供的,所以此次開源並不是完全開源。Chrome瀏覽器和完全開源的Chromium並不相同,Chromium默認只支持Vorbis、Theora和WebM的音視頻,而Chrome則支持AAC以及MP3等第三方格式。此外,Chromium並不內置PDF和Flash插件等。
  • 谷歌地球企業版正式開源,可構建自己的私有地圖
    今年 2 月份,Google 曾在官方博客上宣布將於 3 月採用 Apache 2.0 許可證開源 Google Earth Enterprise( Google 地球企業版,簡稱 GEE),
  • 百倍提升張量計算:谷歌開源TensorNetwork
    張量網絡正越來越多地用於機器學習領域,它被用於執行複雜計算任務,但對於大多數人來說它仍然遙不可及——我們還沒有開源庫來大規模運行這種底層算法。幸運的是,谷歌正在解決這一問題。昨天,Google AI 發布了 TensorNetwork,它使用 TensorFlow 機器學習框架作為後端,並用 GPU 優化來提高張量計算的效率。
  • 推斷速度達seq2seq模型的100倍,谷歌開源文本生成新方法LaserTagger
    來源:機器之心作者:Eric Malmi等機器之心編譯參與:魔王、杜偉使用 seq2seq 模型解決文本生成任務伴隨著一些重大缺陷,谷歌研究人員提出新型文本生成方法 LaserTagger,旨在解決這些缺陷,提高文本生成的速度和效率。
  • (附開源平臺地址)| 盤點
    使用神經網絡解決這個問題的經典方法是自動編碼器。基本版本由多層感知器(MLP)組成,其中輸入和輸出層具有相同的大小,還有一個較小的隱藏層被訓練用於恢復輸入層。一旦經過訓練,隱藏層就能對應輸出可用於聚類,降維,改進監督分類甚至數據壓縮的數據表示。而在其中,1.