可用於水下形成清晰圖像的機器學習算法,高度還原拍照顏色與亮度

2021-01-08 電子發燒友
打開APP
可用於水下形成清晰圖像的機器學習算法,高度還原拍照顏色與亮度

大萌、夏雅薇 發表於 2020-01-17 13:50:22

你有過水下拍攝照片的經歷嗎?你是否注意到水下拍攝的圖片總是有些模糊甚至失真?這是由於光的衰減和反向散射效應導致水下能見度較低。

為了解決這個問題,哈爾濱工程大學的科研人員設計了一種機器學習算法用於生成逼真的水下圖像,以及一種基於生成的圖像進行訓練從而實現自然色恢復和除霧的算法。團隊表示該算法在圖片處理質量和數量上都與頂尖技術水平相當,該算法每秒在單個顯卡上處理的幀數可達125幀。

圖:圖像增強前後的水下目標探測結果。(A)真實的水下照片和(B)基於模型輸出的真實照片。紅色框內為扇貝,藍色框內為海參,綠色框內為海膽。

團隊表示大多數水下圖像增強算法(例如調節白平衡算法)都不是基於物理成像模型構建的,因此算法的泛化能力較差。而該技術採用的方法是首先利用生成對抗網絡(GAN)來生成一組特定調查地點的圖像,再將這組圖像輸入給第二個算法,U-Net。其中GAN是一種由生成器構成的AI模型,用於使鑑別器在分類過程中將合成樣本歸類為真實樣本。

團隊運用3733個帶標籤的圖像以及對應的深度地圖訓練GAN,圖像主要包括扇貝、海參、海膽及其他水產養殖生物。他們還獲得了包括NY Depth在內的公開數據集,該數據集總共包含數千張水下照片。

訓練完成後,研究人員將雙模型方法的結果與基線模型方法的結果進行對比。結果表明,該方法優勢體現在兩方面,一方面是顏色還原均勻,另一方面是可以在不破壞原始輸入圖像的底層結構的情況下很好地還原綠色色調的圖像。通常情況下,該方法還能夠在保持「適當的」亮度和對比度的同時還原顏色,這是其他圖像增強方法所做不到的。

不過研究團隊基於受損圖片重建圖像的方法並非首創。劍橋諮詢公司的AI系統DeepRay用10萬個靜止圖片來訓練GAN網絡,用來消除由不透明玻璃板導致的圖片失真。開源的DeOldify計劃採用了包括GAN的一系列AI模型來對舊照片和膠捲進行著色和還原。

此外,微軟亞洲研究中心的科學家在去年九月詳細介紹了一個用於給視頻自動著色的端到端系統。去年英偉達的研究人員構建了一個框架,該框架僅基於一個帶注釋的著色視頻幀就能推斷顏色。並且谷歌的AI團隊在去年六月推出了一種無需人工監督即可對灰度視頻進行著色的算法。

責任編輯:gt

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • AI處理水下攝影,顏色、清晰度全在線
    這是由於光的衰減和反向散射效應導致水下能見度較低。為了解決這個問題,哈爾濱工程大學的科研人員設計了一種機器學習算法用於生成逼真的水下圖像,以及一種基於生成的圖像進行訓練從而實現自然色恢復和除霧的算法。團隊表示該算法在圖片處理質量和數量上都與頂尖技術水平相當,該算法每秒在單個顯卡上處理的幀數可達125幀。
  • 手機拍照進化論:為什麼需要圖像算法?
    人類進入智慧型手機時代後,攝影方式也發生了巨大變化:用來拍照的不再只是鏡頭和傳感器了,背後還加載著一系列的圖像算法,它可以用更快的速度處理圖像,並獲得更好的拍攝效果。好作品只能依賴專業攝影師的時代過去了,圖像算法引入到手機拍照應用後,讓人人拍出好照片成為可能。紫光展銳擁有自主研發的圖像算法團隊,而且這些算法已普遍應用在展銳的晶片平臺裡。
  • AI技術加持色彩還原,揭秘紫光展銳圖像算法
    人類進入智慧型手機時代後,攝影方式也發生了巨大變化:用來拍照的不再只是鏡頭和傳感器了,背後還加載著一系列的圖像算法,它可以用更快的速度處理圖像,並獲得更好的拍攝效果。 好作品只能依賴專業攝影師的時代過去了,圖像算法引入到手機拍照應用後,讓人人拍出好照片成為可能。
  • 紫光展銳圖像算法團隊 為提升拍照體驗保駕護航
    人類進入智慧型手機時代後,攝影方式也發生了巨大變化:用來拍照的不再只是鏡頭和傳感器了,背後還加載著一系列的圖像算法,它可以用更快的速度處理圖像,並獲得更好的拍攝效果。好作品只能依賴專業攝影師的時代過去了,圖像算法引入到手機拍照應用後,讓人人拍出好照片成為可能。
  • 紫光展銳圖像算法團隊,為提升拍照體驗保駕護航
    人類進入智慧型手機時代後,攝影方式也發生了巨大變化:用來拍照的不再只是鏡頭和傳感器了,背後還加載著一系列的圖像算法,它可以用更快的速度處理圖像,並獲得更好的拍攝效果。好作品只能依賴專業攝影師的時代過去了,圖像算法引入到手機拍照應用後,讓人人拍出好照片成為可能。
  • 研究人員分享如何利用AI技術解決水下圖片模糊和著色問題
    你是否注意到,當拍攝水下照片的時候圖像會出現比以往拍攝效果更嚴重的模糊並且失真的情況?這是因為光衰減和反向散射等現象會對可見度產生不利影響。為了解決這個問題,中國哈爾濱工程大學的研究人員設計了一種機器學習算法,該算法可以生成逼真的水下圖像;另一種算法,則可以對這些圖像進行深度訓練,以達到恢復自然色彩並減少霧度的效果。 他們說,這種方法在質量和數量上都與最新技術相匹配,並且能夠在單個顯卡上以每秒125幀的速度進行處理。
  • 2020「水下目標檢測算法賽」賽題解析——聲學圖像
    為了解決該類問題,將光學技術、聲學技術和 AI 算法更好的融入到海洋產業中,近期,一場由國家自然基金委、鵬城實驗室和湛江市人民政府聯合主辦的線上比賽「水下目標檢測算法賽」拉開了帷幕。聲學圖像在水下目標檢測中探程遠、實用性強,針對「聲學圖像目標檢測」賽項,鵬城實驗室專門開設了 2 期在線直播課程,先後請到上海達華測繪有限公司專家李太春老師和河海大學、水下信息感知技術研究中心副主任霍冠英老師,為參賽者和算法愛好人士提供深入淺出的專業講座。
  • 華為P40這拍照水平能否屠榜DxOMark?AI算法的力量太強
    [PConline 資訊]華為P40拍的樣張,每一張照片都很清晰,源於大底傳感器和AI算法的力量,在多種光線環境下留住精細畫質。華為P40新增多光譜傳感器+AI算法庫,採用基於語義的色彩還原算法,令複雜光源與背景下膚色更準確。拍攝人像時還原真實的美感,保留肌膚細膩質感、還原生動細節,並通過光影塑造讓畫面更具有立體感。
  • 深入了解4大熱門機器學習算法
    但其實,真正了解機器學習的人還是少數,大多數人屬於以下兩個陣營:· 不懂機器學習算法;· 知道算法是如何工作的,但不知道為什麼會工作。因此,本文試圖闡述算法的工作流程和內容,盡力直觀地解釋其中的工作原理,希望能讓你對此有豁然開朗之感。
  • 遠近皆清晰,美拍不求人!vivo X30 Pro拍照體驗深度解析
    而在其強大算法的支持下,vivo X30 Pro還使畫面細節的處理和感光能力十分突出,讓拍攝者可輕鬆拍得肉眼所見的一切景象。出色的畫面還原度,則是我個人最為看好的特性之一。而在逆光拍攝方面,普通手機很難將強光背景與拍攝主體人物清晰捕獲。而對於vivo X30 Pro來說,這樣的拍攝難度可以說是「小菜一碟」。
  • 夏天到海邊盡情拍照!你需要這4款最佳防水相機
    現在智慧型手機的拍照效果再好,與相機相比,也就算是一般般,而且目前沒有幾款智慧型手機能夠做到這正的防水,因此選擇一款專業的防水相機,好處真不少。這些防水相機都有非常堅固的機身,輕易不會損壞,可以隨便帶下水,甚至可以在水下拍照,而你還可以放心的將它們交給熊孩子們隨便折騰,根本不用擔心被玩壞。奧林巴斯Tough TG-5
  • 用照片就能還原整個動物園?vivo S7拍照表現讓人驚喜
    影展中展示的動物均是1:1比例精準還原的照片,而這些照片都是使用vivo S7的後置鏡頭所拍攝的,許多參觀過該影像展的朋友都對vivo S7的超清拍照實力表示認可。超高像素帶來超清細節在這次的影展中,參觀者可以看到各種各樣的野生動物,包括小巧可愛的小熊貓、高達3米的長頸鹿等,這些動物的毛髮、眼睛等細節都得到了清晰還原,為參觀者完美再現了野生動物在野外的狀態。之所以能夠拍出如此清晰的野生動物照片,主要原因還是在於vivo S7強大的後置相機硬體。
  • 「機器學習」機器學習算法優缺點對比(匯總篇)
    主要回顧下幾個常用算法的適應場景及其優缺點!機器學習算法太多了,分類、回歸、聚類、推薦、圖像識別領域等等,要想找到一個合適算法真的不容易,所以在實際應用中,我們一般都是採用啟發式學習方式來實驗。),且必須「線性可分」;對於非線性特徵,需要進行轉換;「logistic回歸應用領域:」用於二分類領域,可以得出概率值,適用於根據分類概率排名的領域,如搜索排名等。
  • 見圖像傳統處理算法-邊緣檢測-分割-增強-降噪
    分水嶺算法:是一種基於拓撲理論的數學形態學的分割方法,其基本思想是把圖像看作是測地學上的拓撲地貌,圖像中每一點像素的灰度值表示該點的海拔高度,每一個局部極小值及其影響區域稱為集水盆,而集水盆的邊界則形成分水嶺。
  • 74KB圖片也高清,谷歌用神經網絡打造圖像壓縮新算法
    最新的好消息是,谷歌團隊採用了一種GANs與基於神經網絡的壓縮算法相結合的圖像壓縮方式HiFiC,在碼率高度壓縮的情況下,仍能對圖像高保真還原。  下面是這種算法展現出來的圖像與JPG格式圖像的對比。  可見,在圖像大小接近的情況下(HiFiC大小74kB,JPG圖像大小78kB),算法所展現出來的圖像壓縮效果要好得多。本文引用地址:http://www.eepw.com.cn/article/202009/418286.htm
  • 算法應用|機器學習python應用,簡單機器學習項目實踐
    可以說這並不是一個正式的項目,只是用來做一個簡單的展示,用於給初次接觸機器學習的讀者快速了解機器學習的過程和結果。這個項目是針對鳶尾花(Iris Flower)進行分類的一個項目,數據集是含鳶尾花的三個亞屬的分類信息,通過機器學習算法生成一個模型,自動分類新數據到這三個亞屬的某一個中。
  • 杜克大學推AI圖像生成器,糊圖像5秒變清晰
    但是,現有AI模型的性能普遍較差,生成的人臉圖像往往與照片主人公的真實長相併不相似。杜克大學計算機科學專業教授Cynthia Rudin指出,這是因為低像素圖像中的信息較少,AI模型無法準確地「補足」缺失信息、進而還原出清晰人臉圖像。因此,用AI技術對模糊人像進行面部識別十分困難。
  • 總結|圖像分割5大經典方法
    目的在於找到圖像中亮度在兩個方向上均發生變化的點,而非一個方向(一條邊緣)或者零個方向(平坦區域)。Harris角點檢測器是基於對圖像結構張量的決策。《計算機視覺:模型、學習和推理》第13章將圖像P模糊化,然後與一堆正交微分濾波器(如Prewitt濾波器)做卷積生成分別包括水平和垂直方向上的導數的圖像H和V,對像素(i,j)計算其梯度方向和幅度。
  • ps中圖像顏色模式有哪些?學好ps必備的基礎知識
    PS的圖像顏色模式有哪些?一、RGB顏色模式RGB是色光的的色彩模式。R代表紅色,G代表綠色,B代表藍色,通過這3個顏色疊加形成其他的色彩。因此RGB模式也叫做加色模式。因為這3種顏色都有256個亮度等級,所以能疊加形成1670萬種顏色,是ps當中色彩色彩最佳的模式,在顯示屏上顯示顏色定義時,往往採用這種模式。圖像如用於電視、幻燈片、網頁、多媒體,一般使用RGB模式。二、CMYK顏色模式CMYK代表印刷中的四種顏色,C代表青色,M代表洋紅色,Y代表黃色,K代表黑色。是一種減色的色彩模式。常用於印刷噴繪當中使用。
  • 谷歌推出基於AI的開源手勢識別算法,可識別單手21個骨骼點
    8月20日消息,谷歌發布全新的手勢識別技術,該技術集成於開源跨平臺框架MediaPipe(可為多種類型的感知數據構建處理流程),特點是採用機器學習技術,支持高準確性手勢和五指追蹤,可根據一幀圖像推斷出單手的21個立體節點。