基於百度EasyDL定製化圖像識別平臺的海洋魚類識別方法

2021-01-11 雷鋒網

本文作者:範偉亞

【目的】魚類識別對漁業資源的開發利用有著重要的意義。針對海底環境惡劣、拍攝環境亮度低、場景模糊的實際情況導致海底觀測視頻品質差,視頻中的魚類識別難的問題以及現有魚類識別方法存在的魚類標註數據集過少導致訓練的深度模型準確度不高的問題。

【方法】本文提出了一種基於百度EasyDL定製化圖像識別平臺的海底魚類識別方法。首先使用伽馬校正法和暗通道先驗算法對圖片數據進行預處理,提高圖片亮度和清晰度,接著利用百度EasyDL定製化圖像識別平臺構建初魚類識別模型,再使用數據增強等方法對模型進行調優,提高模型識別能力。

【結果】實驗結果表明,與其他識別方法相比,該方法可以有效提高魚類識別的準確率。

1 引言

魚類不但有一定的食用價值,而且還有很高的藥用價值,所以世界各國對魚類資源的開發和利用都非常重視,在對魚類資源開發過程中,必須對魚類進行識別,了解其分布情況,但魚的種類繁多,形狀大小相似,識別起來較為困難。因此研究魚類識別的方法,對我國漁業資源的開發利用具有重要的學術價值和經濟價值,對於魚類的分布情況,傳統的研究方法以出海捕撈為主,使用延繩釣探捕、拖網探捕等常用捕撈技術。這種傳統調研方式固然有效,但是對於相關科研人員來說,由於調研過程周期長,耗費資源太多,而且結果存在一定的延遲性,大大影響研究人員研究成果的質量。還有基於聲吶系統的方法,對魚體回波信號進行處理分析,從聲學信號中提取適於分類的特徵進行識別,但是由於聲吶系統會對魚類造成一定的傷害,所以也不能頻繁實施,針對上述問題,國家於「十二五」期間提出將全面推動國家海底觀測平臺的建設,其中就包括通過部署水下攝像器材來實時監控關鍵海洋生物的重要務,這樣就可以通過分析觀測視頻來代替出海調研,而且保證了獲得數據的實時性,能夠極大地提高科研人員的研究效率。

傳統的機器學習方法用於魚類識別的實現過程為:獲取魚圖像、提取特徵、構建分類器,將特徵向量輸入分類器以實現種類識別。如:Phenoix等人[1]採用貝葉斯和高斯核混合模型對魚類特徵進行分層分類的方法來實現魚的分類識別;杜偉東等人[2]提出了一種提取多方位聲散射數據的小波包係數奇異值、時域質心及離散餘弦變換係數特徵,並進行特徵融合,最後用支持向量機分類的魚識別方法;雖然這些方法都可以實現魚類識別,但是這些方法這類方法已不適用於當前的視頻或圖片數據,並且方法嚴重依賴於人工選擇特徵,而人工選擇特徵往往只能選擇表層特徵,很難挖掘出有鑑別力的特徵。

和傳統機器學習方法相比,近年來崛起的深度學習方法以數據為驅動,能夠從大量數據中通過卷積等操作自動學習特徵表示,很好的解決了人工選擇特徵的問題。Abdelouahid等人[3]和顧鄭平等人[4]都提出了採用深度網絡模型進行魚類識別的方法,雖然這些方法在識別性能上都取得了引人矚目的效果,但是依然存在以下問題:模型識別性能的提高需要大量的魚類標註數據集用於學習訓練,而標註數據工作費時且昂貴,故在實際應用中難以滿足。

為此,針對以問題,本文提出了一種基於百度EasyDL定製化圖像識別平臺的海底魚類識別方法。利用百度EasyDL定製化圖像識別平臺解決目標數據集訓練數據過小和數據分布差異問題,而且通過引入伽馬校正法和暗通道先驗算法對數據進行預處理,使數據特徵具有更好的辨別能力,同時使用數據增強方法對模型進行調優,使得訓練得到的模型的泛化性更強。

2 相關工作

2.1 海洋魚類識別系統

圖 1 海底觀測平臺

海底觀測平臺的系統結構如圖1所示,位於海面以下的水下接駁器統一接收來自各個傳感器的採集數據,包括水下攝像器材採集的視頻數據,然後將數據傳輸至位於陸地上的岸基站。岸基站接收並緩存所有來自海底的數據,按約定的協議和規則轉發給大數據中心。大數據中心由多個子系統構成,負責對不同類型數據的轉化、存儲、處理、分析,其中包括本文將要研究的海洋魚類識別系統,負責對海底觀測視頻的處理分析。本文採用開源計算機視覺工具軟體OpenCV來讀取視頻數據,將視頻分解為圖片幀,同時使用背景差分算法過濾無用幀後,針對每一幀進行預處理和識別分析。

2.2 數據預處理

由於海底圖像對各種噪聲和幹擾是比較敏感的,在不同光照條件下,懸浮物等都對最終成像和識別有很大的影響。而且從圖像的形成過程考慮,圖像採集是將一個三維目標映射成為一幅二維圖像,不可避免會有信息的丟失,所以本質上圖像就具有一種模糊性。另一方面由於海水的能見度低, 透明度只有空氣的千分之一,使得採集到的圖像信噪比較低、紋理模糊。再次由於海洋中各種懸浮物的存在, 也會對光波(也就是電磁波)產生散射和吸收作用 ,導致採集到的海底圖像產生嚴重的灰白效應。再加上海流的影響以及攝像機鏡頭的抖動等因素, 造成圖像部分失真現象等因素都會影響最終識別的效果。

下面是幾幅比較典型的海底魚類圖像,我們可以看到,採集的圖像的對比度都較低,圖像較為模糊:

圖1 海底魚類圖像圖

因此,本文先使用提高亮度、提高清晰度對數據進行預處理的方法,儘可能消除亮度低和模糊帶來的影響。對於提高亮度的方法,本文選擇伽馬校正法[5],使用指數函數調整每個灰度單元,計算公式如下:

(1)

亮度的變化由參數γ來控制:當γ<1時,pi,j[k]的值會變小,亮度會提高。反之,則pi,j[k]的值會變大,亮度會降低。

對於提高清晰度的方法,通過參考基於暗通道先驗算法去霧的研究[6]。該研究認為霧天拍攝圖片的模糊是由空氣中的雜質對光的散射造成的。而海底拍攝圖片的模糊也恰好是由水中的雜質對光的散射造成的,於是可以將其適用於海底拍攝圖片,所以在該研究的基礎上,針對海底環境的特點作了改進,對每個灰度單元進行優化,計算公式如下:

(2)

綜合上述提高亮度和清晰度的過程,預處理的步驟如下:

圖3所示展示預處理方法對圖片品質的提升效果:

a原始圖 b預處理後圖片

圖2 預處理效果對比圖

從圖3中可以看出,本文提出的預處理方法可以比較有效地提高圖片的亮度以及清晰度。但是面對品質極差的圖片,預處理方法也顯露出了局限性,無法將其品質提高到魚類各項關鍵特徵都清晰的程度。

2.3 模型構建及訓練

本文以臺灣電力公司、臺灣海洋研究所和墾丁國家公園在2010年10月1日至2013年9月30日期間,在臺灣南灣海峽、蘭嶼島和胡比湖的水下觀景臺收集的魚類圖像數據集合--Fish4Knowledge(F4K)數據集[7]作為實驗數據。該數據集包括23類魚種,共27370張魚的圖像,數據集如圖4所示。

圖3 Fish4Knowledge(F4K)數據集

將實驗數據上傳至百度EasyDL數據中心,如圖4所示,採用百度EasyDL定製化圖像識別平臺構建魚類圖像識別模型,由於魚類形狀大小相似,品種差異小,可辨識性較小,故選擇AutoDL Transfer算法進行模型訓練,AutoDL Transfer模型是百度研發的AutoDL技術之一,結合模型網絡結構搜索、遷移學習技術、並針對用戶數據進行自動優化的模型,與通用算法相比,雖然訓練時間較長,但更適用於細分類場景。如圖5所示。

圖4 數據上傳

圖5 模型構建

2.3 預處理有效性實驗

為了證明本文所提預處理方法的有效性,本文在F4K數據集上做了原始的數據和基於預處理的方法的數據模型性能對比實驗,實驗在參數相同的條件下,使用百度EasyDL定製化圖像識別平臺對數據進行訓練,評估對比結果如表1所示:

表2性能對比

表1的結果顯示,在魚類識別上本文所提的預處理方法比使用原始數據有更好的識別性能,準確率及召回率等各項指標都要遠遠好於使用原始數據訓練的模型。

2.4 模型進一步調優

為了更好的提高模型識別的準確率,本文採用數據增強的方法對數據進行擴充,增加數據的規模,提高模型的泛化性能。以前,若想對訓練數據進行數據增強的操作,需要手動調整圖片來對模型訓練樣本進行擴展,例如旋轉、移動、縮放、翻轉圖片等方式,過程如圖6所示。

圖6 數據增強處理

如今,EasyDL的圖像分類模型訓練中,可以通過平臺提供的調參功能來自動執行上述增強操作,優化數據豐富度,開發者再也不用手工重複處理原始數據啦!

表3 數據增強後數據集大小

表4 數據增強後性能對比

2.5 模型對比實驗

為了進一步證明本文模型的優勢,將本文模型與其他模型,包括目前流行的深度網絡模型VGGnet16、VGGnet19以及文獻[3]中的PreCNN-SVM魚類識別方法和文獻[4]中Alex-FT-SVM魚類識別方法,在F4K數據集上進行性能評估和比較,實驗對比結果如表2所示。

表5不同方法的魚類識別性能比較

表2的各種方法對比結果來看,本文的方法相對於其他方法識別準確率有較大提升,獲得了99.6%的魚類識別精度。本方法充分利用百度EasyDL定製化圖像識別平臺優勢,可以很好地解決魚類識別任務訓練數據不足的問題,同時通過引入伽馬校正法和暗通道先驗算法對數據進行預處理,使數據特徵具有更好的辨別能力,使用數據增強方法對模型進行調優,進一步提高了模型識別的準確率。

3 結束語

海底觀測環境亮度低、場景模糊,導致採集的視頻品質差,直接識別視頻中的海洋魚類效果不好。本文提出了預處理方法提高圖片品質、百度EasyDL定製化圖像識別等方法,實現對較差品質圖片的準確識別。針對亮度低和場景模糊的問題,在預處理時首先使用伽馬校正法提高了圖片的亮度,然後參考基於暗通道先驗算法的去霧研究針對海底環境的特點作了改進,提高了圖片的清晰度。由於目前還沒有大量標記數據,本文使用百度EasyDL定製化圖像識別及AutoDL Transfer算法,解決了訓練數據少導致模型效果差的問題。從實驗結果可以看出,本文所提方法可以以高達99.6%的準確率識別海底魚類的圖片,驗證了方法的有效性。然而,本文的方法還存在不足,其中的關鍵在於海底環境的特殊性,提高圖片品質的預處理方法還沒有完全結合海底環境的特點,提高圖片品質的能力有限。下一步的研究工作將是深入分析、挖掘海底環境的特點,提出針對性更強的、更有效的預處理方法。

參考文獻:

[1]Huang, Phoenix X., Bastiaan J. Boom, and Robert B. Fisher. "Hierarchical classification with reject option for live fish recognition." Machine Vision and Applications 2015,26(1): 89-102.

[2]杜偉東, 李海森, 魏玉闊, 等. 基於 SVM 的多方位聲散射數據協作融合魚分類與識別[J]. 農業機械學報, 2015,61(3):39-43.

[3]Tamou A B, Benzinou A, Nasreddine K, et al. Underwater Live Fish Recognition by Deep Learning[C]//International Conference on Image and Signal Processing. Springer, Cham, 2018,171(6): 275-283.

[4]顧鄭平,朱敏.基於深度學習的魚類分類算法研究[J].計算機應用與軟體,2018,35(1):200-205.

[5]蔣明敏.基於FPGA的LCD伽馬校正研究[D].南京,南京林業大學,2016:25-27.(JIANG M M.Research on LCD Gamma Correction Based on FPGA[D].Nanjing,NanjingForestryUniversity,2016:25-28.)

[6]HE K, SUN J, TANG X. Single image haze removal using dark channel prior[J]. IEEE transactions on pattern analysis and machine intelligence, 2011, 33(12): 2341-2353.

[7]B J, Huang P X, He J, etal. Supporting ground-truth annotation of image datasets using clustering[C]//ICPR. 2012,21(1): 1542-1545.

相關焦點

  • 如何用百度大腦EasyDL零售版實現貨架拼接
    快消品牌商為了對訪銷過程進行精細化管理,開始使用SFA、DMS等工具進行數位化轉型,並探索利用AI技術對現有的數位化訪銷實現「降本、增效、動銷」,推動其規模化落地,最終拉動業績增長。  EasyDL是基於百度飛槳框架PaddlePaddle推出的面向企業打造的一站式AI開發平臺,包括經典版、專業版、零售版三款產品,面向不同人群、不同場景需求,提供高效進行AI模型開發部署的平臺產品。
  • 百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別
    百度大腦一月一次的最新技術&產品盤點來了。在這裡,與百度大腦一起成長,見證 AI 的力量。您可以從 PC 端訪問百度 AI 開放平臺(ai.baidu.com)申請邀測,或使用最新產品。新開放 AI 技術能力語音識別語音識別極速版支持60秒內音頻使用 REST API 方式進行調用,簡單易用。
  • 一種基於地面遙感延時圖像的咖啡花識別方法
    10月,Plant Phenomics刊發了浙江大學遙感與信息技術應用研究所題為」Coffee Flower Identification Using Binarization Algorithm Based on Convolutional Neural Network for Digital Images「的研究論文,本文介紹了一種基於地面遙感延時圖像的咖啡花識別方法
  • 深度學習與圖像識別 圖像檢測
    來源:http://blog.csdn.net/omenglishuixiang1234/article/details/53305842  點擊閱讀原文直接進入主要做了基於深度學習的圖像識別與檢測的研究,下面是一些整理內容1、深度學習的優勢(1)從統計,計算的角度看,DL
  • 乾貨:Python+百度圖像識別進行圖像審查
    圖像識別在做平臺類應用的時候,我們經常要對用戶上傳的內容進行審核隨著人工智慧技術的發展,圖像識別技術的日趨完善,系統基本上可以代替人來去做這項工作,下面讓我們使用百度圖像審查API實現一段圖像審核功能,具體看截圖。
  • 百度雲首創雲端圖像搜索 支持人臉識別和檢索
    近日,百度雲在時光軸、足跡等原有圖片預覽功能基礎上全面升級,結合百度深度學習研究院提供的人臉識別及檢索技術,首創雲端圖像搜索,讓雲端圖片預覽、查找和管理更加方便易用。更新升級之後,百度雲不僅能實現圖片智能分類、自動去重等功能,還能以圖搜圖,在海量圖片中精準定位目標。
  • 圖像識別 百度翻譯App隨手拍照就能翻譯
    如其所說,百度翻譯App最新推出3.0版本加入了百度獨有的圖像識別技術,這使得用戶只要打開百度翻譯App實物翻譯功能,對著物體拍張照,就能迅速識別並翻譯成英文。有意思的是,從不同角度,勾劃不同部分,還能得出各種結果。網友感嘆:屌絲生活變土豪,百度翻譯歡樂多!」
  • 基於matlab圖像識別的基本操作方法(以番茄識別為例)
    原圖4.1番茄圖像的識別(插圖非常困難,只插入少量圖片)在番茄圖像識別處理的過程中,第一步就是番茄圖像的前期處理。番茄圖像前期處理的主要作用是突出所需要的部分,消除掉不需要的信息,提取感興趣的區域。番茄圖像的前期處理效果決定了番茄的識別效果,所以番茄圖像的前期處理是非常關鍵的步驟。本章將會從番茄圖像採集分類、空間濾波、彩色模型的選擇、番茄圖像分割和形態學處理方法對其進行介紹。4.1.1番茄圖像空間濾波由於拍攝的番茄圖像中往往會存在噪聲,數字番茄圖像就不能反映真實的場景。
  • 基於圖像採集的汽車車牌定位識別,軟硬體協同
    3.2硬體平臺各部分說明3.2.1 FPGA開發板本項目基於Nexys™3 Spartan-6 FPGA 開發板,核心處理器為Xilinx公司的 Spartan-6 FPGA。目前車牌定位的方法很多,最常見的定位技術主要有基於邊緣檢測的方法、基於彩色分割的方法、基於小波變換的方法、基於遺傳算法的方法、基於數學形態學的車牌定位和基於灰度圖像紋理特徵分析的方法等,車牌定位算法在車牌識別技術中佔有很重要地位,一個車牌識別系統的識別率往往取決於車牌定位的成功率及準確度,考慮到FPGA適合做數據量大且運算簡單重複的特點,我們將採用基於數學形態學的方法來進行定位
  • 人臉識別主要依靠了基於圖像的空間邊緣檢測技術
    但是如果用戶與銀行間沒有這種交易交換場景,還要通過櫃員機或者電腦與交易平臺建立交易信息聯結,還要對每筆交易流水進行記錄,那效率將會非常低下。通過人臉識別這個技術技術手段,可以實現只需要用戶與接入節點溝通一次,即可以驗證用戶與接入節點的關係。
  • 基於慣性導航、RFID 及圖像識別的 AGV 融合導航系統
    汪思迪 曹小華 周 勇武漢理工大學物流工程學院 武漢 430063摘要:提出一種新型的AGV 定位導航方案,通過RFID 與圖像識別解決慣性導航誤差累計的缺陷,以STM32為主控制器實現對平臺的數據採集和姿態計算,由傳感器得到平臺的加速度、角速度,採用四元數法作為平臺的姿態更新算法,經濾波後得到平臺的姿態角。
  • 基於STFT濾波算法的指紋圖像識別系統的設計與實現
    關鍵詞:指紋增強;二值化;特徵提取;指紋圖像識別;圖像處理 引言 作為最重要的生物識別技術之一,指紋識別技術已經被廣泛應用與門禁、考勤、身份驗證等領域。指紋識別系統是由指紋圖像採集、指紋圖像增強、指紋圖像二值化、指紋圖像細化、指紋圖像特徵提取和指紋圖像匹配等模塊所構成的模式識別系統。
  • 從谷歌AutoML到百度EasyDL,AI大生產時代,調參師不再是剛需
    2018 年 4 月,百度宣布全面開放EasyDL,基於百度飛槳在深度學習領域深厚的技術積累,EasyDL 開始走上快車道。 作為百度大腦推出的零門檻AI開發平臺,EasyDL 支持面向各行各業有定製 AI 需求的企業用戶及開發者使用。
  • Plant Phenomics | 浙江大學黃敬峰教授課題組提出了一種基於地面遙感延時圖像的咖啡花識別方法
    因此,準確識別咖啡花是更好地管理這些任務的關鍵。然而,常用的遙感平臺由於其較低的時空解析度並不能實現對咖啡花這一類小目標作物的精準監測。Phenomics刊發了浙江大學遙感與信息技術應用研究所題為Coffee Flower Identification Using Binarization Algorithm Based on Convolutional Neural Network for Digital Images的研究論文,本文介紹了一種基於地面遙感延時圖像的咖啡花識別方法
  • 基於多個特徵分塊貝葉斯分類器融合策略的人臉識別方法
    摘要:提出一種基於奇異值分解和貝葉斯決策的人臉特徵提取與識別算法。通過對人臉圖像樣本進行幾何歸一化和灰度均衡化後,結合分塊與加權,運用奇異值分解,分別獲得特徵臉和標準臉,然後採用多個基於特徵分塊的貝葉斯分類器(FBBC)的融合策略進行分類識別。實驗驗證了該方法的有效性,具有良好的精煉和實時性品質指標。
  • 從百度「臉優」看人臉識別技術 或將開啟中國技術驅動
    百度世界大會發布一款名為臉優的娛樂性APP,這是其人類識別技術的具體應用。目前,國內很多領域正在或將要實現人臉識別技術應用。人臉識別技術,很有可能開啟中國的技術驅動革命。基於人臉識別技術的應用超越了以往圖像識別及情緒識別等「搜索+資料庫」技術,實現難度更大,沒有足夠的技術研發及經驗沉澱,是很難開發出臉優這樣的產品的。這款基於人工智慧、人臉識別技術誕生的產品出自百度深度學習研究院。百度深度學習研究院目前已經積累了深度學習、人機互動、3D視覺、圖像識別、無人飛行器、自動駕駛等多個研究項目的成果,並已有相關產品問世。
  • 百度雲打造人像識別系統 警務引入人工智慧
    近年來,隨著科學技術的發展,智能應用逐漸被滲透到生活中的各個領域,人臉識別技術也發展到了新的高度。百度雲人像識別系統,將人工智慧技術應用到警務場景中,正推動公安機關管理模式向信息化、智能化轉變。百度雲自主研發動態人像卡口系統,此系統可在車站、地鐵、廣場等公共場所主要出入口進行監控點位部署,形成一張基於人像卡口的人像感知網,分級整合不同區域人像資源,做到實時監控、快速取證。百度雲動態人像卡口系統功能架構由實時預警、報警處理、人像檢索、一人一檔以及系統管理組成。在前端,系統採用人像抓拍攝像機,同時採集圖片流和視頻流。
  • 百度雲推出雲端圖像搜索 支持人臉識別
    【天極網網絡頻道】【天極網網絡頻道9月16日消息】百度可謂是今年吸引了眾多人的眼球,推出了各項新的服務和新的程序。百度雲近日在時光軸、足跡等原有圖片預覽功能基礎上進行了升級,結合百度深度學習研究院提供的人臉識別及檢索技術,推出雲端圖像搜索。新增圖片智能分類,以圖搜圖等功能。
  • 百度大腦人機大戰險勝,我們來聊點乾貨:人臉識別的原理
    圖片來源於參考文獻:《人臉識別——原理、方法與技術》,王映輝編,科學出版社 2、人臉圖像預處理 系統獲取的原始圖像由於受到各種條件的限制和隨機幹擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正
  • 每周AI應用精選:虹膜識別解決方案;基於深度學習人臉識別方案等
    方案1:虹膜識別解決方案解決方案簡介:虹膜識別技術是基於眼睛中的虹膜進行身份精準識別,應用於對身份認證安全強需求或高度保密需求的場所。解決方案詳解:使用特定的攝像器材對人的整個眼部進行拍攝,並將拍攝到的圖像傳輸給虹膜識別系統的圖像預處理軟體,對獲取到的虹膜圖像進行虹膜定位,虹膜圖像歸一化和圖像增強處理;使其滿足提取虹膜特徵的需求。採用特定的算法從虹膜圖像中提取出虹膜識別所需的特徵點,並對其進行編碼。