乾貨!Kaggle座頭鯨識別落下帷幕,冠軍方案解讀

2021-02-26 我愛計算機視覺

點擊我愛計算機視覺標星,更快獲取CVML新技術

本文經機器之心(微信公眾號:almosthuman2014)授權轉載,禁止二次轉載

機器之心專欄

作者:Earhian (喬健), YourVenn (王乙衡)

不久之前,Kaggle座頭鯨識別挑戰賽結束,Earhian(喬健) YourVenn(王乙衡)、Tom 57、A.L.四位選手組成的團隊奪得了第一名。本文主要介紹了冠軍團隊的解決方案。

圖註:Kaggle座頭鯨識別挑戰賽 leaderboard

為了幫助鯨魚保護,科學家們使用照片監視系統 (Photo Surveillance Systems) 來監視海洋活動。他們使用鯨魚尾巴這一獨一無二的標記來在連續的圖像中識別鯨魚,並對它們的活動進行細緻地分析。在過去的四十年裡,大部分工作基於科學家們的手工作業,這也使得大量的數據未被充分利用。

在這一競賽中,我們是要構建算法來識別圖像中的鯨魚個體,而難點在於訓練樣本的嚴重不均衡以及存在近三分之一的無標註(new whale)數據。

1.概述

這是一個few shot learning和細粒度分類的問題。比賽初期,我們使用了softmax + 固定閾值的方法,僅對有標註的樣本進行訓練並通過閾值插入new whale的預測,但是沒有取得很好的效果(MAP@5 < 0.9)。為了將new whale加入網絡中訓練,我們針對每一類鯨魚進行二分類(如下圖所示),並且使用triplet loss來做特徵度量。通過大量實驗,SE-resneXt154被作為最優的backbone,取得了單模型0.96的baseline,在追加了一系列tricks之後,單fold模型達到了0.969 (private LB: 0.97+ 榜上第三名)。最後,藉助4 fold cross validation,以及類別平衡後處理,得到了最終public & private兩榜第一名的0.973。

2.網絡輸入

我們使用RGB + Mask的四信道輸入(Mask來源於我們訓練的分割模型,通過論壇中開源的450張標註數據訓練即取得了很好的效果: MAP for local cross validation: 0.96+ )。

3.鯨魚水平翻轉,並賦予新的id(+0.006~0.007)

論壇中,選手Heng CherKeng 提出「根據鯨魚尾部不對稱的特性(見下圖),將其翻轉可以得到新的類別」這一假設。這個假設沒有得到很多的贊同票,但在我們的實驗中取得了非常好的效果。賽後我們也獲悉,第三名Pudae使用了同樣的技巧亦提高了分數。

4. 偽標籤(+0.002)

在模型得到public 0.96+的分數時,我們做了一次偽標籤:將預測置信度為1的測試樣本加入到訓練集中。

5. 類間平衡(+0.001~0.002)

我們發現隨著模型性能的提升,預測結果中top1對應的不同類別數也在增加(見下圖)。所以我們用了以下策略:

假設五個預測為:class_1 class_2 class_3 class_4 class_5

如果1) class_1的置信度減去class_2的置信度 < 0.3, 2) 並且class_2沒在top1中出現過,3) 而class_1在top2中多次出現,則交換class_1與class_2的位置。

最後,感謝隊友們的努力:@Yiheng Wang, @Peiyuan Liao and @Thomas Tilli。感謝@ Heng CherKeng,祝賀3位新的Grandmaster!@SeuTao, @David, @Weimin Wang。

我們已經將方案代碼進行了整理並開源:

英文版本可從Kaggle論壇查看:

加入專業討論群

關注計算機視覺與機器學習相關技術競賽,歡迎加入52CV-競賽交流群,掃碼添加CV君拉你入群:

(請務必註明:競賽)

喜歡在QQ交流的童鞋,可以加52CV官方QQ群:702781905。

(不會時時在線,如果沒能及時通過驗證還請見諒)

長按關注我愛計算機視覺

相關焦點

  • 大學生足球聯賽落下帷幕 眾隊員一句話表白大足
    大足球員在比賽中   2014-2015特步中國大學生校園足球聯賽已落下帷幕「今年我們主場作戰,又恰逢河海大學100周年華誕,真的很希望能以冠軍寶座作為獻給母校的生日禮物,很遺憾沒有達成。但我知道,我們就在前往冠軍的路上。」  華僑大學 8號王文迪  團結一致的精神是偉大的。「也許我們球隊還沒有奪冠的實力,但我們有團結一致去贏得每一場比賽的決心!團隊的精神是偉大的,我們會憑藉著上下一心去獲得更好的成績!」
  • 澳門賽落下帷幕!國乒包攬所有冠軍卻也有遺憾,1大獎無人問鼎
    女單決賽中,大賽經驗更豐富的孫穎莎把握機會能力更勝一籌,最終她以5:1戰勝陳幸同獲得了女單冠軍。男單決賽,老將馬龍狀態持續回勇,繼總決賽擊敗樊振東獲得冠軍之後,在與王楚欽的冠軍爭奪中,馬龍再次笑到了最後,他以5:1較為輕鬆擊敗對手獲得金牌。
  • 我是如何成為Kaggle全網第一的?
    點擊上方「計算機視覺life」,選擇「星標」快速獲得最新乾貨
  • Kaggle亞馬遜比賽冠軍專訪:利用標籤相關性來處理分類問題
    雷鋒網 AI科技評論消息,近日,Kaggle Blog上刊登了對「Planet: Understanding the Amazon from Space」比賽冠軍的專訪,在訪問中,我們了解到了冠軍選手bestfitting的一些基礎信息
  • 熱血街籃追夢杯落下帷幕 後期訪談選手竟然這樣說
    熱血街籃追夢杯落下帷幕,熱血街籃追夢杯後期訪談選手竟然這樣說。熱血街籃追夢杯經過激烈的角逐終於完美的落下了帷幕。後期採訪選手時,他竟然這樣說?接下來跟隨小編的步伐一起來看看關於熱血街籃追夢杯選手訪談的相關內容吧。
  • 明星轉會落下帷幕,眾神歸位,WWE更在意哪個品牌一目了然!
    北京時間2020年10月12日消息,今日進行的RAW節目中,WWE明星轉會2020正式落下帷幕,不少明星的品牌歸屬都正式確定下來,而今天平妹就來為大家統計分析一下,看看眾神歸位之後,WWE究竟更在意哪個品牌,下面我們先從RAW品牌明星來看!
  • 2019瑞典北極狐極地穿越落下帷幕
    2019瑞典北極狐極地穿越落下帷幕 2019-04-17 13:58:08來源:中國新聞網作者:${中新記者姓名}責任編輯:於曉
  • 電競與民國風碰撞 和平精英上海省賽在激情中落下帷幕
    在11月8日的上海的倉城影視園,一項和平精英賽事落下帷幕:和平精英城市賽上海省賽。三局比賽的勝利分別由三支戰隊獲得,接下來就要計算擊殺數和排名,TG戰隊雖然在第一和第三局中沒能拿到勝利,但是憑藉著三局比賽綜合表現最佳以總分74分拿到和平精英城市賽上海省賽的冠軍
  • 吸引7198 支隊伍參賽,看 Kaggle 信用預估比賽冠軍方案
    雷鋒網 AI 科技評論按:Kaggle Home Credit Default Risk 比賽日前落下帷幕此次比賽的評測指標採用的是 AUC,要求參賽人員或隊伍對測試集的每個 SK_ID_CURR 預測 TARGET(償清貸款)的概率並以文件形式提交到 Kaggle 平臺。冠軍團隊成員之一 Bojan Tunguz 在 Kaggle 上發表了這支團隊的具體方案,以下是雷鋒 AI 科技評論對這一方案的編譯整理。
  • 2020年烏蒙大草原百公裡超級越野賽落下帷幕 李育政、敖繞斬獲百...
    我是快快樂樂 舉報   11 月 29 日,為期兩天的 2020 年烏蒙大草原百公裡超級越野賽落下帷幕
  • 日本東京奧賽落下帷幕,鹿晨輝袁國盛未晉級前五,表現最好的是她
    近日,日本奧賽職業資格賽落下帷幕,中國健美健體新生代力量奔赴東京,與世界頂尖選手同臺競技。此次比賽表現最為亮眼的是中國女子健美選手、「龍戰隊」成員花花——首場職業賽在30位IFBB Pro中斬獲決賽第四名的好成績,同時也是日本東京奧賽女子比基尼組的全場冠軍。花花此次「花」開東京、成績亮眼,於國際舞臺展現中國女子健美實力,在收官之戰留下了濃墨重彩的一筆。
  • 巨龍海思方案人臉識別模組發布會取得圓滿成功
    【安防展覽網 品牌專欄】6月28日下午,由深圳市巨龍創視科技有限公司主辦,深圳市智慧安防商會協辦的「攜手AI,智創未來」巨龍海思方案人臉識別模組發布會在寶安區萬悅格蘭雲天大酒店成功舉辦。本次發布會匯聚了500餘安防行業專業人士,共享此次AI盛宴。本次活動到場支持的媒體有維科網、慧聰網、太平洋安防網、安全自動化、鳳凰網。
  • 美國大選落下帷幕,澳大利亞卻開始慌了!
    然而,澳大利亞也最中得到了應有的報應,但隨著美國大選落下帷幕,澳大利亞卻開始慌了。
  • 揭穿AI競賽真實面目:各種冠軍模型根本沒用,Kaggle受益者挺身反駁
    到「提出的解決方案永遠不會被直接應用」(後者來自以前的競賽獲勝者)。隨著討論的深入,我意識到,儘管我們「都知道」競賽結果在臨床意義上是有點可疑的,但我從未真正看到一個令人信服的解釋,來解釋為什麼會這樣。這就是這篇文章的內容,希望能夠解釋為什麼競賽實際上並不是構建有用的AI系統。
  • 史上最大規模北極科考落下帷幕
    圖片來源:DAVID HECKER/GETTY IMAGES本報訊 近日,隨著德國科考船「極地」號駛進不萊梅港,歷史上規模最大的北極科學考察落下帷幕。據E&E News報導,過去1年裡,「極地」號在北冰洋上慢慢行駛,船上的科學家收集了大量關於北極氣候系統的數據,例如雲層、大氣、海洋物理和生物的數據。
  • 《反黑路人甲》昨日大結局落下帷幕,接檔的新劇仍有高海寧的身影
    《反黑路人甲》昨日正式落下帷幕完結,現在就跟小編來探一探這部非套路的臥底劇吧已經假死的假扮蔣世龍的張細倫因為高彬的暴露不得不再次回到社團當中繼續臥底,所以這讓晨爺等人不得不再次想要想辦法除掉他。反正最後主線上落下了帷幕,而關於主角的感情問題更被觀眾們關注。高彬當然是與蔣家大小姐在一起,蔣家大小姐最後沒有被抓小編也是有些許意外,她可是曾經暫代過主事人一位的女子。不過也是劇情需要。但是舅舅和陸秋還有水姐都沒有被抓這也是太大的BUG了,或許是有意放他們一碼。
  • 2020年全國科普講解大賽落下帷幕
    頒獎現場(央廣網發 主辦方供圖)央廣網廣州11月15日消息(記者鄭澍)幹細胞再生器官、達文西手術機器人、火星探測背後的技術應用、量子力學……2020年全國科普講解大賽於13日在廣東科學中心落下帷幕
  • 2015「金恐龍」原創動漫網路遊戲形象表演賽落下帷幕
    2015「金恐龍」原創動漫網路遊戲形象表演賽落下帷幕
  • 座頭鯨:溫柔胖子の治癒之聲
    座頭鯨,也稱為駝背鯨,因為以其背鰭高高隆起而得名,體型肥大而臃腫而健壯,可以經常以強大的力量躍出水面。座頭鯨成體平均體長為15米,最大記錄雌性18米,長度數據看上去還比不上鯨鯊,但是同尺寸的座頭鯨的體重卻超過鯨鯊翻倍。據說一隻25-30噸的座頭鯨,可以躍出水面六米高,甚至讓巨大身軀完全騰空。
  • 濰坊四中學子在2020年世界機器人大賽中獲得多項冠軍
    12月6日,2020年世界機器人大賽總決賽正式落下帷幕,山東省濰坊第四中學派出7支戰隊分別參加了無人機比賽中的物流搬運賽、迷宮尋寶賽和紅外對戰賽三個賽項。四中學子與來自全國各地的上百支無人機隊伍展開角逐,奮力拼搏,用技術和實力展現了四中人的風採,再創輝煌戰績:2019級35班劉彥松同學奪得迷宮尋寶賽冠軍;2020級4班丁嘉輝同學奪得物流搬運賽冠軍;2020級9班李煜浩和王廣通組成的1+1戰隊奪得紅外對戰賽亞軍;