手殘黨福音:一鍵摳圖、隔空移物,這篇CVPR華人論文幫你搞定

2021-01-21 機器之心Pro

機器之心報導

編輯:蛋醬、杜偉、小舟

世界上從來不缺少摳圖工具,但始終缺少更完美的摳圖工具(尤其是對於手殘黨來說)。

在傳統年代,人們能想到最精準的摳圖方法,大概是 Photoshop 之類的專業圖像處理軟體,顯然這種處理方式會很繁瑣。隨著人工智慧技術的發展,從業者開始嘗試將最先進的機器學習技術融入到圖像處理工作之中。這些開源算法最終變成了各種各樣的在線摳圖程序,最重要的是——它們的操作方法非常簡單且完全免費。

比如「Remove.bg」,你只需要上傳圖片,網站就能識別其中的主體並去除背景,最終返回一張透明背景的 PNG 格式圖片。儘管在前景與背景之間邊界處理上存在瑕疵,但藉助 AI 來摳圖確實比自己動手要便捷,不是嗎?

網站地址:https://www.remove.bg/

近日,一款名為「ObjectCut」的圖像處理新工具進入了大家的視野。你甚至不需事先將圖片下載到本地,只需要輸入圖片網址,即可得到一張去除背景後的圖片。

https://objectcut.com/

使用教程演示。

項目作者表示,這一工具所使用方法基於 CVPR 2019 論文《BASNet: Boundary-Aware Salient Object Detection》,並使用了一些相關的公開數據集來進行訓練,包括 ECSSD、SOD、DUTS 等。

論文地址:https://openaccess.thecvf.com/content_CVPR_2019/papers/Qin_BASNet_Boundary-Aware_Salient_Object_Detection_CVPR_2019_paper.pdf

巧合的是,前段時間在社交網絡上大火的「隔空移物」神器 AR Cut & Paste,也是基於 BASNet 來執行顯著目標檢測和背景移除的,不管是盆栽、衣服還是書本,可見即可拷,一鍵操作就能將任何主體挪進 Photoshop 變為圖像素材。

所以,大家都在用的 BASNet,為何如此神奇?

BASNet論文詳解

深度卷積神經網絡已經被用於顯著目標檢測(Salient object detection),並獲得了 SOTA 的性能。但先前研究的重點大多集中在區域準確率而非邊界質量上。

因此,在本文中,來自加拿大阿爾伯塔大學的研究者提出了一種預測優化架構 BASNet,以及一種用於邊界感知顯著目標檢測(Boundary-Aware Salient object detection)的新型混合損失。論文的第一作者秦雪彬曾就讀於山東農業大學和北京大學,現在是阿爾伯塔大學的博士後研究員。

具體而言,該架構由密集監督的編碼器 - 解碼器網絡和殘差優化模塊組成。它們分別負責顯著性預測和顯著圖優化。混合損失通過集合二進位交叉熵(Binary Cross Entropy, BCE)、結構相似性(Structural SIMilarity, SSIM)和交並比(Intersectionover-Union, IoU)損失,指導網絡學習輸入圖像和真值(ground-truth)之間的轉換。

藉助於混合損失,預測優化架構能夠有效地分割顯著目標區域,並準確地預測具有清晰邊界的精細結構。

在六個公開數據集上的實驗結果表明,無論是在區域評估還是在邊界評估方面,該研究提出的方法都優於當前 SOTA 方法。

如下圖 2 所示,本研究提出的 BASNet 包含兩個模塊,分別是預測模塊(Predict Module)和殘差優化模塊(Residual Refinement Module, RRM)。

預測模塊是一個類 U-Net 的密集監督式編碼器 - 解碼器網絡,它學習預測出自輸入圖像的顯著圖;多尺度殘差精煉模塊通過學習顯著圖和真值之間的殘差來優化預測模塊得到的顯著圖。

BASNet 整體架構。

預測模塊

受 U-Net[57] 和 SegNet[2] 的啟發,研究者在設計中將顯著目標預測模塊作為編碼器 - 解碼器網絡,因為這種架構能夠同時捕獲高級全局上下文和低級細節。為了減少過擬合,每個解碼器階段的最後一層都受到了 HED[67] 啟發的真值的監督。編碼器部分具有一個輸入卷積層和六個由基本殘差塊組成的階段。輸入卷積層和前四個階段均採用 ResNet-34[16]。

優化模塊

優化模塊(RM)[22, 6] 通常被設計成殘差塊,通過學習顯著圖和真值之間的殘差 S_residual 來細化預測的粗略顯著圖 S_coarse,其中:

在提出優化模塊之前,研究者定義了術語「粗略(coarse)」。在此,粗略包含兩方面的意思:一種是模糊和有噪聲的邊界(如下圖 3(b) 中 one-dimension(1D) 所示)。另一種情況是不均勻預測的區域概率(如圖 3(c) 所示)。

實際預測的粗略顯著圖通常包含兩種情況(見圖 3(d))。如下圖 4(a) 所示,基於局部上下文的殘差細化模塊(RRM LC)最初是用於邊界優化。

為了在粗略顯著圖中同時優化區域和邊界,研究者提出了一種新的殘差優化模塊,它採用殘差編碼器 - 解碼器架構 RRM_ Ours(如上圖 2 和下圖 4(c) 所示)。

RRM_Ours 的主要架構與預測模塊相似,但更加簡單,包含輸入層、編碼器、橋、解碼器和輸出層。與預測模塊不同的是,它的編碼器和解碼器都有 4 個階段,每個階段都只有一個卷積層。

混合損失

訓練損失被定義為所有輸出的總和:

為了獲得高質區域分割和清晰邊界,研究者提出將 ^ (k) 定義為一個混合損失:

其中,^ (k)_ bce 表示 BCE 損失, ^(k)_ ssim 表示 SSIM 損失, ^(k)_ iou 表示 IoU 損失,這三種損失的影響如下圖 5 所示:

實驗設置及結果

研究者在 6 個常用的基準數據集上對該方法展開評估,它們分別為 SOD、ECSSD、DUT-OMRON、PASCAL-S、HKU-IS 和 DUTS。

實驗採用的評估指標有 4 種,分別為精確率 - 召回率(Rrecision-Recall, PR)曲線、F 度量(F-measure)、平均絕對誤差(Mean Absolute Error, MAE)和 relaxed F-measure of boundary(relaxF^b_β)。

研究者首先驗證了模型中每個關鍵組件的有效性。控制變量研究包含兩部分內容:架構和損失,並且相關實驗在 ECSSD 數據集上展開。

下表 1 展示了控制變量研究的結果。可以看到,BASNet 架構在這些配置下實現了最佳性能:

為了進一步闡釋損失的定性效果,研究者在不同的損失設置下對 BASNet 進行訓練,結果如下圖 7 所示。很明顯,本研究提出的混合損失取得了非常好的定性結果。

此外,為了評估分割顯著性目標(salient object)的質量,研究者在圖 6 中展示了 ECSSD、DUT-OMRON、PASCAL-S、HKU-IS 和 DUTS-TE 等 5 個最大數據集的 PR 曲線和 F-measure 曲線。

如下表 2 所示,研究者展示了 BASNet 與其他 15 種方法在 SOD、ECSSD 等 6 個數據集上的最大 F-measure(maxF_β)、relaxed boundary F-measure(relaxF^b_β)和 MAE 結果比較:

最後,為了進一步闡釋 BASNet 的優越性能,研究者在下圖 8 中展示了與其他 7 種同類方法的定性比較結果,可以看到,BASNet 可以對不同挑戰性場景中的顯著性目標實現準確分割。

相關焦點

  • 隔空移物——超聲波的懸浮術
    很多人看過「懸浮術」的魔術表演,這種表演往往精彩萬分,令人嘆為觀止,但這類魔術畢竟是魔術師的障眼法,並無太多實際應用意義。
  • 「隔空移物」! 英科學家用聲波讓物體懸浮並移動
    @看看新聞 消息,隔空移物是科幻或武俠小說中的常見場景,而英國布里斯托大學的研究人員最近卻通過操控聲波將其實現。他們發表在美國《物理評論快報》新一期上的論文顯示,該校科學家設計了一種聲波旋渦,其結構類似龍捲風。再利用這一技術和頻率為40千赫的超聲波,成功讓一個直徑2釐米的聚苯乙烯小球懸浮起來。研究人員表示,該技術將應用在遙控進入人體藥物膠囊或微型手術設備等。隨著技術不斷完善,未來有望藉助聲波牽引讓人類懸在空中。原標題:不再是天方夜譚!
  • 不用PS 小白也能輕鬆搞定摳圖 免費智能批量在線摳圖教程 阿里出品!
    之前為小夥伴們分享過一個免費的在線摳圖工具,名叫「搞定摳圖」,使用非常簡單,相信用過的朋友不少。不過,這個在線工具前段時間開始收費,無法繼續免費使用。今天小編分享一款替代工具,支持免費智能批量摳圖,並且是阿里出品,穩定性更好!
  • 華人問鼎CVPR!最佳論文最佳學生論文一作均為華人,清華最高產機構
    在剛剛結束的CVPR 2020 開幕式上,悉數公布了本屆CVPR最佳論文、最佳學生論文等獎項。值得一提的是,兩個獎項的論文一作均為華人。論文連結:https://arxiv.org/pdf/1911.06971.pdf代碼地址:https://github.com/czq142857/BSP-NET-original這篇論文介紹了多邊形網格在深度學習特別是3D形狀生成中的運用。多邊形網格在數字3D領域無處不在,但在深度學習革命中,扮演了次要角色。
  • 8招小技巧拯救手殘黨,讓你在家也能輕鬆做美甲
    但是去美甲店做又貴又費時,自己在家做又做不好,手殘黨表示很無奈啊~今天Amy就為大家整理一篇簡單又好用的美甲小技巧,讓你們在家也能輕鬆做美甲,讓你們的指甲不再單調。這時候,你可以用膠帶來輔助,先塗上一層底色,然後用膠帶鋪出你想要的線條,塗上不用顏色的甲油,等甲油幹後揭開膠帶就可以了。3、海綿做漸變海綿不僅能去汙洗杯子,還能做漸變甲。
  • 這創意縫扣子神器,不用針線1分鐘縫好,手殘黨也能輕鬆搞定!
    在我們生活中有一句俗話「新三年,舊三年,縫縫補補又三年」,穿針引線這種細活還是要必備的技能,每當衣服有破損或者扣子掉落時,母親都會幫我們細心的縫製
  • CVPR 2017國內外亮點論文匯集:史上最盛大會議,華人佔據半壁江山
    深度學習界的「春晚」CVPR 2017 已在夏威夷火奴魯魯 Hawaii Convention Center 開幕,在本次大會接收的眾多論文當中,有華人參與的接近半數。這七百餘篇論文中有哪些亮點?眾多參會的中國研究機構又貢獻了多少?我們為你整理了一篇觀看指南。  不久之前,谷歌發布了 2017 版學術指標。
  • 手殘黨福音!NVIDIA 展示新款 AI 繪圖軟體 幾秒畫出逼真風景
    手殘黨福音!2019年03月19日 10:51作者:陸添智編輯:陸添智文章出處:泡泡網原創   3月19日消息,你想要輕點幾下就繪製出幾近真實的圖像嗎
  • 這款一鍵摳圖工具幫你!
    今天給大家分享一款好用的摳圖軟體,簡單幾步,即可去除圖片背景。如何去除圖片背景傲軟摳圖是一款專業的智能摳圖軟體,只需你上傳圖片,它會自動識別圖片中的主要元素,然後去除其他多餘的背景如果你是去除人像背景,選擇「人像識別」,如果是其他圖片,選擇「其他識別」;本次主要是去除人像照片背景,點擊進入「人像識別」;傲軟摳圖
  • 手殘黨的福音?這解謎遊戲靠耳朵能通關,網友:4級英語有救了
    可這款推理解密類卻成為了手殘黨的福音,甚至能夠提高不少大學生的4級英語聽力考試成績。 這款遊戲真正的真相藏在案件之中,有的案件看似普通實際卻關係到玩家自身,疑案追聲將玩家的身份也代入進案件,只有玩到了最後玩家才能查明真相,不由得讓人拍案叫絕。
  • CVPR,華人包攬!斬獲全部獎項,近四成中國作者,清華最多
    金磊 發自 凹非寺量子位 報導 | 公眾號 QbitAI這屆CVPR,華人簡直大放異彩。怎麼說?來看下結果。經典論文獎除了最佳論文和最佳學生論文這兩個「重頭戲」,今年的經典論文獎之一,論文第一作者同樣也是華人。(經典論文獎,主要是為了鼓勵那些發表超過十年,對後續工作有較大影響的研究。)
  • 騰訊雲神圖推出人像分割新品,一鍵解決摳圖難題
    以往,圖片、視頻中要實現人像分割,需要運用PS軟體每張、每幀摳圖,不僅耗時耗力,摳圖效果也主要依賴於個人技術,難以掌控。騰訊雲神圖·人像分割通過領先的AI技術,可以迅速識別人像、全自動摳圖,秒速摳像。同時,像素級分割技術能很好的處理人的髮絲部分,整個畫面看起來自然不生硬。摳圖過程省時省心,且質量有保證。
  • 摳圖卻不會PS?安利5個傻瓜式在線摳圖網站!
    作為一枚新媒體從業者,我們難免會遇到需要摳圖的時候,如果這時不會PS,那就真的難受。 你以為我今天是來賣PS課程的?不!我來安利你幾個好用的摳圖網站。 remove.bg Remove,全自動摳圖網站,不需要註冊,點開網站上傳圖片,機器人就會幫你把人(狗)像摳出來。
  • 堪稱黑科技的AI一鍵摳圖網站
    去除照片背景,意味著你可以隨時隨地根據自己的需要替換背景,滿足設計或者「全球旅行」的夢想。當然就像很多PS夢想神器一樣,「去背」說起來容易做起來難,即便是修煉過的大神級人物,也要花費很長時間。近日有朋友向筆者推薦這樣一款在線摳圖神器,只需5秒就能100%完美去除背景,非常神奇!
  • 手殘黨福音!微信取消兩分鐘內刪除功能 網友:不用擔心「社會性死亡...
    手殘黨福音!
  • 1300篇!CVPR 2019錄取結果公布,7篇新鮮好文推薦
    篇論文被接收,接受率為25.2%。 今年CVPR的接收論文ID公布了!你是否上榜了呢?sle=true#gid=0 據統計,今年共計1300篇論文被CVPR 2019 接收,相比去年被接收論文數量增加了32.8%。今年的接收率為25.2%。
  • 烏木喉意念移物VS緋紅女巫紅魔法,誰會贏?網友:女巫會被秒殺!
    眾所周知,緋紅女巫的主要能力是混沌魔法和魔法球,能夠控制物體,控制人體,目標對象可以是任何物件,這似乎與烏木喉的極像?不覺得嗎?難道緋紅女巫的紅魔法和烏木喉意念移物是一樣的效果嗎?從電影設定和表現來看,如果不是因為劇情殺,或許滅霸沒出現之前,烏木喉是可以成為復仇者的超強反派敵人先出現的!
  • 論文黨必備!這5款超強的免費工具,實用又方便
    每年開始寫論文時,都有理科專業的小可愛吐槽:編輯公式實在是讓人崩潰!那麼,有哪些能夠快速編輯、獲取公式,省時省力的好工具呢?我整理了一下,大致挑出來5款免費、實用又方便的公式編輯器。不管是數學、物理,還是化學的公式和結構式,都可以快速搞定!
  • 超視覺拍攝系統 三星S10這波操作堪稱手殘黨之光
    確實,近幾年三星一改過去的保守低調,發力新格局,全面創新,更加注重用戶的體驗,這一點,從剛剛發布的S10系列上就能看出來。專治手殘黨的超清拍攝值得一提的是,S10+在屏上還不止挖了一個孔,而是兩個孔——1000萬+800萬的雙前置攝像頭,
  • 300篇 CVPR 2019 Oral 論文精選匯總,值得一看的 CV 論文都在這裡
    今年有超過 5165 篇的大會論文投稿,最終錄取 1299 篇,其中 Oral 論文近 300 篇。為了方便社區開發者和學術青年查找和閱讀高價值論文,AI 研習社從入選的 Oral 論文中,按應用方向挑選了部分精華論文,貼在本文。