使用Unity感知工具大批量生成、分析合成數據,高效地訓練ML模型

2020-12-09 騰訊網

合成數據可降低獲取標註數據的難度,方便機器學習模型的訓練。本文屬於合成數據系列第二篇,我們將用一個對象檢測的例子,來介紹Unity生成和分析合成數據集的各種工具。

在系列首篇文章中(點擊回看),我們討論了搜集大量標籤圖像、訓練機器學習模型完成電腦視覺任務時遇到的各種挑戰。還討論了Google Cloud AI和OpenAI的最前沿研究,在物體檢測等類似任務中使用合成數據的可行性。

然而,搜集合成數據、製作可用於訓練的數據集是十分複雜的,一不小心就會有所疏漏。這導致開發者往往不得不編寫一些一次性的方案來生成數據,然而這些數據的效果通常不理想。今天,我們為大家介紹兩款全新工具:Unity Perception Package和Dataset Insight,它們可以刪繁就簡,讓高質量合成數據集的生成和分析更為簡單。

Unity Perception 功能包

Unity Perception 功能包捕捉到的RGB、2D包圍盒以及其它度量信息

Unity Perception 功能包能夠以全新的方式在Unity中合生成合成數據集,且同時支持通用渲染管線(URP)與高清渲染管線(HDRP)。在初版中,功能包帶有捕捉數據集的工具,包含4種基本功能:添加對象標籤、貼標器、圖像捕捉和自定義度量衡。用戶在功能包中輸入對象標籤的相關信息,接著功能包會自動挑選信息、將其反饋到貼標器中。貼標器使用該信息來生成Ground Truth真值數據,象是3D包圍盒或語義分隔遮罩。經過處理的真值會與相關度量衡一起儲存到JSON文件中。

我們計劃在未來添加更多的貼標器,比如實例分隔,來支持其它常見的計算機視覺任務;場景生成工具;配置、管理大批domain randomization(域隨機化)參數的功能,以及雲服務的規模擴展。

Data Insights數據分析

任何ML從業者都明白查看、分析帶標註數據的重要性。而在合成數據集中,雲端模擬可生成上百萬的圖像,數據集會變得非常大。Dataset Insights是一款Python功能包,可讓大型合成數據集的數據運算、報告生成更為簡單高效。功能包可根據不同的度量衡,利用本地設備或雲端服務,在每幀上可視化整個數據集運算積累而成的統計數據。

在下面,我們將介紹如何使用Unity Perception Package和Dataset Insights來生成合成數據集,訓練一個可檢測商品、並為其貼上標籤的物品檢測模型。所有工具都具備通用性,也適用於其他環境和計算機視覺任務。我們的目標是讓更多ML從業者可利用起合成數據來解決各式各樣的需求。

3D資源製作

在Google Cloud AI最近的一次研究中,谷歌使用了64種常見商品,包括麥片與紙巾,來驗證了只用合成數據訓練物體檢測模型的可行性。我們受到研究啟發,使用了與原產品大小、形狀和紋理變化相近的同數量產品來進行訓練。

我們使用數字內容創作工具、掃描標籤和攝影掃描來製作了一整個庫的商品3D資源。還將現實圖像貼在方塊、球體和柱狀體這類簡單形狀上,來製作背景和遮擋物資源。所有商品都帶有通用渲染管線、Shader Graph製作而成的著色器。

場景製作

我們在背景貨架上放置了3D資源,又加入了形狀、紋理上的幹擾讓場景更為複雜。多樣化的訓練場景可讓訓練出的ML模型能應付現實中的大部分場景。

Unity編輯器中的場景視圖,展示了各個資源的擺放

自左向右:遮擋物體、商品3D資源、和背景貨架資源

在每個渲染的Loop循環中,系統會隨機生成前景、背景和遮擋物體的擺放位置,以及燈光、物體顏色、模糊效果和噪聲幹擾。如下方代碼所示,Perception功能包會抓取RGB圖像、對象包圍盒和其它隨即參數來生成數據集中的每個圖像。

Unity Perception生成的帶註解數據輸出

從合成數據集中採樣而來的帶標籤圖像

使用Dataset Insights分析數據

在大型合成數據集中,要人工檢查所有圖像幾乎是天方夜譚,而識別中的偏差、缺失、瑕疵、錯誤的擺放位置、擺放姿勢等等問題都會讓ML模型的表現無法達到最優。

在本例中,生成的對象集會被送入Dataset Insights,用於計算統計數據、訓練ML模型。Insights能高效處理用於對象檢測模型訓練的圖像數據,確保數據是有效的。部分數據集的總結數據在下方列出。

Dataset Insights中的表格,展示了數據集中各個對象的分布

通過表格可知商品被識別次數沒有出現過多或過少的情況

在測試階段,我們遇到過部分對象多次出現在一幀中的異常情況,在對象計數的可視化圖表中也有體現。對此,我們迅速修復了問題,確保對象能平均地分布到整個數據集中。

數據集中每個例子的對象計數分布

雖然我們希望數據集的對象分布能平均分散在每幀上,但也希望ML模型具有在數量或多或少的圖片中檢測多個對象的能力。上方表格展示了數據集每幀中所出現的標籤對象,對象跟隨一個固定的正態分布模式,每幀約有7個對象。

不同光源位置的可視化圖表。每個點都表示影響目標對象的光源。為了模擬現實世界中的光照條件,我們還多樣化了場景光照的方向和顏色。在上圖中,光源位於不同的位置,讓數據集中捕捉到的光照和陰影都有不同。

Unity Simulation:大規模模擬合成數據集

為了在模擬中體現出儘可能多的排序組合,我們使用了Unity Simulation雲服務,在雲端運行項目,生成訓練計算機視覺模型所需的完整數據集。

在下一篇文章中,我們將進一步介紹如何使用Unity Simulation生成大規模數據集,來訓練機器學習模型、與真實數據做比照,討論合成數據帶來的經濟效益,及幾個模擬過程中學到的關鍵點。

Perception工具完全免費,請在Github上下載工具和對象檢測示例。如果想要擴大數據集規模,歡迎註冊使用Unity Simulation (Beta)雲服務。

*文中所有商標均為企業私有財產

相關焦點

  • Unity Perception工具 | 使用合成數據訓練出強大的物體檢測ML模型
    合成數據的出現降低了大量搜集帶標籤數據集的難度,可輔助機器學習模型的訓練。  本文屬於「使用Unity生成合成數據」系列第三篇。在第一篇中,我們討論了在為計算機視覺訓練機器學習模型時,搜集大量帶標籤圖像會面臨的。最近,我們又展示了如何使用Unity的認知訓練工具來。
  • 如何高效快速準確地完成ML任務,這4個AutoML庫了解一下
    auto-sklearnauto-sklearn 是一個自動機器學習工具包,它與標準 sklearn 接口無縫集成,因此社區中很多人都很熟悉該工具。通過使用最近的一些方法,比如貝葉斯優化,該庫被用來導航模型的可能空間,並學習推理特定配置是否能很好地完成給定任務。
  • NVIDIA Research使用有限的數據集實現AI訓練突破
    數據訓練的困境 像大多數神經網絡一樣,GAN長期遵循一個基本原則:數據訓練量越多,模型越完善。這是因為每個GAN都由兩個配合的網絡組成——一個生成合成圖像的生成器,以及一個根據訓練數據來學習逼真圖像的鑑別器。 鑑別器會指導生成器,提供逐個像素反饋,以幫助其提升合成圖像的真實感。
  • Parallel Domain融資1100萬美金 為自動駕駛系統等AI模型提供合成...
    蓋世汽車訊 據外媒報導,當地時間12月9日,合成數據生成平臺Parallel Domain宣布從A輪融資中籌集了1100萬美元的資金。  據估計,單單自動駕駛汽車公司每年就需要花費數十億美元用於收集和標註數據。第三方承包商招募了成千上萬的人工數據標註師來繪製和跟蹤機器學習模型需要學習的注釋。一個得到正確標記的數據集可以為模型提供真實情況,以檢查模型的預測是否準確,並可持續優化模型的算法。但是,隨著對性能的要求越來越高,管理數據分布與頻率都適當的數據集變得越來越困難。
  • 學好大數據,六個數據模型工具推薦
    在實際行業運用的過程中,為了避免人為錯誤並且加快進度,我們需要使用專業的軟體來幫助我們建立數據邏輯模型和物理模型、生成DDL,並且能夠生成報告來描述這個模型,同時分享給其他夥伴。本文列出的工具都是精挑細選的數據建模工具,推薦給大家使用。PowerDesignerPowerDesigner是目前數據建模業界的領頭羊。
  • Github Star 7.2K,超級好用的OCR數據合成與半自動標註工具,強烈...
    12 月,它又帶來四大新發布與升級,核心內容先睹為快: 全新發布數據合成工具 Style-Text:可以批量合成大量與目標場景類似的圖像,在多個場景驗證,效果均提升 15% 以上。全新發布 OCR 數據合成工具:Style-Text相比於傳統的數據合成算法,Style-Text 可以實現特殊背景下的圖片風格遷移,只需要少許目標場景圖像,就可以合成大量數據,效果展示如下:1、相同背景批量數據合成2、相同文字批量數據合成
  • 「金猿產品展」ModelWhale——高效好用的數據科學雲端協作工具
    本產品由和鯨科技投遞並參與「數據猿年度金猿策劃活動——2020大數據產業創新服務產品榜單及獎項」評選。ModelWhale 是和鯨科技自主研發的一款數據科學雲端協作工具,為數據工作者提供了即開即用的雲端分析環境,用戶可以高效地完成數據管理、編程分析、模型訓練、模型管理、資源管理、任務管理等工作。
  • 數據不夠,Waymo用GAN來湊:用生成圖像在仿真環境中訓練模型
    這隻GAN,名叫SurfelGAN,能基於無人車收集到的有限的雷射雷達和攝像頭數據,生成逼真的相機圖像。用GAN生成的數據訓練,還是訓練自動駕駛汽車,這到底靠譜不靠譜?接著,通過GAN生成逼真的相機圖像。表面元素場景重建為了忠實保留傳感器信息,同時在計算和存儲方面保持高效,研究人員提出了紋理增強表面元素地圖表示方法。
  • 微軟「可縮放」新框架只需2D數據即可生成逼真3D模型
    微軟開發首個針對2D數據的3D模型的「可縮放」訓練技術最在一份新的預印本論文中,來自Microsoft Research的團隊詳細介紹了一個框架。研究人員稱,該框架是首個針對2D數據的3D模型的「可縮放」訓練技術。
  • 用2D圖像生成3D模型,微軟新AI模型或成遊戲業福音
    近日,微軟研究院(Microsoft Research)的研究團隊發表了一篇預印論文,他們在論文中詳細介紹了一個新的AI框架,該框架採用「可縮放」訓練技術,可將2D圖像進行3D形狀的模擬生成。研究人員表示,在使用2D圖像進行訓練時,該框架始終可以比現有的模型生成效果更好的3D形狀,這對於遊戲開發、視頻製作、動畫等領域是一個極佳的自動化工具。
  • 中國科學院研發AI人像生成模型 人臉合成技術超出預期
    該模型可以依據簡筆畫生成逼真的人臉肖像。利用這一模型,沒有繪畫經驗的人也可以很容易地得到逼真圖像。除了用於娛樂,在未來,這個模型或能幫助執法人員進行嫌疑人畫像。二、60位參與者打分1302次,證實模型輸出結果更逼真模型搭建好後,研究人員使模型在一臺搭載了一個英特爾i7-7700 CPU和一個NVIDIA GTX 1080Ti GPU、擁有16GB內存的電腦上運行,用17000張簡筆畫和照片進行訓練。訓練結束後,研究人員對模型進行了評估。研究人員首先用線條不同的簡筆畫作為輸入。
  • 數據故事化:從數據感知到數據認知
    其中,數據驅動型故事化(Data-Driven Storytelling)[6]強調的是故事敘述的一種形式,區別於模型驅動和目標驅動的敘述方式;可視故事化(Visual Storytelling)[7]主要強調的是故事敘述中可視化呈現的重要性;分析型故事化(Analytical Storytelling)[8]則強調的是數據分析在數據故事化中的重要地位,數據故事化並非是簡單地將數據改編成故事,而是在對數據進行分析挖掘的基礎上
  • 從數據可視化到交互式數據分析
    現實,數據/統計模型。人類心理模型之間的關係。這個關係是這樣的:數據/模型是我們想要研究的一些現實的描述。人類對現實有一個心理模型,並使用數據/模型來研究它,以便可以更好地理解它。從數據分析中獲得的更多理解將如何使你更接近你的目標?(2)生成問題難題說明通常太高級且寬泛,無法直接轉換為數據分析操作(這個問題經常被忽視且未被充分理解)。通常,需要將難題(隱式地,或者更好地,顯式地)轉換為許多數據分析問題。
  • 如何用決策樹模型做數據分析?
    決策樹是一種簡單高效並且具有強解釋性的模型,廣泛應用於數據分析領域。簡單:邏輯相對簡單,整個算法沒有更複雜的邏輯,只是對節點進行分叉;高效:模型訓練速度較快;強解釋性:模型的判斷邏輯可以用語言清晰的表達出來,比如上述決策樹案例中的判斷,就可以直接用語言表述成:脫離水不能生存的沒有腳蹼的動物,我們判斷它是魚
  • Amazon SageMaker上線國內 非專業人士也可快速訓練ML模型
    2017年11月時,AWS推出了Amazon SageMaker 機器學習平臺服務,以幫助機器學習開發者和數據科學家快速構建、訓練和部署模型。Amazon SageMaker 消除了機器學習過程中各個步驟的繁重工作,讓開發高質量模型變得更加輕鬆。
  • 滴滴開源自然語言理解模型訓練平臺DELTA | ACL 2019
    DELTA,以進一步幫助 AI 開發者創建、部署自然語言處理和語音模型,構建高效的解決方案,助力 NLP 應用更好落地。、命名實體識別、自然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等重要算法模型,形成一致的代碼組織架構,整體包裝統一接口。
  • 哈佛推出這款工具包,10行代碼訓練「藥神」模型
    這款名為DeepPurpose的工具包,不僅包含COVID-19的生物測定數據集,還有56種前沿的AI模型。作為一個基於PyTorch的工具包,DeepPurpose只需要不到10行代碼,就能訓練出AI「藥神」模型。這些模型不僅能完成虛擬篩選,還能挖掘出已有藥物的新功能(例如,高血壓藥物可治療阿爾茲海默症)。
  • 人類穿著數據集3DPeople發布,微軟建立人工智慧商學院
    本周關鍵詞:反向傳播、目標跟蹤、CNNs、身份再識別、合成視覺神經系統本周熱門學術研究利用進化後的反向傳播算法實現快速、高效的訓練在最新的機器學習自動搜尋方法的推動下,一些谷歌研究人員提出了一種自動生成反向傳播方程的方法。
  • 【極道智能數據系統】直擊AI訓練痛點,助力自動駕駛
    海量的圖像和雷達數據在進行清洗、標記、存儲後,被用於訓練算法、學習道路規則、並發現車輛運行的深層神經網絡中的潛在故障,然後不斷地迭代循環執行上述訓練步驟,直到滿足自動駕駛對精度的訓練需求。面對多樣化的數據來源,數據存儲和數據管理也是自動駕駛訓練所面臨的主要挑戰。
  • 玩轉StyleGAN2模型:教你生成動漫人物
    由於其有趣的應用,如生成合成訓練數據、創造藝術、風格轉換、圖像到圖像的翻譯等,這個話題在機器學習界真的很受歡迎。GAN架構 [圖片由作者提供]GAN由2個網絡組成,即生成器和鑑別器。生成器將嘗試生成假樣本,並愚弄鑑別器,使其相信是真實樣本。鑑別器將試圖從真假樣本中檢測出生成的樣本。