為助計算機視覺實現新突破,谷歌發布最大人工和自然地標數據集

2021-01-10 DeepTech深科技

圖像分類技術在過去幾年中取得了顯著的進步,這在一定程度上體現在Imagenet 分類挑戰上,機器的誤差率每年都在大幅下降。

為了繼續推進計算機視覺技術的先進水平,許多研究人員現在更多地關注細粒度和實例級的識別問題,而不是識別一般實體,如建築物、山脈,當然還有貓,許多人正在設計能夠識別艾菲爾鐵塔、富士山或波斯貓的機器學習算法。

然而,這一領域研究的一個重大障礙是缺乏大量帶注釋的數據集。

而就在今天,谷歌在其官方博客宣布,發布 Google-Landmarks 數據集來推進實例級的識別,這也是世界上最大的人工和自然地標識別數據集。

Google-Landmarks 將作為 Kaggle 網站上地標識別和地標檢索挑戰發布,這將是 CVPR 18 地標研討會的重點。

該數據集包含二百萬多幅圖像,描繪了來自世界各地的三萬處獨特的地標,數據集類別的數量比常用的數據集大 30 倍。此外,為了促進這一領域的研究,我們是開源的深度本地特徵( DELF ),我們認為這是一種非常好的本地特徵描述方法,特別適合於這類任務。

地標識別與其他問題有一些顯著的區別。例如,即使在大型帶標註的數據集中,對於一些不太熱門的地標,也可能沒有太多的訓練數據。此外,由於地標通常是不動的物體,所以內部變化很小(換句話說,地標的外觀在不同的圖像中變化不大)。

因此,變化只會由於圖像捕獲條件而產生,如遮擋、不同的視角、天氣和光照,這與其他圖像識別數據集不同,其中特定類別的圖像(如狗)的變化可能更大。這些特徵也與其他實例級識別問題(如藝術品識別)有共同之處,

因此,谷歌希望這個新的數據集也能對其他圖像識別問題的研究有所幫助。

這兩項 Kaggle 挑戰將為研究人員解決這些問題提供了獲取帶標註的數據的途徑。識別軌跡挑戰是在測試集中建立識別正確地標的模型,而檢索挑戰則要求參與者檢索包含相同地標的圖像。通過 Kaggle 網站就能訪問到這個新的數據集。

相關焦點

  • Jeff Dean發谷歌年度官方「成績單」,點出未來4大重要挑戰
    展望已經開啟的新一年,谷歌希望解決的問題有:1、如何構建可以處理數百萬個任務並能自動學習新任務的機器學習系統?現有的機器學習系統仍以單點突破單個任務為主。2、如何在人工智慧的重要領域推進最新技術,例如避免偏見,增加可解釋性和可理解性,改善隱私和確保安全?
  • 7 Papers&Radios|字節跳動全球最大鋼琴MIDI數據集;谷歌新型...
    機器之心 & ArXiv Weekly Radiostation 參與:杜偉、楚航、羅若天 本周的重要論文包括字節跳動發布的全球最大鋼琴 MIDI 數據集,以及谷歌新型 Performer
  • 百度聯合發布全球最大中文自然語言處理數據共建計劃「千言」
    來源:證券時報網在8月25日舉行的百度大腦語言與知識技術峰會上,百度集團副總裁吳甜和百度技術委員會主席吳華分別發布百度語言與知識技術系列產品和數據集共建計劃,推出5款產品的新發布,全面加速AI技術大規模應用。
  • 人工智慧技術怎樣去突破算力極限
    「相比雲計算和大數據等應用,人工智慧對計算力的需求幾乎無止境。」中國工程院院士、浪潮集團首席科學家王恩東指出。 據介紹,人工智慧最大的挑戰之一是識別度不高、準確度不高,提高準確度就要提高模型的規模和精細度,提高線下訓練的頻次,這需要更強的計算力。
  • 都在說GPT-3和AlphaFold,2020沒點別的AI技術突破了?
    這一年人工智慧行業有哪些新進展?為全球疫情做了哪些貢獻?明年趨勢又將如何?數據科學社區Analytics Vidhya對此進行了總結。報告認為,2020年是巨大飛躍的一年。從OpenAI的GPT-3,再到AlphaFold,都是令人振奮的成就。與此同時,數據科學在機器學習、自然語言處理(NLP)、計算機視覺等領域中蓬勃發展。
  • 什麼是計算機視覺?什麼是機器視覺?
    然而,小夥伴們知道視覺對於機器人是多麼難能可貴嗎?我們平時所說的計算機視覺和機器視覺又有什麼區別呢?今天小編就為大家講一講什麼是計算機視覺、什麼又是機器視覺。首先在很多文獻中,計算機視覺與機器視覺是不加區分的,但其實這兩個術語既有區別又有聯繫的。
  • 谷歌AI造芯新突破!6小時設計AI晶片,質量超最先進算法
    智東西4月24日,谷歌用人工智慧(AI)設計晶片又有新進展!在昨日新發布的預印本論文中,谷歌團隊描述了一種深度強化學習方法,能在6小時內完成晶片布局設計,而完成相同設計步驟,人類專家往往要花費數周時間。
  • Jeff Dean親筆盤點谷歌AI 2019:日均2篇論文,縱橫16大方向
    這種方法可以實現機器學習許多方面的自動化,並且在某些類型的機器學習元決策方面,通常可以取得更好的結果,比如:Google展示了如何使用神經結構搜索技術,在計算機視覺問題上獲得更好的結果,其在ImageNet上的正確率為84.4%,而參數比以前的最佳模型少8倍。
  • 谷歌AI發布Deepfake檢測數據集,真人多場景拍攝,生成3000段假視頻
    谷歌AI昨日發布Deepfake視頻識別數據集,共包含3000多段視頻,由真人演員現場多場景拍攝。利用這些數據可以開發Deepfake自動檢測工具,更高效地識別Deepfake假視頻。>>> 深度學習的發展讓一些在幾年前看來完全不可能實現的技術變為可能。現代生成模型就是其中的一個例子,能夠合成超現實主義的圖片、語音、音樂甚至是視頻。
  • 淺談計算機視覺中的圖像標註
    什麼是計算機視覺?計算機視覺被認為是機器學習和人工智慧發展的重要領域之一。簡而言之,計算機視覺是人工智慧研究領域,致力於賦予計算機看世界和視覺解釋世界的能力。圖像標註圖像標註是計算機視覺的一個子集,是計算機視覺的重要任務之一。圖像標註就是將標籤附加到圖像上的過程。這可以是整個圖像的一個標籤,也可以是圖像中每一組像素的多個標籤。這些標籤是由人工智慧工程師預先確定的,並被選中為計算機視覺模型提供圖像中所顯示的信息。
  • 最新「智能時尚計算機視覺技術」綜述論文,200篇文獻總結概述
    時尚主要通過視覺來傳達,因此近年來受到了計算機視覺研究者的廣泛關注。鑑於智能時尚的快速發展,本文對200多部主要時尚相關工作進行了全面的綜述,涵蓋了實現智能時尚的四個主要方面: (1)時尚檢測包括地標檢測、時尚解析、時尚條目檢索等。
  • 愛爾康PanOptix自然視覺三焦晶體上市
    該晶體為首個通過美國FDA認證的三焦點人工晶狀體,依託於愛爾康久經驗證的AcrySof平臺,PanOptix通過四焦點技術實現了中間焦點的移動,突破傳統三焦點技術對中距離視力的限制,實現了清晰度、權威性、安全性、舒適度、滿意度五大升級。產品的上市有望助力我國中老年白內障群體大幅改善視覺質量,獲得遠、中、近全程清晰的視覺體驗,盡情享受輕鬆、自由的幸福晚年生活。
  • 衣+獲ImageNet2015計算機視覺競賽五項世界第一
    原標題:衣+獲ImageNet2015計算機視覺競賽五項世界第一   素有國際「計算機視覺奧林匹克」之稱的 ImageNet2015競賽結果揭曉。此次比賽有微軟、谷歌、英特爾、三星、高通、騰訊、百度、斯坦福、東京大學、港中文、UIUC等工業界和學術界巨頭參與,來自中國的北京陌上花科技有限公司(衣+)團隊三名成員率隊奪得五項世界第一。
  • 淺談計算機視覺中的圖像標註_易車網
    更進一步的說,計算機視覺是一門研究如何使機器「看」的科學,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計算機視覺的應用非常廣泛,從自動駕駛汽車和無人機到醫療診斷技術和面部識別軟體,計算機視覺的應用是巨大的和革命性的。
  • ​《2020科技趨勢報告》重磅發布,AI 和中國,成為未來科技世界...
    大學的研究人員和實驗室依靠這些公司提供數據、工具和資金。九大人工智慧公司也對人工智慧合併和收購產生了巨大影響,為人工智慧初創公司提供資金並為下一代開發人員提供支持。」 2.6 環境監測 關門後發生的事情可能不會是長期的秘密,高管們應該提防新的環境監測方法。人工智慧可能很快擁有 x 光視覺能力,這對從事敏感項目的公司來說可能不是什麼好消息。從事信息安全和風險管理工作的人應特別關注計算機視覺的發展。 3.
  • 我國量子計算機實現算力全球領先
    這一突破使我國成為全球第二個實現「量子優越性」的國家,牢固確立了我國在國際量子計算研究領域的領先地位。與通用計算機相比,「九章」還只是「單項冠軍」。但其超強算力,在圖論、機器學習、量子化學等領域具有潛在應用價值。12月4日,《科學》雜誌發表了該成果,審稿人評價這是「一個最先進的實驗」「一個重大成就」。
  • Google更新最大的帶注釋圖像數據集,添加本地化敘述
    宣布發布 Open Images V6,和 V5 版本相比,它極大地擴展了 Open Images 數據集的注釋,增加了大量新的視覺關係(例如,「狗抓飛盤」)、人類動作注釋(例如,「女人跳躍」)和水平圖像標籤(例如,「paisley」)。
  • 蘇州相城區發布智能駕駛「上路計劃」,福特開放自動駕駛汽車數據集
    據Momenta發布的聲明,雙方依據一項戰略合作協議,將致力於開發豐田的自動地圖生成平臺(AMP)。據悉,Momenta的高精地圖基於視覺方案,結合深度學習的感知技術和視覺建圖定位技術(SLAM),可實現自動化的高精地圖建圖,相對精度可達10cm級別。在數據豐富度上,Momenta的地圖不僅包括如交通牌、路杆、車道線、紅綠燈、道路標識等幾何要素,也包括道路級、車道級別的語義連接關係和語義信息。
  • 美國公開新冠數據集欲借力AI,人工智慧如何參與全球戰「疫」?
    前幾日,美國白宮與微軟、谷歌等公司合作,彙編了最大的新冠病毒學術論文庫,呼籲研究人員用AI技術分析這近3萬篇學術論文,期望發現人類可能錯過的重要問題。除此之外,預測研判、檢測診療、疫情防控,這套AI「組合拳」還亮出了不少花式操作。
  • 愛爾康PanOptix自然視覺三焦晶體震撼上市
    該晶體為首個通過美國FDA認證的三焦點人工晶狀體,依託於愛爾康久經驗證的AcrySof平臺,PanOptix通過四焦點技術實現了中間焦點的移動,突破傳統三焦點技術對中距離視力的限制,實現了清晰度、權威性、安全性、舒適度、滿意度五大升級。產品的上市有望助力我國中老年白內障群體大幅改善視覺質量,獲得遠、中、近全程清晰的視覺體驗,盡情享受輕鬆、自由的幸福晚年生活。