擊敗谷歌搜圖!微軟圖像識別系統準確率世界第一

2021-01-18 遊民星空

  12月11日,在日前舉辦的第六屆「ImageNet圖像識別大賽」(ImageNet image recognition competition)中,微軟研究院的計算機圖像識別系統成功在幾個類別的測試中取得了第一名的好成績,同時也擊敗了包括谷歌、英特爾、高通以及其他一些初創企業和學術實驗室的產品。

  據悉,微軟在此次比賽中所使用的系統名為「圖像識別深度殘差學習」(Deep Residual Learning for Image Recognition),該系統由微軟研究員何愷明、張祥雨、任少卿和孫劍(均為音譯)組成的團隊開發。微軟在官方博客中表示,公司將在今後發表的論文中詳細對外介紹這一系統。

  「我們對神經網絡的訓練深度已經超過了150層,而這一『深度殘差學習』框架能夠進一步減少優化,同時整合極深度網絡,圖像識別的準確率也就會迎來提升。而且,這種準確率的提升是許多其他普通網絡所無法做到的。」一名微軟研究員如是說道。

  應該說,圖像識別技術近期已經得到了越來越多科技公司的追捧,因為他們都希望借這一系統改善內部系統及面向消費者的產品。

  值得一提的是,微軟此前已經通過幾款有趣的應用幽默化的展示了公司在這一領域的實力,比如該公司發布了「我看起來有多大」(How Old Do I Look?)以及「我的鬍子怎麼樣」(How’s My Moustache Doing?)這兩款妙趣橫生的應用。同時,微軟還通過微軟研究院發起的「牛津項目」(Project Oxford)試圖將這一圖像識別技術真正實現商業化。

據悉,第六屆「ImageNet圖像識別大賽」要求參賽方對來自圖片分享網站Flickr和搜尋引擎的10萬張照片進行精確定位,並將他們劃分到1000種目標類別下,其中包括狼蛛、iPod、清真寺、玩具店和數據機等。比賽中,微軟系統的分類錯誤率僅為3.5%,定位錯誤率則為9%。

  而在過去幾年,谷歌、初創企業larifai和NEC則一直在圖像分類準確率方面取得了不錯的成績。

  對此,微軟研究院的一名研究人員表示:「甚至連我們自己都敢不相信這一方案能夠取得這麼好的成績。」

  值得一提的是,中國網際網路企業百度並未參與今年的「ImageNet圖像識別大賽」。這主要是因為百度在去年的測試中存在嚴重違規行為,該公司隨後對此表示道歉,並解僱了要求初級工程師這樣做的團隊負責人。

  當時,美國網站MIT科技評論還特地撰文對百度在人工智慧測試中違規一事作出評論。該網站指出,相對於其他公司一周只購買2張彩票而言,百度的行為如同一周「購買了200張彩票」,此舉大大增加了其中獎概率。此後,主辦方對百度作出了禁止提交測試成績1年的處罰。

相關焦點

  • 碼隆科技推ProductAI平臺,想幫企業客戶低門檻實現「以圖搜圖」
    這款面向B端的產品是一個自助式的人工智慧視覺應用平臺,一是可以根據客戶提供的圖片及視頻數據,快速自助建立自己的「以圖搜圖」引擎,二是提供圖像處理的接口,幫助企業實現圖像標記、分類、聚類、定位、以圖搜圖等功能。客戶在幾乎不懂技術的情況下,基本只需要簡單的關聯圖像視頻資料庫、勾選需要的功能,即可實現該功能。目前,將於10月24日開放申請試用。
  • 如何尋找一張網圖出處,P站原圖查找,動漫片段,以圖搜圖(最全面最強教程)
    缺點:圖庫小,算法不夠優秀,搜索相似的圖片效果不好11.其他搜圖網址:如果無法正常打開,說明需要打開加速器CaptionBot地址:https://www.captionbot.ai微軟圖像識別,微軟開發的,能夠智能檢測圖片上的內容是什麼。
  • 世界第一!華為雲EI問鼎國際圖像識別領域「世界盃」
    【環球網智能綜合報導】近日,在第四屆國際圖像識別競賽WebVision中,華為雲EI 以82.97%的準確率擊敗來自全世界的94支參賽隊伍獲得冠軍。WebVision 競賽由蘇黎世聯邦理工(ETH)、Google Research、卡耐基梅隆大學(CMU)等共同組織,是目前圖像識別領域最權威的競賽之一,被業界譽為人工智慧「世界盃」,接棒曾經推動計算機物體分類準確率超過人類的ImageNet 競賽。
  • 反超谷歌,擊敗微軟!全球第一品牌易主,一年收入超18300億
    日前,世界品牌實驗室發布2020年度《世界品牌500強》榜單,雖然頭部企業依舊是老面孔,不過仔細觀察可以發現,很多品牌的名次都發生了改變,去年還在第二位置上的亞馬遜,今年反超了谷歌,並擊敗了微軟等企業,登上了榜首位置,成為全球第一品牌
  • 微軟、谷歌等支持全新圖像格式AVIF:壓縮效率更高、免授權
    JPEG、PNG這些圖片格式即將成為過去式,一種全新圖像格式開始獲得微軟、谷歌等巨頭的支持。作為一種新面世的圖像格式,AVIF最大的特點就是輕量和免授權。與現有的JPEG、PNG、甚至WebP等圖像格式相比,AVIF的壓縮效率可以做到更高。
  • 用衣袖的照片就能識別整件衣服?圖片搜索的想像力可能更大
    也有越來越多的創業者押注圖像識別賽道,在近日剛剛宣布完成新一輪超2億元融資的碼隆科技就是其中一家。  「我們在做的是商品識別的事情,在我們的平臺,不管你輸入任何商品的圖片,都能幫你快速地分辨出是什麼以及你想了解的其他信息。」碼隆科技創始人兼CEO黃鼎隆這樣向尋找中國創客(ID:xjbmaker)記者介紹說。  2014年,黃鼎隆離開微軟,成立碼隆科技。
  • 谷歌發明的由2D圖像生成3D圖像技術解析
    谷歌發明的由2D圖像生成3D圖像的技術,利用3D估計神經網絡圖像信息的補全以及預測,融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術對於三維建模以及工業應用都具有極大的指導意義。
  • 微軟/谷歌/蘋果/微美全息在5G+全息AR等領域展開競爭
    而如今,隨著技術的發展,我們距離虛擬的世界越來越近,以致於這些不用憑空想像,在你的手機或者電腦上就可以實現。做為科技行業的巨頭,蘋果、微軟、谷歌和臉書已經提前打響戰役。谷歌對虛擬實境的熱衷由來已久,早在2012年,谷歌就曾開發了一款智能眼鏡,也就是著名的Googleglass。
  • 碼隆科技 以圖搜圖帶來搜索的新革命
    主要產品/服務:人工智慧商品識別  融資輪次:B輪  創始團隊:CEO黃鼎隆,曾就職於谷歌、騰訊等公司  基於人工智慧的圖像識別技術應用,正在成為一門大生意,大公司、創業者紛湧而至,在近日剛剛宣布完成新一輪超2億元融資的碼隆科技就是其中一家。
  • AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌「攻破」
    一個是來自微軟的DeBERTa,一個是來自谷歌的T5+Meena。超越人類的兩大NLU模型對NLP領域的人來說,微軟DeBERTa模型並不陌生,早在去年8月微軟就開源了該模型的代碼,並提供預訓練模型下載。最近,最近微軟訓練了更大規模的模型,該版本由15億參數的48個Transformer層組成。
  • 騰訊「鑑黃師」:系統識別準確率達95% 支持「嬌喘識別」
    首頁 > 動態 > 關鍵詞 > 騰訊最新資訊 > 正文 騰訊「鑑黃師」:系統識別準確率達95% 支持「嬌喘識別」
  • Youtube自動字幕系統已能識別環境音,但國內還在依靠字幕組
    相比國內的野生字幕組,谷歌的技術宅們在2009年為Youtube上線了一個自動字幕系統(Automatic Captioning System),藉助人工智慧技術,在視頻裡實時生成字幕。時隔7年後,YouTube宣布已經有10億多條視頻採用了該系統生成的字幕,而全球日活躍用戶也達1500萬。
  • 網易AI Lab問鼎ACCV 2020細粒度網絡圖像識別賽
    近日,第十五屆亞洲計算機視覺學術會議ACCV 2020(Asian Conference on Computer Vision)國際細粒度網絡圖像識別賽公布最終成績,網易AI Lab以71.4%的準確率擊敗了來自全球的569個頂尖計算機視覺團隊,從超過1000份方案中脫穎而出
  • 9個以圖搜圖的識圖網站推薦
    下面總結了 9 個常用的識圖網站,方便大家通過以圖搜圖找到想要的圖片。以圖搜圖網站推薦常規圖片搜尋引擎1-5 為常用的圖片搜尋引擎,包括谷歌圖片、百度圖片等,都包含以圖識圖的功能。各種圖片都能識別,支持本地上傳和使用網絡圖片連結。# 1、谷歌識圖推薦!
  • 微軟新技術用「X光」來識別|硬科技
    記者 | 佘曉晨1識別Deepfake(深度偽造)有了新突破。近幾年來,鑑別人臉和視頻圖像的真假成為AI領域的重點課題。最近,微軟亞洲研究院計算機視覺組研究出一項新的識別技術Face X-Ray——給人臉圖像、視頻做「X光檢測」。
  • 『AI翻車』事件已超1000+,特斯拉,微軟、谷歌、蘋果等全部...
    在這項事故中,自動駕駛系統並未發揮作用,特斯拉的解釋是,分隔牆之前已被損壞,系統並未作出正確識別,同時在撞擊的前六秒,系統已發出了視覺和聽覺上的警告。但顯然,僅六秒的時間不足以讓駕駛員作出正確的應對。「殺手」機器人機器人是AI頻繁發生翻車事故的第二大領域。從列表來看,機器人在醫療、倉儲物流、、等多個場景中均發生過負面事故。
  • TensorFlow圖像識別驗證碼—實戰項目
    我將教大家如何簡單的用TensorFlow實現對數字驗證碼的高準確率識別。驗證碼圖像大小為160 x 60,並對驗證碼做好標註,其中幹擾信息有字符扭曲、曲線、噪點。劃分數據集驗證碼圖像預處理在訓練模型之前,先讀取好訓練集的數據,並對圖像進行預處理。
  • 「以圖搜圖」的奇葩用途 | 深度
    這些便是圖像的「特徵點」。而如果機器能夠和人一樣準確地識別兩張圖片中相同的「特徵點」,就可以實現以圖搜圖這種高科技了。但對於人眼來說易如反掌的刺激點,怎麼用機器語言記錄呢?【利用監控圖片搜索指定汽車】「增強現實」的工具但是,一輛車一定是以各個角度和姿態出現在監控圖像中,那麼識別系統為什麼可以做出相對準確的識別呢?
  • 飛利浦、微軟打造3D全息增強現實手術室,助力圖像引導微創療法
    雷鋒網消息 近日,微軟HoloLens 2首次亮相於在西班牙巴塞隆納舉行的世界移動通信大會(MWC)。基於飛利浦Azurion圖像引導治療平臺和微軟HoloLens 2全息計算平臺的最新技術,兩家公司展示用圖像引導微創治療的新型增強現實應用,打造未來手術室的混合現實概念產品。未來增強現實手術室與傳統手術相比,微創療法只需要一個小切口,導管等專用儀器便可通過切口深入心臟、血管、大腦、肝臟等其他主要器官治療區域。
  • 一張貼紙破解頂級FaceID,華為新研究讓人臉識別不再安全
    在這一新研究中,科學家們只需用普通印表機打出一張帶有圖案的紙條貼在腦門上,就能讓目前業內性能領先的公開 Face ID 系統識別出錯,這是首次有 AI 算法可以在現實世界中實現攻擊:AI 人臉識別系統在正常情況下的分類效果,它識別出了特定的人:Person_1。