殘差學習,152層網絡,微軟奪冠2015 ImageNet計算機視覺識別挑戰

2021-02-21 CSDN雲計算

美國東部時間2015年12月10日，微軟亞洲研究院視覺計算組在2015 ImageNet計算機識別挑戰賽中憑藉深層神經網絡技術的最新突破，以絕對優勢獲得圖像分類、圖像定位以及圖像檢測全部三個主要項目的冠軍。同一時刻，他們在另一項圖像識別挑戰賽MS COCO（Microsoft Common Objects in Context challenges，常見物體圖像識別）中同樣成功登頂，在圖像檢測和圖像分割項目上擊敗了來自學界、企業和研究機構的眾多參賽者。

在此次挑戰賽中，微軟亞洲研究院的研究團隊使用了一種前所未有的深度高達百層的神經網絡，這比以往任何成功使用的神經網絡層數多5倍以上，從而在照片和視頻物體識別等技術方面實現了重大突破。

ImageNet挑戰賽去年獲勝的系統錯誤率為6.6%，而今年微軟亞洲研究院視覺計算組的系統錯誤率已經低至3.57%。事實上，該研究團隊早在今年一月就首先實現了對人類視覺能力的突破。當時，在題為「Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification」的論文中，他們系統的錯誤率已降低至4.94%。此前同樣的實驗中，人眼辨識的錯誤率大概為5.1%。

微軟全球資深副總裁、微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文博士表示：「微軟亞洲研究院視覺計算組在此次ImageNet挑戰賽中所取得的出色成績，不僅是微軟在深層神經網絡的研究和應用上所取得的科學突破，同時也代表著計算機視覺技術在目標識別方面的又一次飛躍。我對研究組多年來的技術積累、探索和成果倍感驕傲，同時也對這一突破對其它研究領域的推動以及相關產品的轉化充滿期待。」

微軟亞洲研究院視覺計算組首席研究員孫劍博士帶領的團隊在深層神經網絡方面進行了算法的更新，並稱之為「深層殘差網絡」（deep residual networks）。目前普遍使用的神經網絡層級能夠達到20到30層，在此次挑戰賽中該團隊應用的神經網絡系統實現了152層。該研究團隊還使用了一個全新的「殘差學習」原則來指導神經網絡結構的設計。「殘差學習」最重要的突破在於重構了學習的過程，並重新定向了深層神經網絡中的信息流。它很好地解決了此前深層神經網絡層級與準確度之間的矛盾。孫劍表示：「從我們極深的深層神經網絡中可以看出，『深層殘差網絡』力量強大且極為通用，可以預見它還能極大地改善其它計算機視覺問題。」

微軟亞洲研究院多年來在計算機視覺領域的研究成果已經轉化到眾多微軟的智能產品和服務中，包括微軟牛津計劃中的人臉識別和圖像識別API、Windows 10中的Windows Hello「刷臉」開機功能、必應的圖像搜索、微軟小冰的多個圖像「技能」，OneDrive中的圖片分類功能，以及廣受好評的口袋掃描儀Office Lens等等。

ImageNet是一個計算機視覺系統識別項目，也是目前世界上圖像識別最大的資料庫。ImageNet挑戰賽每年舉辦一次，由來自全球頂尖高校、企業及研究機構的研究員組織舉辦，近年來已經成為計算機視覺領域的標杆。MS COCO資料庫由微軟資助建立，其挑戰賽目前由學術界幾所高校聯合組織，獨立運行。

相關論文下載：http://arxiv.org/abs/1512.03385

本文為CSDN原創文章，未經允許不得轉載。

長按指紋即可關注哦！每天都會為你推薦有趣有用的資料！喜歡就分享給更多人吧！

相關焦點

計算機視覺:從入門到精通,極限剖析圖像識別學習算法

本次課程將圍繞著計算機視覺中最常見的RCNN圖像識別算法進行極限剖析，從數學理論，模型框架到實踐實操，讓你在短時間內從理論到實踐，掌握深度學習的基本知識和學習方法。· 目的：掌握神經網絡的基本原理，知其然亦知其所以然（從數學實踐到代碼的熟練和精通）; · 手段：科學的方法。
【組圖】計算機圖像識別趣圖:一個男人把一個紅蘋果放在嘴邊

來源：TwitterAI WORLD 2016世界人工智慧大會倒計時32天【新智元導讀】近來計算機視覺技術尤其在圖像識別方面得到了長足發展，日前有新聞報導稱系統能通過像素分辨出人臉，還有消息說計算機的下一個挑戰就是用照片生成視頻了。
貓臉識別系統:愚蠢的鏟屎官都有面部識別了,朕也得有!

「要不在後門整個貓臉識別儀？」有了這個大膽的想法後，Arkaitz 便利用空閒時間組裝了一個設備，上面有一個小相機，一個動態探測感應器，一個面部識別AI軟體，還有一個可以推送消息的App。當「識別儀」探測到前面有東西在動時，它就會拍個照，然後上傳至亞馬遜的免費雲端 AWS Rekognition 圖像識別 AI 軟體。之前，Arkaitz 已經在這個平臺上傳了很多 Bobis 的照片。
學界 KDD 2016 演講和論壇視頻出爐:深度學習是一切問題的終極答案嗎?

我們在歷史最高記錄時都對此毫無疑問：在過去的幾年中，我們見證了視覺、語音識別、遊戲、翻譯等領域的非同尋常的發展。同時，亞馬遜、蘋果、Facebook、微軟這些公司正在深度學習研究和設施方面進行巨額投入。機器學習的競爭被深度學習方法主導，開源的深度學習軟體正在快速增長，流行的媒體也在支持這個過程，同時也餵養著意外後果的黑暗幽靈。所以深度學習會是所有問題的答案嗎？
微軟的2015
【技術】物聯網感知層進入技術創新爆發期

《年報》顯示，物聯網感知層進入技術創新爆發期。全球晶片技術創新突破摩爾定律「天花板」，標誌性事件是勞倫斯伯克利國家實驗室1nm分子級電晶體研發成功。同時，ARM等公司推出32位微控制器，更好地適應低功耗和永遠在線的發展需求。新一代傳感器朝智能化、微型化方向發展，出現雷射雷達、生物發光傳感器、複合觸摸傳感器、汽車指紋傳感器、3D成像傳感器等創新型產品。
快訊:Honeywell全球最強量子計算機問世

在未來三個月內，霍尼韋爾將把全球量子體積（Quantum Volume）最強大的量子計算機推向市場。量子體積是用於度量量子計算機性能的指標，而不是僅僅以量子比特（Quantum Bit）數量作為度量標準。量子體積更準確全面地度量了量子計算機的能力，包括度量可解決問題的複雜程度等。霍尼韋爾即將發布的量子計算機，其量子體積將至少達到64，是業界未來第二排名的兩倍。
30萬人通過這門課尋找幸福——2015 edX課程大盤點

剛剛過去的2015年對edX來說又是飛速成長的一年，一批充滿熱情的新夥伴加入edX大聯盟，給我們帶來更多樣的學習體驗。
口語100移動端:英語學習APP王中王 (The King of English Learning APPs)

有一款神奇的外語學習的APP，它包含和超越了所有現在著名的外語學習APP的功能，目前在中小學廣泛使用，2016將向更大範圍的人群推廣，這就是--口語100網絡學習空間學生APP，在經過了暑假重大改版後，4.0版隆重在開學推出，不僅更加穩定，而且功能大大增強！
伯克利深度學習專題課程:對抗生成網絡創始人首次剖析訓練實例(44PDF下載)

伯克利這套課程還在進行中，本文特附詳細課程表及報名地址，官網還有更多資料下載【回復「1024深度學習」下載PPT全文（PDF格式）；點擊閱讀原文觀看 AI WORLD 2016 世界人工智慧大會主論壇視頻回顧】
西北石油局老年大學計算機培訓

2014年7月14日至7月28日，新洲培訓學校鐵路局校區舉辦了為期十天的「西北石油局老年大學計算機培訓」，主講教師為徐寧老師。此次學習的目的主要是通過學習計算機的基礎知識，了解並掌握如何使用網絡，以達到老年人通過學習來豐富自己的精神生活。
計算機視覺方向0128

(6篇)[1]：Bottleneck Transformers for Visual Recognition標題：視覺識別的瓶頸變壓器作者：Aravind Srinivas, Tsung-Yi Lin, Niki Parmar, Jonathon Shlens, Pieter Abbeel, Ashish Vaswani備註：Technical Report, 20 pages
Surface Book:微軟做錯和做對了什麼

然而，儘管新的Surface Book很優秀，但它也存在一些明顯的疏漏，讓這款設備的光芒變得黯淡了一些。要了解關於Surface Book的背景知識，我們且從微軟發布會之前流傳的一些傳聞和猜測說起。在微軟舉行發布會的數周之前，我曾撰文盤點Surface Pro 4令人期待的新特性。
臥槽:微軟又推出新的開源網站!

這不是微軟唯一的開源網站，但卻代表了新的起點。這個網站本身是開源的，內容也是關於開源的，同時提供一些開源服務。微軟又雙叒「搞」開源了！是的，如果一個Github還不夠，那就在開源一個開源網站！這次是真的全面擁抱開源了！
評測:微軟強烈推薦Windows10殺毒軟體

隨著Windows10的更新優化，使用Windows10的用戶也越來越多，而對於微軟而言，在Windows10進一步推廣之時，把自家Defender
(9)足球·奪冠——全日本關注!重溫星稜高中奪冠之路

可以說，每一集都有讓我感觸的片段，和更多更多我們值得學習的地方。接下來，讓我們看看今天的足球故事。通過星凌高中的奪冠，我們可以看到，整個團隊的每一個人，都是把足球看成是最重要、最大努力付出的事業，投入無比的專注和熱誠去共同完成的目標。
微軟Build 2017:新設計、新功能和潤物無聲的 Windows 10

雖然微軟很按時，但有點奇怪的是，今年在網際網路和社交網絡上，很少看到關注 Build 和討論 Build 的聲音，難道是微軟過氣了嗎，甚至討論堅果 Pro 的聲音都比微軟要高得多。還有誰在乎微軟究竟說了點什麼呢？ Fluent Design
2015環湖(國際)電動汽車挑戰賽在塔爾寺巡遊祈福

馬振龍攝　　 6月15日上午，2015環青海湖(國際)電動汽車挑戰賽踏上了本屆賽事的巡遊之路，並在湟中縣塔爾寺舉行了「人與自然永恆環保」祈福活動，賽事吉祥物——中華對角羚在活動中亮相。　　上午十點，參加巡遊的車隊駛入塔爾寺，車手們一下車，塔爾寺內的僧人便為他們獻上了象徵大地的黃色哈達，表達對車手們的友好和欣賞，更寄託著對2015環青海湖(國際)電動汽車挑戰賽的祝福。
品牌百強榜:現實中微軟地位以及對社會的影響

微軟的地位微軟在2013年在世界500強企業排行榜中排名110位，2014年排名第104位。2015年1月，在第66屆艾美獎上，國家電視藝術和科學學院為微軟頒發了「電視功能強化設備獎」。2015年7月9日，微軟宣布對手機業務進行根本性重組，同時表示將削減至多7800個職位。

殘差學習,152層網絡,微軟奪冠2015 ImageNet計算機視覺識別挑戰

相關焦點

計算機視覺:從入門到精通,極限剖析圖像識別學習算法

【組圖】計算機圖像識別趣圖:一個男人把一個紅蘋果放在嘴邊

貓臉識別系統:愚蠢的鏟屎官都有面部識別了,朕也得有!

學界 KDD 2016 演講和論壇視頻出爐:深度學習是一切問題的終極答案嗎?

微軟的2015

【技術】物聯網感知層進入技術創新爆發期

快訊:Honeywell全球最強量子計算機問世

30萬人通過這門課尋找幸福——2015 edX課程大盤點

口語100移動端:英語學習APP王中王 (The King of English Learning APPs)

伯克利深度學習專題課程:對抗生成網絡創始人首次剖析訓練實例(44PDF下載)

西北石油局老年大學計算機培訓

計算機視覺方向0128

Surface Book:微軟做錯和做對了什麼

臥槽:微軟又推出新的開源網站!

評測:微軟強烈推薦Windows10殺毒軟體

(9)足球·奪冠——全日本關注!重溫星稜高中奪冠之路

微軟Build 2017:新設計、新功能和潤物無聲的 Windows 10

2015環湖(國際)電動汽車挑戰賽在塔爾寺巡遊祈福

品牌百強榜:現實中微軟地位以及對社會的影響