12月11日,在日前舉辦的第六屆「ImageNet圖像識別大賽」(ImageNet image recognition competition)中,微軟研究院的計算機圖像識別系統成功在幾個類別的測試中取得了第一名的好成績,同時也擊敗了包括谷歌、英特爾、高通以及其他一些初創企業和學術實驗室的產品。
據悉,微軟在此次比賽中所使用的系統名為「圖像識別深度殘差學習」(Deep Residual Learning for Image Recognition),該系統由微軟研究員何愷明、張祥雨、任少卿和孫劍(均為音譯)組成的團隊開發。微軟在官方博客中表示,公司將在今後發表的論文中詳細對外介紹這一系統。
「我們對神經網絡的訓練深度已經超過了150層,而這一『深度殘差學習』框架能夠進一步減少優化,同時整合極深度網絡,圖像識別的準確率也就會迎來提升。而且,這種準確率的提升是許多其他普通網絡所無法做到的。」一名微軟研究員如是說道。
應該說,圖像識別技術近期已經得到了越來越多科技公司的追捧,因為他們都希望借這一系統改善內部系統及面向消費者的產品。
值得一提的是,微軟此前已經通過幾款有趣的應用幽默化的展示了公司在這一領域的實力,比如該公司發布了「我看起來有多大」(How Old Do I Look?)以及「我的鬍子怎麼樣」(How’s My Moustache Doing?)這兩款妙趣橫生的應用。同時,微軟還通過微軟研究院發起的「牛津項目」(Project Oxford)試圖將這一圖像識別技術真正實現商業化。
據悉,第六屆「ImageNet圖像識別大賽」要求參賽方對來自圖片分享網站Flickr和搜尋引擎的10萬張照片進行精確定位,並將他們劃分到1000種目標類別下,其中包括狼蛛、iPod、清真寺、玩具店和數據機等。比賽中,微軟系統的分類錯誤率僅為3.5%,定位錯誤率則為9%。
而在過去幾年,谷歌、初創企業larifai和NEC則一直在圖像分類準確率方面取得了不錯的成績。
對此,微軟研究院的一名研究人員表示:「甚至連我們自己都敢不相信這一方案能夠取得這麼好的成績。」
值得一提的是,中國網際網路企業百度並未參與今年的「ImageNet圖像識別大賽」。這主要是因為百度在去年的測試中存在嚴重違規行為,該公司隨後對此表示道歉,並解僱了要求初級工程師這樣做的團隊負責人。
當時,美國網站MIT科技評論還特地撰文對百度在人工智慧測試中違規一事作出評論。該網站指出,相對於其他公司一周只購買2張彩票而言,百度的行為如同一周「購買了200張彩票」,此舉大大增加了其中獎概率。此後,主辦方對百度作出了禁止提交測試成績1年的處罰。