百度超級計算機圖像識別超越人眼!秒殺谷歌

2020-11-22 驅動之家

據美國《麻省理工科技評論》5月14日報導,中國搜尋引擎巨頭百度表示,其新近研發的超級計算機Minwa在一項備受關注的人工智慧基準測試ImageNet中取得了世界最好成績,錯誤率僅為4.58%,超越了微軟和谷歌的超級計算機

超級計算機Minwa配備72個超強處理器和144個圖形處理器。11日晚些時候,百度在刊發的論文中稱其超級計算機已被用於指導機器學習軟體,在圖片識別方面打破了谷歌保持的紀錄。

來自百度Minwa項目的科學家吳恩達(AndrewNg)在接受採訪時表示:「百度現已成為計算機智能領域的領軍者。我認為Minwa是研究深度學習算法的最快的超級電腦,它可以說是我們手中絕對的王牌,強於我們的競爭者。」

計算機的計算能力關係到深度學習能力,百度和谷歌的超級計算機均在語音、圖像及面部識別領域成功取得突破,並應用於其圖像、語音搜索服務。

Minwa可以說是深度學習算法的一次飛躍性實踐。深度學習的概念由科學家在2006年提出,源於人工神經網絡的研究,是機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網絡,模仿人腦的機制來解釋數據,例如圖像,聲音和文本。含多隱層的多層感知器就是一種深度學習結構。該算法通過組合低層特徵形成更加抽象的高層表示屬性類別或特徵,以發現數據的分布式特徵表示。

吳恩達表示,這項科技能夠更好地處理更大規模的數據集與網絡,這也是深度學習算法與先前機器學習技術不同的一點,後者在處理大規模數據集與網絡時速度減緩,計算能力減弱,並且數據規模一旦超過某個節點,使用機器學習技術將無法取得任何進展,而深度學習算法則避免了這種情況的發生。百度稱Minwa的人工神經網絡擁有數以億計的接點,是以往任何網絡的數百倍之多。

百度在周一的論文中指出,他們的系統在測試ImageNet分類數據集中的錯誤率僅為4.58%(ImageNet計算機視覺挑戰比賽是目前國際上最大規模的圖像分類和識別測試平臺)。

這個數據集包含約150萬張圖像,分為1000個不同的類別,軟體被要求為10萬張前所未見的測試圖像進行分類

此前的世界最好紀錄4.82%由谷歌創造,而微軟在此測試中也達到4.94%的不俗成績同樣的實驗中,人眼辨識的錯誤率大概為5.1%,三個公司的研究成果均在視覺識別挑戰中超越了人類視覺能力。

相關焦點

  • 百度研發類谷歌眼鏡智能設備百度眼 2014年推出
    據外媒報導,百度宣稱正在開發自己的智能眼鏡技術,預計2014年推出。這項技術與谷歌(Google)眼鏡類似。百度發言人郭怡廣說,「這種眼鏡可用面部特徵識別技術進行搜尋。」郭怡廣稱,百度公司尚未決定這種智能眼鏡是否進行商業銷售。
  • 百度雲首創圖像搜索 支持人臉識別和檢索
    首創雲端圖像搜索基於用戶上傳到百度雲的圖片提供智能分類、人臉搜索等方式……        近日,百度雲在時光軸、足跡等原有圖片預覽功能基礎上全面升級,結合百度深度學習研究院提供的人臉識別及檢索技術
  • 圖像識別與人工智慧圖像識別和機器視覺有什麼區別
    人工智慧領域發展到現在,ai與人工智慧、圖像識別領域、計算機視覺領域等近年來越來越多的整合和融合。首先,人工智慧在生活工作中將普遍應用;其次,人工智慧在不同的工作場景都有其應用,從金融到醫療,從服務到工廠,應用無處不在;最後,人工智慧正在與自動駕駛技術等聯繫在一起。
  • 這都是圖像識別的功勞
    這都是圖像識別的功勞   有意思的是,今年春節百度圖像搜索推出了一款「自拍測運勢」神器,打開手機百度,對準攝像頭進行自拍或上傳照片,圖像搜索就會給出新年運勢,引得不少網友上傳照片去測自己的運勢。這個新功能看起來挺可笑的,因為不少人笑稱,手機居然也可以算命了?其實這一點也不可笑,因為「自拍測運勢」用上了圖像識別的黑科技,而這一黑科技背後全靠真功夫。
  • 圖片記得你 百度推出全網人臉搜索服務「百度識圖」
    現在,百度可以幫你忙了。上周末,百度悄悄推出了一個令人頗感意外的功能——基於圖像的全網人臉搜索服務「百度識圖」。我們通過試用發現,百度識圖已經可以初步識別人臉,然後自動找到相關聯的類似圖像。用戶可以在本地上傳圖片、也能粘貼網絡上的圖片地址或者直接拖拽到搜索框,搜索結果可以顯示臉部特寫以及完整圖片,也可以搜索相同圖片的不同尺寸。
  • 以圖搜索—圖像搜尋引擎的「雞肋」?
    在谷歌圖像搜索界面上,點擊搜索框右邊的像機圖標(百度是一個圖片圖標),搜尋引擎將允許用戶上傳一幅圖像或引用圖像連結,搜尋引擎根據圖像內容進行搜索。但為什麼這個看似酷炫的功能用戶卻並不常用,甚至鮮為人知呢?
  • 百度DuLight 盲人的科技之眼
    在和盲人的接觸中,百度公益的工作人員發現了譬如人民幣不容易通過盲文識別、不能分辨包裝大小相似的藥盒等更多的制約盲人日常生活的問題,希望通過科技和人工智慧得以解決。因此百度公益聯合百度研究院、IDL深度學習實驗室,將這些盲人實實在在的生活需求轉化為推動力,試圖通過圖像識別、大數據等技術,打造出一款專門服務於盲人的硬體。
  • 零基礎入門深度學習(六):圖像分類任務之LeNet和AlexNet
    從本課程中,你將學習到:深度學習基礎知識numpy實現神經網絡構建和梯度下降算法計算機視覺領域主要方向的原理、實踐自然語言處理領域主要方向的原理、實踐個性化推薦算法的原理、實踐本周為開講第四周,百度深度學習技術平臺部資深研發工程師孫高峰,開始講解計算機視覺中圖像分類任務。
  • 圖像識別與檢測挑戰賽冠軍方案出爐,基於偏旁部首識別 Duang 字
    基於這一痛點,阿里巴巴「圖像和美」團隊推出 MTWI 數據集,這是阿里首個公開的 OCR 數據集,也是現有難度最大、內容最豐富的網絡圖片 OCR 數據集。基於該數據集,阿里巴巴「圖像和美」團隊聯合華南理工大學共同舉辦 ICPR MTWI 2018 挑戰賽,這場比賽共分為三個獨立賽道,一是識別單文本行(列)圖片中的文字,二是檢測並定位圖像中的文字行位置,三是識別整圖中的文字內容。
  • 百度冠禮之年:超級AI養成記
    (李彥宏出席愛奇藝上市敲鐘)百度的工程師文化也經歷幾次升級,最重要的變化是「以產品為中心」,更理解用戶需求,特別是技術在不同用途、各種場景下的使用模式,並預測未來用途。同時,工程團隊也要求更理解商業模式,理解商業怎樣對產品、工程能力產生怎樣的影響。李自己的工程師特質就很明顯。2002年2月,他提出 「閃電計劃」,要求中文搜索體驗九個月內全面超越谷歌。
  • 谷歌剛剛爆出大料,真的不敢相信!
    剛剛,谷歌宣布:已經成功利用一臺 54 量子比特的量子計算機,實現了傳統架構計算機無法完成的任務。在世界最牛掰的超級計算機需要計算 1 萬年的實驗中,量子計算機只用了200 秒。
  • 百度推出圖像搜尋引擎「百度識圖」 可基於圖像實現全網人臉搜索
    北京時間12月29日消息,28日晚些時候,百度上線名為「百度識圖」的圖像搜素引擎產品,「百度識圖」可以幫助用戶搜索內容相同尺寸不同的照片,還可以實現基於圖像的全網人臉搜索。目前百度識圖的Logo顯示為測試版本,百度官方也尚未正式發布相關消息。
  • 我國量子計算機比谷歌快100萬倍;新冠滅活疫苗預計年產3億劑;浩瀚...
    我國量子計算機比谷歌快100萬倍;新冠滅活疫苗預計年產3億劑;浩瀚太空添「新星」;牛仔褲也能汙染地球 2020-09-09 16:44 來源:澎湃新聞·澎湃號·媒體
  • 用衣袖的照片就能識別整件衣服?圖片搜索的想像力可能更大
    在2000年前後這股網際網路的科技浪潮下,抓住機會的是當時的創業公司谷歌,而不是當時的巨頭微軟;社交網絡的技術革新浪潮興起,抓住這個機會的也是當時的創業公司Facebook。黃隆鼎說,創新的事情應該由創業公司來做,新的、大的機會也總是由創業公司所抓住,而讓他激動的、能帶來變革式影響的事情,就是圖像識別。
  • 百度圖片改版:識圖搜索加入人臉識別功能
    百度識圖搜索人臉識別功能搜索示意百度圖片的瀏覽看圖頁:熱門標籤分類,瀑布流式圖片呈現,還有「本周最熱」  新浪科技訊 12月31日晚間消息,百度圖片搜索(image.baidu.com)近日進行了一次較大的頁面改版和功能升級
  • HTTPS對谷歌百度SEO影響幾何、我該用嗎?
    而且谷歌曾明確表示「希望所有的站長都能將使用HTTPS協議,而非HTTP」更是表明了其對達到「HTTPS everywhere」這一目標的決心。百度的態度雖然百度曾表示「不會主動抓取https網頁」,但對於「很多https網頁無法被收錄」也是「耿耿於懷」。
  • UCCA天馬行空的AI藝術展,和背後腳踏實地的百度AI
    那些過目不忘的驚豔體驗 《銀瑚》、《達爾文式旋轉線之鏡》、《世界的起源》,當你在視頻中聽到這些展覽作品名稱時,是不是有種滿滿的神秘感又給人遐想的感覺? 這正是在「非物質 / 再物質:計算機藝術簡史」群展中,百度呈現的三個AI特別單元。
  • 硬核測評,谷歌翻譯被碾壓!全球首個翻譯引擎進化歸來,「細節狂魔...
    在第一個得分點上,谷歌翻譯成了「I'll go there」,微軟和百度認為這是「I'll go」的意思,有道則給出「I don't know」的答案,DeepL表現很好,正確翻譯成了帶有驚訝語氣的「oh my god」。在第二個得分點上,五位選手都給出了不同的答案,谷歌「shy」、微軟「snobful」、百度「shabby」、有道「bad」,DeepL「ugly」。
  • 人工智慧領域突破百度發布在線翻譯系統
    日前,百度在機器翻譯技術上取得重大突破,發布了融合統計和深度學習方法的在線翻譯系統。該系統藉助海量計算機模擬的神經元,模仿人腦「理解語言,生成譯文」,同時結合百度已有的統計機器翻譯技術,使得機器翻譯質量實現了質的飛躍。百度,再一次站到網際網路前沿技術的領先位置。  機器翻譯一直被公認為是人工智慧領域最難的課題之一。
  • 如何簡單低成本地打造人臉識別產品?百度新硬體帶來答案
    支持4~8路1080p輸入、30人同屏抓拍、視頻流下人員識別、1:1或1:N檢索等,在多人場景下能起到跟蹤人員流動,管控關鍵角色進出的作用。如今度目硬體已來,有足夠讓人滿意的規格,也有背靠百度大腦人工智慧團隊帶來的軟體和算法支持,而且價格也足夠有吸引力。 四款度目硬體在發布會中的演示,正是精準定位到了稀鬆平常但需要人臉識別助力的場景:單位門禁快速精準識別;駕駛員狀態監控,提前預防潛在的危險駕駛;人員管控不影響出入又不錯過管控;商場人員監測了解用戶心理。