工程師黃明星 發表於 2018-06-22 07:55:00
五年前,研究人員在能夠解讀圖像的軟體的準確性上有了一次突如其來但大幅度的飛躍,其背後的人工神經網絡支撐了我們現在在人工智慧行業所看到的繁榮景象。然而,我們仍遠未達到《終結者》或《黑客帝國》中所描述的那種現實。
目前,研究人員正試圖把重點放在怎樣教機器把一件事做到極致。與人腦同時處理多個事物的大腦不同,機器人必須以線性的方式「思考」。無論如何,在某些領域,人工智慧已經打敗了人類。深度神經網絡已經學會了交談、駕駛汽車、玩電子遊戲、下圍棋、畫畫,以及幫助探索科學發現。
在以下六個領域中,人工神經網絡已經證明,它們可以超越人類智能。
1.圖像和物體識別
記錄表明,機器在圖像和物體識別方面的能力遠遠超過了人類。在一次測試軟體識別玩具的能力的實驗中,Geoff Hinton發明的Capsule網絡的錯誤率幾乎只有之前最低錯誤率的一半。在不同的掃描過程中,增加這些膠囊的數量可以讓系統更好地識別一個物體,即使這個視圖與之前分析的不同。
另一個例子來自於一個最先進的網絡,它是在一個有標籤的圖片資料庫上訓練的,並且能夠比一個博士生更好地對物體進行分類,而這些博士生在相同的任務上接受了超過100個小時的訓練。
2.電子遊戲谷歌的DeepMind使用一種被稱為「深度強化學習」的深度學習技術,研究人員用這種方法教電腦玩雅達利的打磚塊遊戲Breakout。他們沒有以任何特定的方式對這臺電腦進行教學或編程。相反,它在看分數的同時還控制了鍵盤,它的目標是得到儘可能高的分數。玩了兩個小時後,電腦就成為了這個遊戲的專家。
深度學習社區正在進行一場競賽,訓練計算機在幾乎所有你能想到的遊戲中擊敗人類,包括太空入侵者、末日、Pong和魔獸世界。在大多數遊戲中,深度學習網絡已經勝過有經驗的玩家。電腦並不是通過編程來玩遊戲的,他們只是通過玩遊戲來學習。
3.語音生成和識別去年,谷歌發布了WaveNet,百度發布了Deep Speech。兩者都是深度學習網絡,能自動生成語音。這些系統學會了模仿人類的聲音,並且它們的水平隨著時間的推移不斷提高。將他們的演講與真實的人區別開來,要比人們想像的要難得多。
牛津大學和谷歌公司DeepMind的科學家們創造了一個深度網絡,LipNet,在閱讀人們的唇語上達到了93%的正確率,而普通的人類唇語閱讀者只能達到52%的正確率。來自華盛頓大學的一個小組利用唇形同步創建了一個系統,將合成音頻與現有視頻實現同步。
4.藝術品和風格的模仿神經網絡可以研究某一特定藝術作品的筆觸、顏色和陰影的圖案。在此基礎上,它可以根據分析將原始的藝術作品轉化為新的圖像。
DeepArt.io就是一個例子,這家公司開發的應用可以使用深度學習來學習數百種不同的風格,你可以將它們應用到你的照片中。藝術家和程式設計師Gene Kogan也運用了風格轉換,基於算法從埃及象形文字中學習的風格來修改蒙娜麗莎畫像。
5.預測史丹福大學的研究人員Timnit Gebru選取了5000萬張谷歌街景圖片,探索一個深度學習網絡可以做些什麼。結果是,計算機學會了定位和識別汽車。它檢測到超過2200萬輛汽車,包括它們的製造、型號、體型和年份。這一系統獲得的洞見之一就是,選民隊伍的起點和終點在哪裡。根據這一分析,「如果在15分鐘車程中遇到的轎車數量高於皮卡車的數量,那麼這座城市可能會在下次總統選舉中投票給民主黨人(88%的機率),」Timnit Gebru和他的合著者寫道。
另一個機器提供比人類更準確的預測的例子來自谷歌的Sunproof項目,這項技術使用了來自谷歌地球的航拍照片來創建一個你的屋頂的3D模型,將它與周圍的樹木和陰影區分開。然後,它利用太陽的軌跡,根據位置參數來預測你屋頂的太陽能電池板能產生多少能量。
6.網站設計修改在網站生成器中集成的人工智慧可以幫助網站更新,並對網站進行有用的修改,比人類更快速、更準確。這種系統的基本技術提供了關於網站外觀的普通用戶的意見,這可以告訴設計師網站設計的好壞。如今,網站建設者們要麼利用深層網絡來修改設計,要麼計劃在不久的將來使用它們。該技術可以分析不同的模式,並根據以前的轉化率和其他重要指標,創造更好的結果。
雖然我們距離實現矩陣級別的人工智慧還差得很遠,但企業正在努力快速提高神經網絡的智能化水平。上面提到的項目只是這項技術的淺層次應用,新的想法和改進不斷湧現,證明機器在完成任務方面正在不斷超越人類的表現。
打開APP閱讀更多精彩內容
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴