參考消息網11月21日報導 外媒稱,為了加快和簡化學習過程,谷歌旗下「深層思維」公司(DeepMind)的團隊現在教會了它的人工智慧系統像動物一樣做夢。
據英國《每日郵報》網站11月18日報導,谷歌旗下的人工智慧(AI)系統在雅達利(Atari)遊戲中獲得了創紀錄的高分,還在圍棋上擊敗了人類——不過為了做到這一點,這套系統需要長時間的持續訓練。
為了加快和簡化學習過程,谷歌旗下「深層思維」公司(DeepMind)的團隊現在教會了它的人工智慧系統像動物一樣做夢。
在重溫包含獎勵事件的遊戲步驟後,人工智慧系統能夠以10倍於之前算法的速度學會完成這幾關遊戲。
據至頂網報導,「深層思維」公司在測試後發現,它旗下名為「無監督強化和輔助學習智能體」(Unreal)的系統在遊戲中取得的成績能夠達到頂尖人類玩家的87%。
研究人員說,由於現在不必花那麼多時間來訓練Unreal,他們可以繼續做更多自己的實驗。
Unreal所做的在迷宮中收集蘋果的「夢」是虛擬遊戲《Labyrinth》的要點,其形式與熱門視頻遊戲《Quake》類似。
在遊戲中,機器需要迅速走出一個蜿蜒曲折的迷宮,沿途每收集到一個蘋果都能得分。
研究人員選擇這款遊戲是因為它能夠通過得分強化正確的行為,而且Unreal系統每次只了解迷宮的一部分——這使得研究人員能夠監控它學習其餘部分的速度。
「深層思維」公司研究人員近日發表了一篇題為《使用無監督輔助任務的強化學習》的論文,強調了「做夢」技巧能夠提升人工智慧系統的學習速度和最終成績。
為了做到這一點,「深層思維」公司團隊給Unreal系統增加了兩項主要的額外任務——其中一項模擬了嬰兒發展動作技能的方式,另一項則類似於動物的做夢方式。
他們在論文中寫道:「就像動物會更加頻繁地夢到正面(或負面)獎勵事件一樣,我們的智能體會優先重溫那些包含獎勵事件的場景。」
「深層思維」公司團隊在一篇博客文章中解釋說,第一項任務教會了人工智慧系統如何控制屏幕上的像素,其「重點是學習它的行為會如何影響它將要看到的東西,而不僅僅是預測」。
他們說:「這類似於嬰兒通過移動手和觀察手的運動來學習如何控制他們的手。通過學習如何改變屏幕的不同部分,我們的智能體學習了視覺輸入的特徵,這有助於玩遊戲和得到更高的分數。」
第二項任務教會了Unreal重點關注它在前幾輪遊戲中所看到的視覺特徵,從而找到捷徑。
「深層思維」公司團隊解釋說:「智能體被訓練從近期戰況中預測即將出現的獎勵。為了更好地應對獎勵極少的場景,我們向智能體等比例地輸入了有獎勵和無獎勵的歷史數據。通過更多地學習有獎勵的歷史數據,智能體能更快發現預示著獎勵的視覺特徵。」
「深層思維」公司團隊說,他們的「主要任務」是讓人工智慧「學會在不用人教的情況下解決複雜問題」。