人工智慧只會下象棋、圍棋?錯,它玩遊戲都比我們6

2020-12-17 騰訊網

本文由騰訊數碼獨家發布

從醫學進步到電影推薦,我們才剛剛開始觸及人工智慧用途的皮毛。儘管人工智慧是幫助人類生活得更美好的潛在寶庫,但即使是具有最偉大思想的人,也對它可能帶來的危害感到恐懼。人們對人工智慧的擔憂包括:機器人將奪走我們的工作,顛覆人類,奴役人類不一而足。在某些方面,人工智慧已經戰勝了人類,其中包括我們最喜歡的一些遊戲,例如圍棋和《星際爭霸II》(StarCraft II)。機器開始超過人類,坦率地說,這是一件好事。

最著名的人-機大戰發生在1997年5月,當時,IBM的深藍西洋棋計算機在常規比賽規則下擊敗了西洋棋世界冠軍加裡?卡斯帕羅夫(Garry Kasparov)。一年前,早期版本的深藍在與卡斯帕羅夫的比賽中曾勝過數局,但是,贏得一場完整的比賽是計算技術發展的一個分水嶺——一名頗具傳奇色彩的西洋棋選手的智商遭到一行行代碼的碾壓。阿蘭?圖靈(Alan Turing)曾指出,考慮到複雜性和涉及的策略,下西洋棋的能力將成為衡量計算機智能的標準。事實上,在深藍大獲成功之前的50年,圖靈自己編寫了一個原始的西洋棋算法。似乎在世紀之交,計算機比我們對西洋棋有了更深的了解。

深藍1997年戰勝卡斯帕羅夫之所以引人注目,原因不僅僅在於這樣的結果,還在於隨之而來的爭議。卡斯帕羅夫聲稱,他見識了深藍棋招的「足智多謀」,這使得他得出一個結論:有人在為「深藍」支招。IBM否認了這一說法,但拒絕重新比賽,並拒絕向卡斯帕羅夫提供深藍的日誌文件,這些日誌文件將揭示深藍的內部運作過程。數年後,在深藍「退役」前,IBM將它與卡斯帕羅夫比賽時的日誌文件發布到了網上。

卡斯帕羅夫被深藍擊敗被主流媒體廣泛報導,但這遠不是電腦程式第一次與水平最高的棋類選手過招。在1979年夏天,西洋雙陸棋軟體BKG 9.8在一場由八局比賽組成的賽事中擊敗了世界冠軍路易吉?維拉(Luigi Villa),比分是七勝一負。BKG 9.8開發者漢斯?伯利納(Hans Berliner)認為, BKG 9.8的勝利與擲骰子中的運氣有很大關係。一年後的1980年,一臺名為摩爾的奧賽羅棋計算機,在與當時的世界冠軍井上博(Hiroshi Inoue)的六局比賽中贏了一局。

Chinook是一款跳棋軟體,最初是阿爾伯塔大學在1989年開發出來的。在20世紀90年代早期的數場比賽中,它的對手都是被認為是有史以來最好的跳棋選手馬裡恩?廷斯利(Marion Tinsley)。雖然Chinook從未在一場比賽中擊敗過廷斯利,但它贏得了兩局比賽。在廷斯利近50年的職業生涯中,他一共輸掉了七局比賽。開發Chinook的工作一直持續到2007年,當時這一算法有效地「解決」了跳棋。阿爾伯塔大學隊利用Chinook證明,如果雙方的表現均相當完美,唯一可能的結果就是平局。

雖然這些奇聞軼事代表著計算領域引人注目的重大事件,它們擊敗或至少能與當時最出色的選手對壘,但這並不意味著它們具有「智能」。相反,它們是「蠻力」計算的範例:使用原始處理能力來計算未來所有可能的走法,並從中選擇最有可能取勝的走法。沒有人為幹預,計算機棋手的棋力也不會得到提升。例如,在深藍和卡斯帕羅夫之間的標誌性大戰中,IBM工程師被允許在兩局比賽之間調整算法,以實現其性能的最大化。

自那場令人難忘的西洋棋比賽後近20年,歷史重演了——不過是一種完全不同於深藍的計算機,在一種更複雜的棋類遊戲中對戰頂級的人類高手。

長期以來人們一直認為,即使是處理能力最強大的計算機,面對圍棋也束手無策。不同於許多其他棋類遊戲的是,有數千年歷史的圍棋通常不存在一步最好的棋。隨著棋盤上的棋子越來越多,走法也會不斷變化,策略也必須不斷變化。簡而言之,圍棋不是一個計算能力能夠解決的數學問題,想像力才是關鍵。

由谷歌旗下DeepMind開發的圍棋人工智慧算法AlphaGo,在2015年末戰勝歐洲圍棋冠軍樊輝(Fan Hui),在2016年戰勝世界冠軍韓國的李世石(Lee Sedol),是計算技術發展的另一個決定性時刻。AlphaGo不僅令人信服地贏得了這兩場比賽,而且在比賽中表現出的創造力,即使是經驗最豐富的圍棋大師也感到驚訝。AlphaGo的一些走法,對人類下圍棋也產生了深遠影響。

這一點尤其重要,因為它使人工智慧超越蠻力計算的理念更容易理解。雖然研究論文可能幾乎無法被外行所理解,但在比賽中使用完全非常規的走法是一個明晰的信號,AlphaGo下圍棋的水平已經超過人類。實際上,AlphaGo最初是利用存儲的圍棋比賽的大量數據進行訓練的,它通過訓練獲得了預測能力——根據當前棋盤的情況預測可能的下一步走法。

AlphaGo剩下來的工作,就是通過與自己比賽,積累更多的數據。事實上,經過數十萬局的比賽,AlphaGo的棋力不斷得到提升。超過任何人類棋手的比賽數量,使得AlphaG獲得了豐富的比賽經驗。

隨後的AlphaGo版本的重點,一直是提高系統運行效率,最大限度地減少人為指導,同時保持對頂級職業棋手的不敗記錄。 AlphaGo Zero是一個專門自我訓練的人工智慧系統,最初,基本的下棋規則是它唯一的參考點,經過40天的訓練後,它的棋力超越了之前的所有設計。在此基礎上,AlphaGo的後續系統AlphaZero在經過數小時的訓練後掌握了西洋棋、日本象棋和圍棋的下法,棋力能夠擊敗水平最高的計算機競爭對手(包括AlphaGo Zero在內)。

在開始著手開發有史以來最好的圍棋人工智慧系統之前,DeepMind開發了一種算法,可以自己學習玩雅達利2600遊戲。視頻遊戲已成為人工智慧研究中非常流行的工具,這是可以理解的,因為視頻遊戲提供的不是一個規則明確、沒有靈活性的棋類遊戲,而是一個複雜的虛擬環境和強化學習平臺。關於人工智慧玩電子遊戲,特別令人印象深刻的是,它們看到的屏幕與普通玩家一樣(而非通過讀代碼獲取遊戲狀態信息),並嘗試了解遊戲場景,找出玩遊戲的訣竅和通關條件。

觀察計算機玩計算機遊戲會帶來一些有趣、意想不到的結果。有關人工智慧發現計算機遊戲中隱藏的缺陷的軼事層出不窮。

人工智慧玩視頻遊戲的水平不斷提升,Unity Technologies甚至開發了一款專門用來測試強化學習極限的遊戲。Obstacle Tower 是一款3D解謎遊戲,具有程序生成的關卡,可以確保人工智慧系統不會被編程執行特定的一系列動作,而是必須理解謎題才能通關。目前,參與者可以使用前25個關卡,但在4月中旬,遊戲的所有100個關卡都將開放。這個遊戲難度非常高,每個級別的難度都會增加,人類玩家通常會在約第15個關卡認輸。

近年來,出現了一些著名的人工智慧遊戲玩家,例如麻省理工學院的《超級明星大亂鬥》武士和DeepMind的《雷神之錘III競技場》(Quake III Arena)奪旗專家,它們都是比真人更好的隊友。在人工智慧玩遊戲方面,也許迄今為止最大的成就是,今年早些時候,人工智慧在《星際爭霸II》(StarCraft II)中完勝職業玩家。

對於職業玩家來說,《星際爭霸II》可以說是最難打的視頻遊戲。它是一款快節奏的實時戰略遊戲,玩家必須獲取資源、管理基礎設施、控制多個單位、做出戰術決策,通常無法掌握即將遭遇的對手的完整信息。這款遊戲既複雜又「無情」,一個看似微不足道的錯誤,可能會使玩家陷入萬劫不復的險境中。

與AlphaGo最初的訓練方式一樣,AlphaStar通過觀察人類玩家來學習《星際爭霸II》的基礎知識。通過這種形式的監督學習,並通過模仿其觀看的玩家的能力,AlphaStar成為一個有實力的競爭對手。然後,DeepMind開發了一個系統,使AlphaStar的許多不同副本相互對抗。為避免重複,每個版本都略微進行了調整,以促使AlphaStar探索不同的遊戲策略。

DeepMind運行了兩周時間的這個系統,每個副本獲得了相當於玩200年遊戲的經驗。被認為遊戲能力最強的五個副本與兩名職業玩家過招,所有十場遊戲都以AlphaStar獲勝告終。人工智慧玩家確實有一個關鍵優勢:他們能看到完整的遊戲地圖,而職業玩家在任何時候都只能看到部分地圖。此外,在所有比賽中雙方都使用神族,這意味著,職業玩家不能使用遊戲的其他種族(是使遊戲整體更複雜的一個重要因素)。

為了使比賽具有一定程度的公平性,DeepMind訓練了另一個使用標準界面的AlphaStar版本,因此它也只能「看到」地圖的一小部分,並且必須移動相機。由於這一新增的障礙以及訓練時間僅為一周,在第一次比賽中被打敗的一名職業玩家,在一場現場直播的比賽中戰勝了AlphaStar。

《Dota 2》是另外一款複雜的戰略遊戲,最好的人工智慧系統尚不是職業玩家的對手。去年,在有史以來規模最大的《Dota 2》賽事中,兩個獨立的職業玩家團隊挑戰OpenAI Five——一個由五臺獨立機器組成的團隊,並獲得了勝利。在《Dota 2》中,玩家只控制一個具有數種活動能力的單位。它是一款不同於《星際爭霸II》的團隊遊戲,隊友之間的協調與個人遊戲技能同等重要,在團隊協作方面,似乎人類的表現仍然更出色。

在與職業玩家的比賽中,OpenAI Five的響應時間確實被人為限制為200毫秒。但與AlphaStar相似的是,與機器人團隊對戰的《Dota 2》職業玩家也會受到相當大的限制。《Dota 2》有超過100個角色可供玩家選擇,團隊的遊戲風格和勝利條件取決於團隊成員。能否獲得優勢通常始於選擇。在與OpenAI Five對戰的遊戲中,其他職業玩家只能從較少的角色中選擇自己的角色,以使遊戲更平衡。除此之外,還有一些先進的機制尚未被用於人工智慧玩家,職業玩家也被禁止使用這些機制。

人工智慧可能只需要短短數個月或數年時間,就可以完全掌握這些複雜的遊戲,並成為比頂級職業玩家更好的遊戲玩家。圍棋曾經是人工智慧的聖杯,現在,它又有了新的挑戰目標。能夠在視頻遊戲中擊敗人類的人工智慧可能似乎微不足道,然而,所有這些成就背後的研究將產生深遠的影響。

IBM的Watson超級計算機在綜藝節目Jeopardy中戰勝人類,不僅僅造就了出色的電視節目,它還演示了自然語言處理方面的進步——正是這一技術使亞馬遜語音助手Alexa能根據我們口述的指令完成相應動作。OpenAI在其《Dota 2》人工智慧玩家中使用的算法,正被用來使機器人的手更靈活,與人類手臂的動作更相似。觀看人工智慧在《俠盜獵車手5》中學習駕駛技術可能會相當有趣,但是,它或許會使自動駕駛汽車終有一天成為現實。AlphaZero可能會在今天的圍棋棋盤上學習不同模式,未來它可能在通過腦部成像診斷罕見病方面大顯身手。

就在數個星期前,OpenAI宣布開發了一款專門供人工智慧玩的簡單MMO(大型多人網遊)遊戲。它具有程序生成的地形,鼓勵爭奪資源的覓食系統和具有三類角色的基本對戰系統。這款遊戲的目標是創造一個具有短期和長期壓力、足夠複雜的世界,並觀察當生存是唯一的驅動因素時強化學習如何發揮作用。

目前,有成千上萬的人工智慧玩家在玩它們自己的《魔獸世界》(World of Warcraft)版本,但是,沒有人知道這項研究可能會催生什麼樣的實際應用。

相關焦點

  • 圍棋與象棋(中國象棋、西洋棋、日本將棋)該如何選擇?
    聶衛平說過,你們不要一味地拔高圍棋,這個遊戲本質上就是一個遊戲。鍛鍊這個鍛鍊那個,有什麼xx思維,你玩遊戲要獲得樂趣,這才是最重要的。如果想要培養一項業餘愛好的話,我覺得這些都是非常好的選擇。棋就是一遊戲,不要給他賦予太多的文化內涵,人工智慧的出現,說明什麼棋都和文化內涵無關,就是一遊戲。而遊戲,最大的作用就是以棋會友,這四種棋,在你們那裡或者在整個國內,就只有象棋能起以棋會友的作用。其他幾種就是網路遊戲而已,不會也罷。將棋,對抗激烈,複雜程度高,中後期持駒一多非常考驗計算能力,個人認為很有意思。B站上有不少學習資源可供參考。
  • 圍棋國手和象棋國手再度上演讓九子大戰
    時隔二十年,圍棋國手和象棋國手再度上演了象棋的讓九子大戰。今年的八月三十一日,在一檔娛樂節目的現場,圍棋九段唐韋星和象棋特級大師蔣川上演一盤象棋的讓九子的大戰,象棋特級大師蔣川在讓九子的情況下,僅僅十五個回合就擊敗對手,圍棋九段唐韋星。所謂讓九子,讓的是五隻兵和雙士,雙相。
  • 圍棋,象棋,五子棋,三足鼎立你最Pick誰?
    二爺自從開通百家號以來,就一直在給大家介紹網路遊戲。但是二爺卻沒有意識到平時我們玩的線下遊戲也是遊戲的另一種形式。所以接下來二爺就要給大家介紹線下遊戲了。今天,二爺給大家介紹的就是圍棋,象棋,五子棋。這三種都是我們經常會在線下玩的遊戲,當然隨著科技的發展我們在電腦手機也同樣可以進行遊戲了。但二爺最喜歡的還是在線下約幾個好朋友一塊下棋了。圍棋,是一種策略性兩人棋類遊戲,中國古時稱"弈",西方名稱"Go"。流行於東亞國家(中、日、韓、朝),屬琴棋書畫四藝之一。圍棋起源於中國,傳為帝堯所作,春秋戰國時期即有記載。隋唐時經朝鮮傳入日本,流傳到歐美各國。
  • AlphaGo之父:關於圍棋 人類3000年來犯了一個錯
    圍棋是個歷史悠久的遊戲,有著3000多年的歷史,起源於中國,在亞洲,圍棋有著很深的文化意義。孔子還曾指出,圍棋是每一個真正的學者都應該掌握的四大技能之一(琴棋書畫),所以在亞洲圍棋是種藝術,專家們都會玩。
  • 計算機下得贏西洋棋 卻下不贏圍棋
    Facebook和谷歌等科技公司正在研究圍棋人工智慧技術,希望有朝一日能讓計算機戰勝人類圍棋冠軍。Facebook最近幾年進行了不少基礎科學研究,最近的一項研究是教計算機下圍棋。圍棋這項複雜的競賽活動擁有2500多年的歷史,但到目前為止,計算機仍無法戰勝人類。
  • 圍棋,象棋,麻將等風靡古今中國,其原因隱藏在每個中國人心中
    進入二十一世紀以來,隨著科技的發展,生活方式的加快,人們的娛樂方式發生了很大的變化,像如今幾乎人手一部的智慧型手機,越來越普及的電腦,都是人們閒餘時間離不開的寶貝,除了這些,現在大家出去玩也會有各式各樣的方式和地點,有些人喜歡走南闖北,四處旅遊,也有些人會找幾個朋友去KTV唱唱歌,放鬆心情
  • 圍棋,中國象棋,西洋棋
    大約九百年前,北宋著名科學家沈括在《夢澳筆談》中,就圍棋的變化曾做過一次有趣的計算。如果進一步探討,還會知道這個計算是不完全的。實際情況正如人們所說:自古及今,弈者無同局。下圍棋能鍛鍊人的計算能力,這是不言而喻的。但是,當人們面對圍棋對局中的無數變化,既不可認為是數字上的簡單增減,也不能隨心所欲的投子提子,而是在嚴格的規律指導下來進行選擇。
  • 圍棋、西洋棋、中國象棋的區別
    >圍棋,為策略性二人棋類遊戲,使用格狀棋盤及黑白二色棋子進行對奕。圍棋起源於中國古代。推測起源時間為大約公元前6世紀。傳說堯的兒子丹朱頑劣,堯發明圍棋以教育丹朱,陶冶其性情。圍棋的*早可靠記載見於春秋時期的《左傳》。戰國時期的弈秋是見於史籍的第*位棋手。南北朝時候,棋盤定型為現在的19道棋盤,並且出現了評定棋手水平的圍棋九品制。圍棋逐漸成為中國古代知識階層修身養性的一項必修課目,為「琴棋書畫」四藝之一。唐代出現了棋待詔官職。
  • 象棋圍棋你都會下,可你知道這方寸棋盤上的玄機嗎?
    棋是智力遊戲當中的明珠,是人們智商博弈最直接明了的平臺。因為亞洲特殊的謀略文化,所以能把陰謀和陽謀都發揮到極致的棋類基本都誕生在亞洲。所謂有人的地方就有江湖,棋的出現能夠讓人們在方寸之間的棋盤上,完成智力的博弈,而不用真的兵對兵、將對將。
  • 日本將棋遊戲什麼來頭?拼過圍棋,躍居世界公認最難的棋
    你玩過象棋、圍棋,那你有挑戰過日本將棋遊戲嗎?在世界公認最難的棋類遊戲中,將棋遊戲位列第一,圍棋只能位居第二,而我們的象棋遊戲甚至沒有上榜前十。接下來就一起學習將棋遊戲規則玩法,看看它究竟有多難!在很多國人的心中,想必都會認為象棋遊戲以及圍棋都是都是很難的玩法。確實也是,這兩種棋類遊戲規則都比較簡單,但是想要獲勝卻也是要經過一番腦力的對戰,沒點『大智慧』根本拿不下來。不過在將棋遊戲面前,這些可都是小菜一碟了。
  • 孩子到底學象棋、圍棋還是西洋棋?
    6、時間管理 下棋也能對孩子時間管理也能有幫助嗎?這是很多家長沒想到的,其實下棋對孩子的時間觀念和時間管理都有幫助,比如比賽有時間規定,不許遲到,這就要求孩子提前做好計劃。一般比賽都有時間限制,有的比賽每步棋的時間都有限制,這樣要求孩子就要對自己的時間要進行合理的利用,否則超時也會輸棋。
  • 為什麼AI下圍棋幾乎天下無敵?它真的比人還聰明嗎?細思極恐
    為什麼AI下圍棋幾乎天下無敵?它真的比人還聰明嗎?細思極恐 人工智慧現在發展的越來越厲害,這得益於我們有了更先進的工藝水平,晶片技術,軟體編譯和硬體支持。不知道大家還記不記得當年AI大戰圍棋國手,那個時候我們對人工智慧的認識還比較初級,所以很多人都關注了相關的新聞和賽事。
  • 人工智慧戰勝了職業圍棋手 人腦真的不如電腦了嗎?
    錢江晚報-浙江新聞客戶端記者 盧俊和1月28日,一則與圍棋相關的新聞引來軒然大波。國際頂尖期刊《自然》報導了谷歌研究者開發的新圍棋AI。這款名為「阿爾法圍棋」(AlphaGo)的人工智慧,在分先的情況下以5∶0完勝歐洲冠軍、職業圍棋二段棋手樊麾。消息一出,無論是否棋界人士,朋友圈都被刷屏了。
  • 《孟子》故事:教學工具:圍棋、象棋
    說起下棋,中國的棋類有很多,流傳最廣的是圍棋和象棋,古人把下棋稱為對弈,弈就是指圍棋。據說圍棋是堯為了教育兒子朱丹而發明的,象棋則是周公為了教育侄子周成王發明的。如此看來圍棋、象棋最初的定位是教學工具,而不是消遣時光的遊戲。
  • 您玩過二人對弈的象棋,那您玩過三人同玩的象棋嗎
    導讀:您玩過二人對弈的象棋,那您玩過三人同玩的象棋嗎?   甚至還有七人共玩的象棋您不想試一試嗎?   說起象棋,估計很多人都玩過,小編也曾經玩過象棋,儘管下的比較一般,但是不得不說象棋也是我們中國傳統文化的一部分,不僅能夠益智而且還大大地豐富了我們的文娛生活。
  • 擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?
    馬丁沒有所想,但他的所見將會被人工智慧直接獲取 AlphaGo 是在這個神經網絡系統上,專為下圍棋 (Go) 而開發出的一個實例。然而,雖然名字已經介紹了它的功能,AlphaGo 背後的神經網絡系統卻適合用於任何智力競技類項目。
  • 為什麼圍棋給人的感覺是陽春白雪,而象棋給人的感覺是下裡巴人?
    縱觀歷史,各朝各代,大多數文人騷客,更願意去下風度翩翩的圍棋,而不會去下這種殺伐感很強的象棋,所以象棋總給人一種粗魯、過於直接的感覺。從範圍上來說,中國圍棋遍布的範圍更加廣闊,隋唐時期由於當時對外開放力度較大,所以讓中國圍棋對外流傳,其中影響頗大的是日本,現如今日本的圍棋歷史也是比較悠久的,但是還是受到了中國元素和文化的影響,所以可見圍棋的影響力度和深度了。
  • 一款圍棋遊戲改變了任天堂甚至遊戲業的未來
    儘管如此,斯卡夫仍然會抽時間和孩子們一起下圍棋。克裡斯蒂安承認,起初他就是為了戰勝兄弟才學習圍棋的。 「我的指路明燈很簡單:打敗我的兄弟。我在接受任何建議時都想著這個目標。」 羅傑斯也是一位圍棋愛好者,在他看來,《Microgo1》(和續作《Microgo2》)證明了為8位機開發一款功能強大的圍棋遊戲是可行的。
  • Alpha Go三勝李世石,人工智慧下一目標會是遊戲、股票?
    這裡,我很想討論幾個人工智慧產業方面的問題。 此次人機大戰之後,再重複與其他圍棋高手的人機大戰,我想已經不是人工智慧的目標。已經在圍棋方面證明了自己的實力,谷歌還有必要再去重複挑戰其他高手嗎?或許會挑戰幾個,但不會太多。當然,不排除別的國家或公司的人工智慧產品會去重複 Alpha Go的故事。只是我感覺,人工智慧應該有下一步的目標。
  • 當我們老去時,會像現在的老人下象棋一樣玩電子遊戲嗎?
    當我們出門時,常常會在看到路邊正在下象棋的老人,周圍還圍著一圈差不多一個年齡段的觀戰者。廣場上還有一群伴隨著洗腦的音樂,聚集在一起跳舞的大爺大媽。他們以他們那個年代的娛樂方式來充實自己的老年生活,使自己勞累了一輩子的身心得到放鬆與愉悅。