近日,來自上海交通大學的金賢敏教授研究團隊開發了一種更加複雜的圍棋版本,研究人員利用光子糾纏模擬處於量子疊加狀態的棋子,開發出了量子力學版本的圍棋。通過量子力學中的固有隨機性,以增加圍棋遊戲不確定性。
研究論文近日發表在 arXiv 預印本平臺。
1997 年, IBM 的 「Deep Blue(深藍)」 計算機擊敗西洋棋大師加裡・卡斯帕羅夫(Garry Kasparov),當時引發了人們對於 「未來人工智慧或許可能超越人類大腦」 的無窮遐想,也為人機對戰的發展樹立了一座裡程碑。
相比象棋,圍棋這一古老的博弈遊戲擁有著更加複雜多變的棋局,計算難度之大可比天文數字,堪稱世界上最複雜的棋類遊戲。想要機器在棋盤上戰勝人類,也成為多年來人工智慧領域的一大挑戰。
2016 年,人工智慧公司 DeepMind 的深度學習算法 AlphaGo 擊敗世界頂尖圍棋選手李世石,當時一些媒體甚至用 「人類最後的智力驕傲即將崩塌」 來渲染此事。
2017 年,DeepMind 公司發布的新人工智慧算法 AlphaZero,僅利用強化學習算法,通過 3 天的自我學習訓練,擊敗了曾經擊敗人類的AlphaGo,成為了世界頂尖的圍棋手。
考慮到圍棋中可能出現的棋盤位置數量遠高於此,想要讓機器擊敗圍棋大師,或在撲克牌和麻將遊戲中擊敗人類,已經成為人工智慧程序的開發者們一直在尋求更大的挑戰。
中國上海交通大學的金賢敏教授表示, 「長期以來,棋盤遊戲一直是人工智慧的良好測試床,因為這些遊戲提供了具有特定和簡單規則的封閉世界」。
2016 年,物理學家 Andre Ranchin 提出了 一種 「量子圍棋」,和當時開發的量子力學西洋棋一樣,都是出於對量子力學的科普和教學目的。如今,金賢敏教授的研究團隊設計出來的量子圍棋,其目的更多是出於挑戰人工智慧對弈程序的算力極限。
圍棋起源於中國,在古代稱之為 「弈」,是一種類似於跳棋但又高於跳棋的棋盤遊戲,棋手使用格狀棋盤和黑白石子進行對弈。棋盤上縱橫各 19 條線段將棋盤分成 361 個交叉點,棋子走在交叉點上,雙方交替行棋,落子後不能移動,以圍地多者為勝。
圍棋一直以來也被認為是世界上最複雜的棋盤遊戲之一,但對於機器學習算法來說,圍棋實際上並非最難處理的遊戲,它不僅取決於遊戲的複雜性,而且與遊戲的特性和策略高度相關。
量子圍棋可以在普通的棋盤上玩,但也需要一臺計算機來記錄棋局的狀態,並需要設備來生成一對量子糾纏的光子。
在經典的圍棋遊戲中,每位棋手每走一步放一顆棋子,而量子圍棋則是讓對弈雙方放下成對的 「糾纏」 棋子,兩顆棋子都留在棋盤上,直到它們接觸到相鄰頂點的一顆棋子,這時通過一次 「測量」 將糾纏光子對疊加起來,最終也就只落下一顆棋子。
這種糾纏光子帶來的隨機性使得圍棋遊戲變得更加複雜,對弈雙方的決策難度要求更高。棋手可以調整自己的量子棋子出現在一個位置的概率,也使得其中一個棋手可以比對手擁有更多關於棋子可能最終出現在哪裡的信息。
這種更加複雜的量子圍棋,無疑也給人工智慧圍棋手帶來了新的挑戰。
量子圍棋機的草圖
a)量子石盒子的實驗裝置。可以將生成的光子對調整為最大糾纏態、非最大糾纏態和乘積態,以充當不同的量子石。
b)塌方測量模塊。當光子進入該模塊時,將通過偏振分束器(PBS)對其進行測量,然後量子態崩潰至路徑 1 和 3(或路徑 2 和 4),四個單光子探測器將光子信號轉換為電子信號。
c)時間記錄模塊。塌方測量模塊的四個輸出通道將被引導到該模塊中,可以通過適當的重合時間窗口來獲取每對糾纏光子的崩潰結果信息,並將其作為有效存儲狀態記錄在時間序列數據中。這裡將通道 1 和 3 中的信號重合編碼為 1,將通道 2 和 4 中的信號重合編碼為 0。
d)從時間序列數據中使用量子石玩量子圍棋的草圖。兩個機械臂代表兩個一起執行量子圍棋遊戲的棋手代理,他們從量子石盒子中交替選擇量子石,並將每塊石頭放在虛擬板的兩個交叉點上。當量子石被放在有鄰居的相交處時,遊戲會從時間序列數據中獲得崩潰結果,並在崩潰測量模塊中使用回溯的測量結果。
倫敦瑪麗皇后大學(Queen Mary University of London)的 Mike Cook 表示:「量子圍棋增加了圍棋規則的複雜性,因為它擴展了玩家在對戰回合中棋盤可能的變化方式,增加了棋手在對弈過程中的精神負擔,也增加了預測棋局下一步的計算能力。」
在前文提到的量子圍棋機中,研究人員通過不斷產生糾纏光子並存儲測量結果,在一小時內產生了大約 1 億個坍塌概率,這些數據足以支持在一個 10,000 * 10,000 的棋盤上進行一億步棋的遊戲。通過分析時間序列的 1 和 0 狀態分布,研究人員發現這些數據是隨機的。
金賢敏教授表示,由於量子力學的固有性質,他們所設計的這種量子圍棋產生的隨機性與一些經典物理過程所存在的隨機性相比,要更清晰得多。
由於在量子圍棋中,當任何一顆棋子處於糾纏狀態時,棋手在測量前都無法判斷糾纏光子對中的哪顆會最終落在棋盤上,因此也就不清楚能否成功包圍對手。
研究人員表示,測量過程可以通過工程量子糾纏進行調整,如果每對糾纏光子代表的棋子最大程度地糾纏在一起,測量結果完全會是隨機的。由於在傳統的圍棋遊戲中,落子概率只有下棋的人知道,但引入光子糾纏的量子圍棋的出現,使得圍棋遊戲失去了一些隨機性,但同時卻增加了信息不完整的元素。
金賢敏說:「隨著人工智慧在各個領域超越人類,量子系統可能是人類意識和直覺擊敗人工智慧巨大計算能力的唯一空間。」 目前,金教授的研究團隊還尚未訓練人工智慧下量子圍棋,所以無法斷定在這樣的棋局中,人工智慧是否能擊敗人類選手。
Cook 表示,更難的棋局可能不是未來的方向。他說:「人工智慧研究不僅僅是要找到最複雜、最糾結的問題,還需要找到那些看似簡單的問題,並弄清楚為什麼人工智慧在這些問題上表現得如此糟糕。量子圍棋聽起來是一個非常有趣的遊戲,但我不認為通過擊敗量子圍棋,我們會學到很多關於人工智慧的知識。」
研究人員指出,量子圍棋的複雜性和難度之間的確切關係「仍然是一個懸而未決的問題」,但它的魅力在於能夠覆蓋更多的難關。
他們宣稱,通過增加虛擬圍棋棋盤的大小以及調整圍棋的糾纏度,即使那些隱藏了最多信息的遊戲,比如麻將,也有可能達到同樣的難度。因此,量子圍棋可以為 「測試人工智慧的新算法提供一個通用且有前景的平臺」。
排版:趙辰霞
編審:王新凱參考資料:
https://physicsworld.com/a/quantum-go-machine-plays-ancient-board-game-using-entangled-photons/https://www.newscientist.com/article/2250551-quantum-version-of-the-ancient-game-of-go-could-be-ultimate-ai-test/https://phys.org/news/2020-08-entangled-photons-quantum.htmlhttps://arxiv.org/abs/2007.12186