學習量子誤差校正:圖像可視化的活動的人工神經元在Erlangen研究人員的神經網絡解決其任務。馬克斯·普朗克光科學研究所
神經網絡使基於量子物理的計算機能夠學習糾錯策略
量子計算機可以解決傳統計算機無法解決的複雜任務。然而,量子態對環境的持續幹擾極其敏感。計劃是使用基於量子錯誤校正的主動保護來對抗這種情況。馬普朗克光科學研究所所長弗洛裡安·馬夸特和他的團隊現在推出了一種量子誤差修正系統,藉助人工智慧,該系統能夠進行學習。
2016年,電腦程式AlphaGo在與世界上最優秀的人類棋手的圍棋比賽中贏了四局。鑑於一盤圍棋的棋路組合比宇宙中原子的數量還要多,這需要的不僅僅是純粹的處理能力。相反,AlphaGo使用的是人工神經網絡,它可以識別視覺模式,甚至可以學習。與人類不同的是,該程序能夠在短時間內練習數十萬次遊戲,並最終超越了人類最優秀的棋手。現在,埃爾蘭根的研究人員正在使用這種神經網絡為量子計算機開發糾錯學習。
人工神經網絡是模仿相互連接的神經細胞(神經元)行為的電腦程式——在埃朗根的研究中,大約2000個人工神經元相互連接。弗洛裡安·馬夸特解釋說:「我們從計算機科學中獲取最新的想法,並將它們應用到物理系統中。」「通過這樣做,我們受益於人工智慧領域的快速進步。」
人工神經網絡可以超越其他的糾錯策略
第一個應用領域是量子計算機,正如最近的論文所示,其中包括託馬斯·福塞爾(Thomas Fosel)的重要貢獻,他是埃朗根馬克斯·普朗克研究所(Max Planck Institute in Erlangen)的博士生。在這篇論文中,該團隊證明了具有alphago啟發架構的人工神經網絡能夠自行學習如何執行一項對未來量子計算機的運行至關重要的任務:量子誤差修正。如果經過充分的訓練,這種方法甚至有可能超越其他的糾錯策略。
要理解它所包含的內容,你需要看看量子計算機的工作方式。量子信息的基礎是量子比特,或稱量子位。與傳統數字位不同,量子位不僅可以採用0和1兩種狀態,還可以採用這兩種狀態的疊加。在量子計算機的處理器中,甚至有多個量子位疊加在一起,作為聯合狀態的一部分。這種糾纏解釋了量子計算機在處理某些複雜任務時的巨大處理能力,而傳統計算機在這些任務上註定要失敗。缺點是量子信息對周圍環境的噪音非常敏感。量子世界的這一特性和其他特性意味著量子信息需要定期修復——也就是量子誤差修正。然而,這需要的操作不僅複雜,而且必須保持量子信息本身完好無損。
量子糾錯就像一場規則奇怪的圍棋遊戲
「你可以想像量子計算機的元素就像棋盤一樣,」馬夸特博士說,談到他的項目背後的核心思想。量子位像碎片一樣分布在棋盤上。然而,與傳統的圍棋遊戲有一些關鍵的區別:所有的棋子都已經分布在棋盤上,一邊是白棋,另一邊是黑棋。一種顏色對應於狀態0,另一種對應於狀態1,在量子圍棋遊戲中,一步棋需要翻動棋子。根據量子世界的規則,碎片也可以採用灰色混合顏色,這表示量子態的疊加和糾纏。
當玩這個遊戲的時候,一個玩家——我們稱她為愛麗絲——採取的行動意在保持代表某種量子狀態的模式。這些是量子誤差修正操作。與此同時,她的對手竭盡所能地破壞這一模式。這代表了真實的量子位元所經歷的來自環境的過多幹擾所帶來的持續噪音。此外,量子圍棋的一個特殊的量子規則使遊戲變得特別困難:愛麗絲不允許在遊戲中看棋盤。任何對她揭露量子位碎片狀態的一瞥,都會破壞遊戲目前所處的敏感量子狀態。問題是:在這種情況下,她如何才能做出正確的舉動?
輔助量子位揭示了量子計算機的缺陷
在量子計算機中,這個問題可以通過在存儲實際量子信息的量子位之間定位額外的量子位來解決。可以採取偶然的測量來監控這些輔助量子位的狀態,從而使量子計算機的控制器識別出哪裡存在故障,並對這些區域中攜帶信息的量子位執行修正操作。在我們的量子圍棋遊戲中,輔助性的量子位元將由分布在實際遊戲片段之間的額外片段來表示。愛麗絲偶爾可以看一看,但只看這些輔助的部分。
在埃朗根研究人員的工作中,愛麗絲的角色是由人工神經網絡完成的。他們的想法是,通過訓練,網絡將變得非常善於扮演這一角色,以至於它們甚至可以超越智能人類設計的修正策略。然而,當研究小組研究了一個涉及5個模擬量子位元的例子時,他們能夠證明僅僅一個人工神經網絡是不夠的。由於網絡只能收集少量關於量子位元狀態的信息,或者更確切地說,關於量子圍棋遊戲的信息,它永遠無法超越隨機試驗和錯誤的階段。最終,這些嘗試破壞了量子態,而不是恢復它。
一個神經網絡利用它的先驗知識來訓練另一個神經網絡
解決方案以附加神經網絡的形式出現,它充當第一個網絡的老師。憑藉對將要被控制的量子計算機的先驗知識,這個教師網絡能夠訓練另一個網絡——它的學生——從而引導它成功地進行量子校正。然而,首先,教師網絡本身需要對量子計算機或其被控制的組件有足夠的了解。
原則上,人工神經網絡使用獎勵系統進行訓練,就像它們的自然模型一樣。通過量子誤差校正成功恢復原始量子態,提供了實際的獎勵。馬夸特醫生解釋說:「然而,如果僅僅是這個長期目標的實現給予了獎勵,那麼在無數的糾正嘗試中,它就會來得太晚了。」因此,埃爾蘭根的研究人員開發了一種獎勵系統,即使在訓練階段,也能激勵教師神經網絡採取一種有前景的策略。在量子圍棋遊戲中,這個獎勵系統會在不洩露細節的情況下,向愛麗絲提供給定時間內遊戲的一般狀態。
學生網絡可以通過自身的行為超越教師
馬夸特說:「我們的第一個目標是讓教師網絡學會在沒有進一步人類幫助的情況下成功地執行量子錯誤修正操作。」與學校的學生網絡不同,教師網絡不僅可以基於測量結果,還可以基於計算機的整體量子狀態來實現。由教師網絡培養出來的學生網絡在開始時同樣優秀,但通過自身的行動可以變得更好。
除了量子計算機中的錯誤校正,Florian Marquardt設想了人工智慧的其他應用。在他看來,物理學提供了許多可以從人工神經網絡模式識別的使用中獲益的系統。