思維是一個能夠思考的功能體並支持智能行為。人類和許多其他動物一樣有思維。在自然中,思維是通過大腦來實現的,大腦是一種特殊的設備。然而,人工智慧中一個關鍵的基礎理論是思維是一種特殊類型的計算實體,即認知系統,可以通過各種物理設備實現,無論是自然大腦還是傳統的通用功能計算機或其他功能完備的硬體或軟體形式。
早期任務特定模型導致了認知科學的支離破碎的方法以及由此而產生的進展的困難(Newell 1973)。因此紐厄爾(Allen Newell)提出了人類認知的綜合模型的概念,在這個模型的基礎上,可以根據一組共同的機制和表徵來開發特定任務的模型,最終目標是實現統一的認知理論(Newell 1990)。與計算機體系結構一樣,認知結構定義了一種能夠在數據上運行程序的通用計算設備。關鍵的區別在於:(1)認知結構中支持的程序和數據的種類僅限於那些適合人類智能行為的程序和數據;(2)程序和數據最終都是為了從經驗中自動獲得,也就是說,學習的程序和數據,而不是通過編程獲得的,除了一套有限的先天程序。認知結構會有自己的程式語言,就像計算機體系結構一樣,但它們是以知識和技能的形式產生可學習的智能行為的程式語言。這就是認知結構與任意傳統程式語言的區別。
從這個共同的起源,認知結構的概念形成了多個分支領域,每個領域都專注於不同的目標。在認知心理學中,諸如ACT-R、Clarion和LIDA(Franklin和Patterson 2006)等結構試圖解釋來自控制實驗的詳細行為數據,這些實驗涉及記憶、問題解決和感知行動相互作用。在人工智慧中,Soar和Sigma等體系結構專注於開發功能能力,並將其應用於諸如自然語言處理、模擬中智能代理的控制、虛擬人和具體化機器人等任務。在神經科學領域,Leabra(OReilly,Hazy,and Herd 2016)和Spaun(Eliasmith 2013)等結構採用了與人腦兼容的機制和結構,但主要應用於簡單的記憶和決策任務。在機器人學中,體系結構如4D/RCS(Albus 2002)和DIARC(Schermerhorn et al。2006年)關注物理機器人的實時控制。
「通用類人認知結構」(Goertzel、Pennachin和Geiswiller 2014a)在概念上融合了CogPrime(Goertzel、Pennachin和Geiswiller 2014b)、CogAff(Sloman 2001)、LIDA、MicroPsi(巴赫2009),以及4D/RCS結構,加上一種深度學習的形式(Arel、Rose和Coop 2009)。這項工作的許多目標與本標準模型確定的目標相似;然而,其結果更多的是一種模仿而非共識——從這些體系結構中組合出不同的部分,而不是確定它們之間的共同點——因此也更傾向於完整性而不是一致性。
本文中開發的標準模型是基於其他三種結構及其相關的研究項目:ACT-R、Soar和Sigma。前兩個是目前存在的最完整、最持久、應用最廣泛的體系結構。ACT-R起源於認知科學並延伸到人工智慧領域(例如,Sanner等人。[2000]),它也映射了人腦的各個區域(Anderson 2007),使其能夠與Leabra神經結構相結合(Jilk等人。2008年),並被用於控制機器人(例如,Kennedy等人。[2007年])。Soar起源於人工智慧,儘管它已經延伸到認知科學(Newell 1990),並被用於控制機器人(Laird和Rosenbloom 1990;Laird et al。2012年)。Sigma是一個較新的發展,部分是基於從另外兩個方面吸取的教訓。它也起源於人工智慧,但已經開始接觸認知科學(例如,Rosenbloom[2014]),它基於圖形模型的廣義概念,該概念最近被擴展到包括神經網絡(Rosenbloom、Demski和Ustun 2016b),並被用於控制虛擬人(Ustun和Rosenbloom 2016)。
上一節介紹了認知結構的一般概念。在這裡,我們將介紹在構建擴展標準模型的過程中所關注的三種特定體系結構,每個體系結構都用自己的術語進行描述,並附有一個提供其結構的標準特徵的圖。這些圖形都是採自各原始文獻而未改動,以找出它們的共同點——例如,Soar的圖示明確顯示了學習機制,而其他兩個沒有——除了對組成部分使用一個共同的配色方案:棕色代表工作記憶,紅色代表陳述性記憶,藍色代表程序性記憶,黃色代表感知,以及綠色表示行動。識別共性的核心工作交給標準模型,如下一節所述。
ACT-R被構造成一組異步並行運行的模塊,圍繞一個提供全局控制的基於規則的過程化模塊(圖1)。模塊內的處理通常是高度並行的,但每個操作只產生一個單獨的結果,該結果被放置在特定於模塊的工作內存緩衝區中,在該緩衝區中,過程模塊可以將其作為一個條件進行測試,並將其傳輸到其他緩衝區,以觸發相應模塊中的進一步活動。
圖1. ACT-R 認知結構
Soar還包括一組異步內部並行模塊,包括基於規則的過程內存。Soar是圍繞一個更廣泛的全局工作記憶來組織的(圖2)。除了視覺空間模塊和控制機器人或虛擬效應器的行動模塊外,它還包括獨立的情節和語義聲明性記憶。
圖2. SOAR認知結構
Sigma是一種新的結構,它將現有結構(如ACT-R和Soar)的經驗與圖形模型的單獨學習相結合(Koller和Friedman 2009)。它在結構上不太模塊化,只提供單一的長期記憶,它與工作記憶、感知和行動部件一起建立在圖形模型中。相反,它試圖通過體系結構之上的專門化和聚合來產生其他兩個模塊提供的不同功能(圖3)。例如,Sigma的長期記憶包含了各種程序性和陳述性功能,同時也擴展到了核心的感知方面和視覺空間意象。
圖3. Sigma認知結構
這三種結構都圍繞著一個由程序記憶驅動的認知循環來構建行為,複雜的行為是以這樣的循環序列出現的。在每個循環中,過程記憶測試工作記憶的內容,並選擇一個用於修改工作記憶的動作。這些修改可導致從程序性記憶中檢索到進一步的動作,或者它們可以在其他模塊中啟動操作,例如行動動作、記憶檢索或感知獲取,這些操作的結果將被存儲回工作記憶中。
標準模型在本節中,我們將介紹標準模型,分解為結構和處理;記憶和內容;學習;感知和行動(或者,用機器人學的術語:動作)。這個模型代表了我們對在AAAI研討會上簡要介紹的共識的理解,這些共識是基於我們對本文所關注的三種結構的理解而具體化的。
認知結構定義了信息和處理是如何組織成組件的,以及信息如何在組件之間流動。標準模型認為,思維不是一個沒有差別的信息和處理池,而是由具有不同功能的獨立模塊組成。圖4顯示了標準模型的核心組件,包括感知和行動、工作記憶、陳述性長期記憶和程序性長期記憶。在這種粒度上,與幾十年前標準模型中可能出現的情況相比,除了過程性和聲明性長期內存之間的區別之外,看不到多少進展。然而,正如本節其餘部分和表1所總結的那樣,當我們深入研究時,會有更大的進一步進展。
圖4. 標準模型結構
圖4中的每一個模塊都可以被看作是單一的,或進一步分解成多個模塊或子模塊的,例如多個感知和行動模式、多個工作記憶緩衝區、語義和情景陳述性記憶,以及程序匹配、選擇和執行的各個階段。除了感知模塊和行動模塊之間的直接連接之外,工作記憶充當組件的內部通信緩衝器。例如,它可以被認為是一個單獨的形式,共同組成的視覺記憶。長期陳述性記憶、感知和行動模塊都只能訪問和修改其相關的工作記憶緩衝區,而程序性記憶可以訪問所有的工作記憶(但不能直接訪問長期陳述性記憶的內容或其本身)。所有的長期記憶都有一個或多個相關的學習機制,這些機制根據體系結構的處理自動存儲、修改或調整信息。
標準模型的核心是認知周期。程序性記憶誘導每個周期選擇一個單獨的有意行為所需的處理。每個動作都可以對工作內存進行多個修改。工作記憶的改變可以對應於抽象推理的一個步驟或外部行為的內部模擬,但它們也可以啟動從長期陳述性記憶中提取知識,在外部環境中啟動行動動作,或對感知產生自上而下的影響。外部的和內部的各類複雜的行為都是由這樣的循環序列產生的。在人類行為的映射中,認知周期大約在50毫秒左右運行,相當於紐厄爾層次結構中的有意行為水平,儘管它們觸發的活動可能需要更長的時間才能執行。
儘管在過程內存的內部處理過程中可能會出現顯著的並行性,但是每個周期只會選擇一個單獨的有意行為,這個限制會導致性能上的一系列瓶頸。重要的並行性也可能發生在組件之間,每個組件都有自己的時間進程,一旦啟動就獨立運行。這些組件的內部處理細節並沒有被指定為標準模型的一部分,儘管它們通常涉及到顯著的並行性。程序記憶與工作記憶相互作用所產生的認知循環為連貫性思維提供了必要的連續性,以應對組件內部和跨組件的嚴重並行性。
儘管期望的是對於給定的系統,附加感知和行動模塊以及附加的存儲模塊,例如場景記憶,可以作為代理的一部分而存在,但有一個強烈的共識,即不需要額外的專門的結構模塊來執行複雜的認知活動,如規劃、語言處理和心理理論,儘管可以包括這些活動的結構原語(例如,規劃的視覺空間圖像,或語言處理的語音循環)。所有這些活動都源於原始行為的構成,即通過一系列的認知循環,以及一個程序性的記憶驅動著它。
記憶組件用於存儲、維護和檢索內容以支持其特定功能。這些內容的核心是用符號上的關係來表示的。然而,補充這些關係結構的是量化元數據,它是標記著符號和關係的實例,以調整決策以及符號和關係的存儲、檢索和學習。下面將對這三個內存組件中的每一個進行簡要概述。
工作記憶提供了一個臨時的全局空間,在這個空間內,符號結構可以由感知和長期記憶的輸出動態組合而成。它包括從陳述性記憶和行動動作中啟動檢索的緩衝區,以及用於維持感知和陳述性記憶檢索結果的緩衝區。它還包括行為產生和問題解決所必需的臨時信息,例如關於目標、問題的中間結果和任務模型的信息。所有的工作記憶都可以通過程序記憶進行檢查和修改。
程序性記憶包含有關操作的知識,無論是內部還是外部。這包括如何選擇行動,以及如何提示(對於外部行動)或執行(對於內部行動),產生可以稱為技能和程序的東西。任意程序通常被認為是過程內存的一種形式,但它們提供了一種嚴格的控制結構,用於決定下一步要做什麼,而這是很難中斷、獲取和修改的。在標準模型中,過程內存是基於動作的模式定向調用,通常是以帶有條件和動作的規則的形式強制轉換的。規則條件指定工作內存內容上的符號模式,規則操作修改工作內存,包括用於顯示聲明性內存和行動動作的緩衝區。從多個匹配規則中獲取的知識如何集成在一起存在分歧,但共識是通過一個單獨的有意行為,且元數據會影響這個選擇。
陳述性記憶是對事實和概念的長期儲存。它的結構是符號關係的持久圖,元數據反映了學習和檢索中使用的最近性和(共)出現頻率等屬性。檢索是通過在工作記憶中指定的緩衝區中創建一個線索來啟動的,結果存放在該緩衝區中。除了事實之外,陳述性記憶還可以是系統直接經驗的存儲庫,以情景知識的形式出現。關於是否存在一個統一的陳述記憶,或者是否存在兩個記憶,一個是語義記憶,另一個是情節記憶,目前還沒有一個共識。這些術語之間的區別大致上分別對應於語義上的抽象事實與情境化的經驗知識,但其確切含義是當前爭論的主題。
學習
學習包括在程序性和陳述性長期記憶中自動創建新的符號結構,以及調整元數據。它還涉及到感知和行動系統中非符號內容的適應。標準模型假設所有類型的長期知識都是可學習的,包括符號結構和相關的元數據。所有的學習都是漸進式的,並在系統行為過程中產生的經驗中在線進行。所學知識通常是基於某種形式的信息反向流動,通過這些經驗的內部表現形式。長時間的學習被認為是由短期經驗積累而來的。在過去的時間裡,這些明確的經驗可以包括更長的時間。長期記憶的學習機制是存在的,雖然在目前的架構中還沒有完全實現,但是對於感知和行動模塊來說,它們也被認為是存在的。程序記憶至少有兩種獨立的學習機制:一種是從某種形式的規則觸發組合中創建新規則,另一種是通過強化學習在競爭性審議行為之間進行選擇。聲明性內存還涉及至少兩種學習機制:一種用於創建新的關係,另一種用於優化關聯的元數據。
感知和行動
感知將外部信號轉換成符號和關係,以及相關的元數據,並將結果放入工作記憶中的特定緩衝區。有許多不同的感知模塊,每個模塊都有來自不同模態的輸入——視覺、聽覺——每個模塊都有自己的感知緩衝區。標準模型假設注意力瓶頸限制了工作記憶中可用的信息量,但不包含對每個概念模塊內信息的內部表達(或處理)的任何承諾,儘管它被假定為本質上的非符號化,包括學習。從工作記憶到感知的信息流是可能的,提供了可以用來影響認知分類和學習的預期或可能的假設。
行動模塊通過控制作為系統主體一部分的效應器,將存儲在緩衝區中的符號結構及其元數據轉換為外部動作。與感知一樣,可以有多個行動模塊(手臂、腿部)。從機器人學和神經科學文獻中我們已經知道了很多關於行動控制的知識,但是目前對於標準模型中應該採用的形式還沒有達成一致意見,這主要是由於在類似人類的模型中相對缺乏對它的關注。
總結
一個綜合性的人類大腦標準模型可以為機器人體系結構的發展提供一個藍圖,它可以充當真正的人類公司和隊友,也可以作為一個高層結構,努力建立一個生物學上詳細的大腦工作的計算機重建,例如藍腦計劃。標準模型可以在指導相關學科的研究方面發揮綜合作用——例如,ACT-R已經被應用於大腦區域集合的建模,並與神經模型集成,ACT-R和Soar都已用於機器人學(而Soar和Sigma是虛擬人的姊妹學科),但是標準模型的存在可以使結果更具普遍性和指導性。相反,這些規程可以為標準模型提供額外的見解和約束,從而導致進一步的進步和融合。此外,標準模型還為理論思想的整合提供了一個平臺,而無需在完整的認知架構中實現。
希望這一標準模型的嘗試,因為它是從研討會的初始草圖擴展到三個類似人的架構,隨著時間的推移,它將擴展到更多的數據、應用程式、架構和研究人員。這部分是一個科學的過程,一部分是一個社會過程。科學方面的驅動力是通過研究人類思維和類人人工思維而獲得的關於類人思維的知識。社會方面需要通過跨越越來越多關注人類認知架構的社區來驅動,甚至可能超越這一點,擴展到其他有相關興趣的社區。這可以通過一次擴展到一個新的架構和倡導者,或者通過多個這樣的人聚集在一起看能找到什麼新的共識的專題討論會或研討會來逐步實現。社區範圍內的調查也是可行的,但我們的感覺是,通過迴避交互解決差異的困難部分,這可能不會產生期望的結果。相反,我們希望標準心智模式的共同利益將導致社區貢獻和逐步完善的良性循環。
作者簡介
John E. Laird是密西根大學約翰·L·蒂什曼工程專業教授。他是Soar模型的原始開發者之一,並領導著它的持續發展。他是Soar Technology,Inc.的創始人和董事長,也是AAAI、AAAS、ACM和認知科學學會的研究員。
Christian Lebiere是卡內基梅隆大學心理學系的研究人員。他是ACT-R認知架構的最初開發者之一,並與John R.Anderson合著了《思想的原子成分(Atomic Components of Thought)》。他是生物啟發認知結構協會的創始成員。
Paul S.Rosenbloom是南加州大學計算機科學教授,南加州大學創新技術研究所認知架構研究主任。他是Soar架構的最初開發者之一,也是Sigma架構的主要開發者。他是《論計算:第四大科學領域》的作者,同時也是AAAI和認知科學學會的成員。
註:為便於快速閱讀理解,本文對原文進行了摘抄、裁剪和翻譯,本文對所述論點準確性不負任何責任,請關注論文原版獲得更準確的陳述。原文連結:
https://www.aaai.org/ojs/index.php/aimagazine/article/download/2744/2671
請長按下方二維碼,關注通用人工智慧公眾號,第一時間獲取領域相關信息。