基於空間認知的知識表示和推理探討

2020-12-12 騰訊網

人工智慧的發展已經進入快車道,作為新一輪科技革命和產業變革的重要驅動力量,人工智慧技術正在深入各行各業,悄無聲息地改變著人們日常生活的方方面面,「智能化」已經成為幾乎所有領域的發展趨勢。如此迅速的發展也不可避免地暴露了當前人工智慧方法在魯棒性、對抗性和可解釋性方面的局限性,如何尋求突破、實現更通用的人工智慧,是科學研究和產業應用都十分關心的問題。回顧人工智慧的發展,我們可以發現,知識是人工智慧的核心命題,智能系統無一例外地是在尋找合理方法來「固化」人類的知識,符號主義和連接主義的區別主要在於它們對知識不同的表達方式。因此,探索新型的知識表達是突破當前人工智慧方法瓶頸的有效且必然的途徑。認知是人類獲得和應用知識的過程,越來越多的科學家注意到目前人工智慧窘境的原因是有「感」無「知」,如何將機器的知識表示和應用與人類認知過程統一起來。

1. 人工智慧研究的趨勢與挑戰

人工智慧的目標是研究和實現能夠像人一樣具有感知、學習、推理和規劃等智能行為能力的智能系統。以符號推理為基礎的知識驅動方法被認為是第一代人工智慧(符號主義人工智慧)。1977年,ACM圖靈獎獲得者愛德華·費根鮑姆(Edward Feigenbaum)在第五屆國際人工智慧會議上提出,將知識融入計算機系統的知識工程研究領域,去解決只有領域專家才能解決的複雜問題,建立了智能系統就是「知識庫+推理引擎」的智能系統框架。基於符號知識表示和推理的各類專家系統在醫療診斷、地質勘探等領域的應用,將人工智慧研究推向高潮。基於符號的知識推理的方法多利用人工編寫的或者從已有知識庫習得的邏輯規則進行知識推理。人工編寫邏輯規則的方法難以適應大規模知識推理的需求,存在推理覆蓋度低和推理效率低的問題。知識庫的不完備性也使得從稀疏數據中學習得到的邏輯推理規則準確性不高,尤其是隨著推理規則階數的增加,規則的準確性下降迅速。

以統計機器學習、深度學習為基礎的數據驅動的第二代人工智慧方法從20世紀80年代後期逐漸興起,特別是當前深度學習主導的人工智慧處於前所未有的興盛時期(連接主義人工智慧)「數據+算力+算法」的智能系統架構利用不斷增加的大數據、高效存儲計算能力和先進的深度學習算法產生智能行為。第二代人工智慧在計算機視覺、機器翻譯和自然語言處理中取得了巨大的成功,成為端到端特定智能任務的典型模型。

然而,當前以深度學習為代表的人工智慧仍然面臨很多問題,距離人們想像當中的「智能體」還有很大差距,還不能實現第一代智能系統框架試圖做的事情,如推理、規劃及其過程的解釋。基於深度學習的知識推理將傳統的邏輯推理看成一個檢索過程,通常利用表示學習方法學習知識庫中實體、關係的向量化表示,然後利用向量間的數值計算替代傳統的基於符號的邏輯推理。這類方法覆蓋度高、推理速度快,但是推理準確度低、對抗性差,容易被欺騙,推理過程可解釋性差。

中科院院士、清華大學教授張鈸指出,第三代人工智慧是實現可解釋的、魯棒的、可信安全的智能系統,實現帶理解的人工智慧。美國國防部高級研究計劃署(DARPA)也提出,第三代人工智慧是能夠實現情景自適應的智能系統,是具有感知、推理、規劃和學習能力的智能系統。張鈸院士進一步提出第三代人工智慧是「大數據+算法+算力+知識」的架構,強調了知識在實現可解釋推理和規劃中的重要作用。因此,數據驅動的方法如何利用知識表示和推理獲得智能系統的可解釋和魯棒性是當前人工智慧的發展趨勢,也是面臨的重要挑戰。

2. 兩類人工智慧方法的特點及其與人類認知的一致性

符號主義方法在推理和決策中關注知識的結構和規則。知識表示和推理的符號主義方法對知識進行概括和顯性的表示,知識可理解,雖然可以實現可驗證和可解釋的推理,但是符號推理對輸入數據有極高的要求,不能容納噪聲,推理規則手工構建容易存在知識匱乏,導致推理缺乏可伸縮性。目前被廣泛應用的大規模知識圖譜通常不完整而且存在不一致性,知識圖譜的符號主義推理繼承了符號推理系統的這些弱點,不能滿足當前基於大規模知識圖譜的推理任務。

與符號主義方法相對的連接主義方法,建立了神經網絡模擬大腦彼此相連的神經元。輸入和輸出都被表示成連續空間中的實值向量,知識被表示成神經網絡中連接的權重。知識推理就是在樣本學習的基礎上以向量相似計算來近似得到結果。連接主義方法有很多符號方法不具備的優點:無須手工構建推理規則、可以處理大規模數據、對輸入具有極強的魯棒性。這種推理有效地模擬了人腦在不確定條件下的近似推斷方法。

但是,神經網絡損失了符號主義方法的優點:神經網絡的學習完全依賴於訓練數據(通常需要大量高質量的訓練數據),其推理質量受訓練數據質量的影響,推理結果不具有可解釋性和可驗證性。目前雖然有基於深度學習的知識推理的相關研究,如多跳推理、知識補全等工作,但是距離完成人工智慧系統的自動推理、規劃及其推理過程的可解釋還有很大距離,利用相似計算進行的近似推理能否達到符號推理的質量是一個懸而未決的問題。

符號主義方法和連接主義方法在輸入輸出以及功能上有明顯的互補關係。這種互補關係可以通過人腦的兩種思維系統一快思維(系統1)和慢思維(系統2)的互補性來解釋。在人類認知中,系統1的基本功能是激活相關聯的對象:知識、情感、動作,被激活的對象繼續激活與其關聯的對象,將激活的內容構建成一個「和諧」的故事。只要「和諧」,系統1就認為是對的,這導致系統1容易被欺騙。系統2的基本功能是數學計算和邏輯推理,它遵循規則,執行計算、推理,並做出深思熟慮的選擇。系統2能改變系統1的工作方式。如果沒有系統2,系統1幾乎可以自動、快速地相信所有東西。系統2和系統1之間的互補協調關係啟示我們應該將神經網絡和符號系統統一起來進行研究,探索融合它們的新型知識表示和推理方法。因此,融合數字與符號的知識表示和推理成為實現大數據環境下具有魯棒可解釋推理能力的智能系統的可行途徑。

3. 融合數字與符號知識推理的可行途徑

知識圖譜是對客觀世界認知的反映,以結構化形式描述對象(概念、研究基礎實體、事件和規則等)及其之間的關係。知識圖譜所反映的語義空間與人腦中的空間認知模型具有一致性。認知理論研究表明,人腦中的認知模型是以認知的物理空間為參照來描述的對象之間的關係。空間認知模型是描述物理空間中物體間關係的空間模型,用空間區域表示物體,以空間區域之間的拓撲關係為基礎表示物體間的關係,如方位關係和距離關係。當前深度神經網絡將所有對象表達成低維實值向量空間中的點,無法準確表示人類認知空間中這些對象之間的複雜關係。因此,需要將深度神經網絡中用向量表示的對象提升為區域表示,以區域間的拓撲關係描述以符號表示的知識圖譜中對象之間的結構關係,以此構建融合數字與符號的幾何認知空間,實現對知識圖譜表徵的符號語義空間與深度學習得到的向量空間的有機結合。

融合數字和符號知識表和推理的研究思路,具體以認知理論中認知空間的拓撲表示為理論支撐,通過將數字空間的向量表示提升為區域表示,與符號幾何空間化表示結合,既可以保留深度學習的向量特徵,又可以通過區域間的拓撲關係學習到知識驅動方法的知識結構,對於突破當前深度學習難以利用已有知識的結構進行有效可解釋的推理計算,以及克服當前符號推理中知識不足帶來的推理缺陷,具有創新意義和先進性。

4. 實現上述思路面臨理論和技術兩方面的挑戰

在理論研究方面,空間認知理論認為物理空間是人類認知的第一個領域,其他領域的認知都把物理空間的認知當作參照領域,幾何結構被認為是除符號主義和神經網絡外的另一種知識表示形式,認知的幾何空間中,客觀世界認知的對象表示成物理空間的區域,對象之間的關係表示為物理空間區域之間的拓撲關係。符號空間化的向量提升需要將深度學習得到的向量很好地保留在它對應的區域中;符號投射需要將符號結構無誤差地對應到空間關係(拓撲、方位、距離)。用幾何構造的方法對樹結構知識的空間化大規模實驗可以證明這種表示的存在,並在概念上下位結構推理和三元組分類預測實驗中得到了有效驗證。除常見的樹結構表示外,知識圖譜還包含大量的複雜結構,如概念、實體、屬性及其關係,這些構成了更複雜的圖結構,如有向無環圖和格結構等。在已有的研究基礎上,對更廣泛知識結構的知識圖譜和它從表示學習獲得的向量,是否都存在符號空間化表示,以及如何基於幾何空間對現有的知識圖譜推理方法進行改進,使其能同時展示向量推理的魯棒性和符號推理的準確性,這是未來基於空間符號理論知識表示和推理面臨的理論挑戰。

在技術方法方面,如何有效利用幾何構造方法把知識圖譜中的結構信息用高維球體間的空間關係和表示學習的向量融合起來,在既包含知識結構信息又有相似度信息的高維球上尋找解決問題的方法,是基於空間符號理論知識表示和推理面臨的技術挑戰。具體地,在知識表示中,需要研究用高維球體表示更複雜的一對多關係的知識圖譜結構的方法,需要考慮幾何空間中區域之間更多拓撲關係,並把現有的反向傳播方法與幾何構造方法結合起來覆蓋知識圖譜中的各類關係,這些都是知識圖譜的符號空間化知識表示面臨的挑戰。在知識推理中,幾何空間知識圖譜區域化和拓撲關係的表示可以克服原有深度學習以相似度計算為基礎的推理的局限性,可以在高維空間上進行嚴謹的結構化推理。但是也還有很多問題需要探討,如:如何在符號空間化的知識圖譜上減少推理路徑的搜索規模,提高多跳推理的性能和推理準確性;如何學習空間區域之間拓撲關係隱含的推理規則,實現顯式地規則空間化;如何將實現在符號空間化的結構上實現複雜邏輯關係推理等。

相關焦點

  • 認知推理:從圖表示學習和圖神經網絡的最新理論看AI的未來|附報告...
    、邊及其附帶的標籤、屬性和文本等信息的建模,從而更好地利用網絡結構進行精細建模和深度推理,相關技術已經被廣泛用於數據挖掘、社會網絡分析、推薦系統、自然語言處理、知識圖譜等領域。不是的,它既可以做問答,也可以做知識圖譜的補齊,下圖左邊是一個知識圖譜,右邊是基於剛才的模型來做知識圖譜的一個補齊,這是一個基本的一個思路。這就是認知圖譜怎麼和推理結合在一起。
  • 從知識圖譜到認知圖譜:歷史、發展與展望
    知識圖譜由節點和邊組成,節點表示實體,邊表示實體與實體之間的關係,這是最直觀、最易於理解的知識表示和實現知識推理的框架,也奠定了現代問答系統的基礎。從20世紀80年代的知識庫與推理機,到21世紀初的語義網絡和本體論,其核心是早期版本的知識圖譜,要麼側重知識表示,要麼側重知識推理,但一直苦於規模小、應用場景不清楚而發展緩慢。
  • 百分點認知智能實驗室:基於知識圖譜的問答技術和實踐
    百分點認知實驗室參加了該評測任務中的」知識圖譜的自然語言問答」比賽,經過長達3個多月的激烈角逐,百分點認知智能實驗室在比賽數據集上得分0.90106,位列A榜第三名。本文主要介紹實驗室在本次比賽和基於知識圖譜問答業務的實踐中使用的技術方案。
  • 「神經+符號」:從知識圖譜角度看認知推理的發展
    註:這裡所說的System 1和System 2是指認知科學中的雙通道理論,其中System 1表示直覺的、快速的、無意識的、非語言的、習慣的認知系統,這也是目前深度學習技術擅長的事情;System 2則表示慢的、有邏輯的、有序的、有意識的、可用語言表達以及可推理的系統,這是未來深度學習需要著重考慮的研究方向。
  • 知識圖譜的皇冠:知識圖譜推理的前世今生
    常見的歸納推理方法有基於圖結構的推理、基於規則學習的推理、基於表示學習的推理。下面我們分別展開討論。 二、基於描述邏輯的推理 描述邏輯(Description Logic),簡稱DL,是一種用於知識表示的邏輯語言,和知識推理的形式化工具。
  • 從神經轉化到符號:從知識圖譜的角度看認知推理的發展
    這裡所說的System1和System2是指認知科學中的雙通道理論,其中System1表示直覺的、快速的、無意識的、非語言的、習慣的認知系統,這也是目前深度學習技術擅長的事情;System2則表示慢的、有邏輯的、有序的、有意識的、可用語言表達以及可推理的系統,這是未來深度學習需要著重考慮的研究方向。
  • 從Bengio演講發散開來:探討邏輯推理與機器學習
    所謂邏輯,指的是符號化的、基於知識的、推理和其他類似的人工智慧方法。基於邏輯的 AI 系統可以被認為是高級編程系統,可以很容易地以緊湊(compact)和可用的(usable)方式編碼人類知識。最簡單的邏輯系統是命題邏輯(有時稱為零階邏輯)。在命題邏輯中,使用一些被稱為句子或公式的對象來編碼信息。這些對象代表著對世界的一些陳述。通常,可以使用一些基本語句作為這樣的對象。
  • 認知推理:人工智慧的下一個浪潮
    數據與知識融合的人工智慧理論與方法。在這個思想框架下,我們做了一定的深入研究,我們稱之為認知圖譜。其核心概念是知識圖譜+認知推理+邏輯表達。下面展開解釋一下。這裡面除了知識工程、專家系統,還有一個代表性的系統 CYC,CYC 可以說是歷史上持續時間最長的項目,從 1985 年開始,這個項目直到現在還一直在持續。說完了知識圖譜,我們來說一下認知圖譜。相信很多人對認知圖譜都比較陌生,這裡我們舉一個例子來說明一下。
  • 知識圖譜推理問答:如何讓機器像人類一樣學會推理
    AITimer-何文莉 AI TIME 論道近年來,知識圖譜問答任務取得較大進展,但當問題變得複雜,涉及多個實體的比較和推理時,機器尚不能很好地解答。如何讓機器像人類一樣學會推理,從而處理複雜問題,是當前的一個研究熱點和難點。
  • 基於認知神經科學的語言知識論
    這三個基本概念在很大程度上顛覆了古希臘羅馬時代、經由中世紀和文藝復興以來所建立的基於知識的語言教育「聖殿」。 隨著語言學的發展,人們謀求語言教學改革,提出了語言學習的新概念和新模式。從理論上看,沒有哪一個教學流派否定語言知識作用。
  • "文化-認知與社會治理"會議:以學科群的方式理解人類認知
    第一個議程探討文化與認知研究的多元方法論,涵蓋語言學的語義分析、人類學的隱喻分析、政治科學的社會網絡分析和邏輯學分析等多種方法。第二個議程探討了文化與認知研究的多元表達形式,有以實驗和計算模擬的方式探討七個國家人民對「非信仰」的理解,有依據民族志方法探討對民間廁所空間的管理和認知,也有結合民族志和實驗方法探討幼兒園學生的倫理發展。
  • 「文化-認知與社會治理」會議:以學科群的方式理解人類認知
    第一個議程探討文化與認知研究的多元方法論,涵蓋語言學的語義分析、人類學的隱喻分析、政治科學的社會網絡分析和邏輯學分析等多種方法。第二個議程探討了文化與認知研究的多元表達形式,有以實驗和計算模擬的方式探討七個國家人民對「非信仰」的理解,有依據民族志方法探討對民間廁所空間的管理和認知,也有結合民族志和實驗方法探討幼兒園學生的倫理發展。
  • 神經符號系統、因果推理、跨學科交互,李飛飛、Judea Pearl等16名學者共同探討AI未來
    Lamb 表示,基於 Marcus 在《The Algebraic Mind》一書中提到概念的神經符號工作涵蓋了基於神經網絡操縱符號的需求,「我們需要將二者邏輯形式化的基礎性方法」,如 Judea Pearl 的思想。隨後,DeepMind 傑出研究科學家 Rich Sutton 探討了強化學習。
  • 論文淺嘗 | 神經協同推理
    早期的協同過濾算法,例如基於用戶的和基於項目的協同過濾算法,將原始用戶項目評分矩陣中的行和列向量作為用戶和項目的表示向量(即嵌入向量),利用人工設計的加權平均函數作為匹配函數f(·),計算出每個用戶u與商品候選項v之間的關聯度。具體如圖2(a)所示,其中u表示用戶,v表示商品。更多研究進一步探索了協同過濾算法。
  • Google Brain提出基於固定尺寸記憶表示的注意力模型,翻譯任務推理...
    由於標準的基於內容的attention機制主要應用在sequence-to-sequence模型中,由於該方法需要在每個時間狀態下大量比較編碼器和解碼器的狀態,因此需要大量計算資源。Google Brain的研究者Denny Britz, Melody Y. Guan和Minh-Thang Luong提出了固定尺寸記憶表示的高效注意力模型,能夠將翻譯任務推理速度提高20%。
  • 認知哲學是什麼
    前者指包括各種推理(歸納、演繹、因果、溯因推理等)、記憶、空間表現的測度能力,在評估時被用於反映處理的效果;後者指對詞的意義、信息和知識的測度的評價能力,它傾向於反映過去執行過程中積累的結果。在認知發展的意義上,這兩種認知能力在熟化過程中表現不同。這是知識表徵意義上的「認知」。在哲學中,「認知」與認識論密切相關。
  • 【A】神經符號系統、因果推理、跨學科交互,李飛飛、Judea Pearl等16名學者共同探討AI未來
    Ness 表示:「概率規劃將是解決因果推理的關鍵。」概率規劃可以構建能夠反事實推理的智能體,而這是因果推理的關鍵。他認為這可以解決 Pearl 關於「If only?」的問題。中佛羅裡達大學計算機科學教授 Ken Stanley 則探討了進化與創造性。「過去數千年來,從火到空間站,新的事物是基於之前事物發展的,這就是開放系統。」
  • AttnPath | 將圖注意力機制融入基於深度強化學習的知識圖譜推理中
    ,深度強化學習,圖注意力機制,LSTM,知識圖譜補全知識圖譜(KG)推理旨在找到關係的推理路徑,以解決 KG中的不完整性問題。我們在具有不同任務的 FB15K-237 和 NELL995 數據集上測試了我們的模型。大量的實驗表明,我們的模型在許多當前最先進的方法中均有效且具有競爭力,並且在實踐中也表現良好。主要有三種方式執行知識圖譜推理,基於規則、基於嵌入和基於路徑的方法。同時,知識圖譜推理提供了一種視角:將深度強化學習帶入到預測缺失連結到任務中。
  • ​溯因推理與科學認知的適應性表徵
    ⑧因此,基於假設的溯因推理的出現,有望解決歸納與演繹之謎。二、溯因、歸納和演繹的三段論結構及其相互關係在傳統哲學與經典邏輯領域,歸納與演繹是兩個公認的推理方法,並在科學探究中一直發揮著重要作用。在科學哲學、人工智慧與認知科學領域,一種還不為人們廣泛接受的推理方法在其中發揮著重要作用,這就是溯因。
  • 黃宏濤等:基於近似子圖的實時教學認知診斷模型設計與應用
    當前常用的基於RSM和AHM的教學認知診斷模型雖然能夠對學生的知識狀態進行高效、準確的診斷,但其生成規則空間的代價較高,在小規模實時診斷應用中效率較低。近似子圖是領域知識圖在測試項目下的相關子圖,其頂點集只包含測試項目中涉及到的認知屬性,其邊集包括頂點集在領域知識圖中直接依賴關係的投影,以及頂點集在領域知識圖中間接依賴關係的模擬。近似子圖可以降低規則空間規模的量級,滿足其構造的實時性要求。