作者 | 周熠
上海腦科學與類腦研究中心
張江實驗室腦與智能科技研究院
金風玉露一相逢,便勝卻人間無數。
——秦觀《鵲橋仙》
將「復現」作用於「智能」之上,也就是說,將不同的流派應用於不同的子領域,產生了人工智慧眾多重要的技術和工作。
符號流派應用於知識表示與推理等領域,產生了諸如邏輯推理、搜索、產生式系統、基於規則的推理、專家系統、文法等重要的技術。
「復現」啟發了人工智慧的各種流派,而「智能」指出了人工智慧的子領域。將「復現」作用於「智能」之上「復現智能」,即把這些流派的思想應用到各個子領域,就如同金風玉露相逢那樣,碰撞出了很多火花,從而產生了人工智慧眾多重要的技術和工作。
這些重要的技術和工作燦若繁星,在本系列中無法全部涉及,因此,我們首先挑選其中比較有代表性的技術走馬觀花地簡單介紹,儘量覆蓋到不同的流派和不同的子領域所擦出來的火花。沒被挑選的技術並不代表它們不重要。
不同流派(復現)作用於不同子領域(智能),產生了人工智慧眾多技術和工作
符號流派:
1、邏輯推理(Logic Based Reasoning)—符號流派應用在知識表示與推理領域。將邏輯學應用到人工智慧是一件自然而然的事。一方面,邏輯學本來就是用符號和形式化的方法研究如何表示知識和推理知識。這無疑是智能(特別是高級智能)的一個重要方面。另一方面,計算機本質上是基於符號和邏輯學的。計算機的三個重要基礎——可計算理論、布爾電路和程式語言都和邏輯學息息相關。在計算機領域的成功,讓人們相信邏輯學在人工智慧領域也會成功。因此,邏輯推理自人工智慧誕生以來,一直是人工智慧學術界主要的研究方向之一。
邏輯學將知識表示成符號語句,再通過否定、蘊涵以及量詞等邏輯連接詞把這些語句連接起來。這樣,就可以通過連接詞之間的關係對這些知識進行推理。例如我們知道「所有的橙子都是水果」,並且「所有的水果都長在樹上」,那麼給我們「一個橙子」,我們就可以推斷出一個新的結論——「這個橙子一定也長在樹上」。
從人工智慧的角度,邏輯推理具有很多優勢。首先,邏輯學自帶語義。也就是說,除了用符號表示各種不同的知識之外,邏輯學還通過形式化的方法,對這些知識的確切含義給出了機器可以理解的解釋。這點,在其它人工智慧技術中幾乎不存在。其次,邏輯學有很強的可解釋性。當得到新的結論時,邏輯學可以解釋為什麼會得到這樣的結論。第三,邏輯學在知識表示方面高度精煉,可以用很小的代價在機器間傳承知識。第四,邏輯學在理論上自帶推理功能,可以從已有的知識推導出新的知識。第五,邏輯學一般自帶可靠性(所有得出的結論都是對的)和完備性(所有對的結論都可以得出)。這點無疑非常有吸引力。這也是為什麼邏輯學是形式化驗證(檢驗一個硬體系統或軟體系統絕對正確)的唯一方法。
基於傳統邏輯的推理
2、搜索(Search):符號流派和計算機算法在人工智慧諸多子領域(如行動選擇、知識表示與推理、約束可滿足問題求解、人工智慧規劃等等)的應用。搜索是一種通用方法。很多智能問題都可以看成是分支選擇的問題,從而都可以建模成搜索問題。例如,下棋,每一步的可能選擇是當前的所有可能落子。那麼下棋就可以建模成一棵搜索樹。其中每個節點是一個棋盤狀態。根節點是空白棋盤;葉子節點是最終可以確定勝利狀態的棋盤;而從每個節點到它的子節點就是在當前棋盤上落子。決策也是,在每個時間節點可以有很多選擇,每個選擇導致不同的後果,這也是典型的搜索問題。
搜索
搜索遇到的最大的問題是空間爆炸問題。搜索樹的分支隨著樹的深度而指數膨脹。假設每一個節點的分支為n,那麼第m層的節點個數就是n的m次方。這個數量是相當龐大的,以圍棋為例,粗略估算n=m=361。也就是說這個搜索樹分支達到361361=10923(要知道,宇宙中的粒子總數僅僅1080)。這個數字如此巨大,以至於簡單的搜索策略完全不可能奏效。
因此,如何設計更好的搜索算法是搜索的核心問題。這也和其他的領域相互交叉關聯起來。比較重要的搜索策略和算法包括深度優先搜索(Depth first search)、廣度優先搜索(Breath first search)、啟發式搜索(Heuristic Search)、剪枝(Pruning)、蒙特卡洛樹搜索(Monte Carlo Tree Search)、強化學習搜索(Reinforcement Learning Search)等等。
3、產生式系統(Production System):符號流派在人工智慧諸多子領域(如知識表示與推理和自然語言處理等等)中的應用。產生式系統採用「如果-那麼」(「if-then」)規則,每條規則形如:
如果 A1,A2,…,An,那麼B,
其中,A1,A2,…,An為前提條件,B為結論。它的直觀含義很明顯,如果當前的狀態滿足所有前提條件,那麼我們就得到結論B。
雖然這個基本思想如此的簡單,但是產生式系統的應用非常廣泛。事實上,在很多商業決策系統裡,工程師們就是用了大量的「如果-那麼」規則,只是有可能很多工程師在使用的時候並沒有在理論和方法論上把這種做法歸結到產生式系統上。而人工智慧其他領域很多基於規則的方法,包括在自然語言處理領域應用廣泛的基於規則的文法,如上下文無關文法,也隸屬於產生式系統。
基於規則的推理
4、邏輯程序(Logic Programming)和基於規則的推理(Rule Based Reasoning):符號流派和知識表示與推理的另一種碰撞。
很有意思的是,邏輯程序的根基與產生式系統一樣,都是基於形
如果 A1,A2,…,An,那麼B
的規則。而且它們的直觀含義也雷同,即當前提條件A1,A2,…,An成立時,後承條件B成立。那它們的區別在哪呢?其根本在於語義。
產生式系統是沒有語義的,或者說它們僅僅是在語法的層面上對這些符號進行操作。注意這兩者是有區別的。沒有語義並不代表就沒辦法操作。例如一個網頁,它包含很多信息,機器可以對其進行包括搜索在內的操作。但是,對機器而言,這個網頁是沒有語義的,因為機器無法理解其中的內容。同樣,產生式系統能操作但沒有語義。與之相對,邏輯程序設計有嚴格的語義,而且由於語法和假設不同,有多種不一樣的語義。比起產生式系統的簡單「if-then」,這些語義對規則多了整體上的解釋。
基於規則的推理是一個模糊的概念。廣義上,它包括產生式系統和邏輯程序等各種規則系統。狹義上,主要還是指後者以及由後者引申的一些技術。
5、專家系統(Expert System):符號流派在知識工程領域的重要應用。專家系統期望首先用機器表示領域專家的知識,然後通過機器自動推理來模擬專家在領域中的作用。專家系統的願景相當有誘惑力。由於領域專家在行業(如醫療)內特別稀缺,其服務往往也特別昂貴,如果能夠部分替代領域專家,很明顯會對社會和經濟產生重大影響。
專家系統
雖然在細節上有些差異,但大部分專家系統在表示方面都是採用符號邏輯,而在推理方面採用基於規則的推理,或者是產生式系統,或者是Prolog。在20世紀80年代,專家系統的研究與應用風生水起,直接導致了日本推出「五代機」計劃。同時,專家系統在應用上也取得了一定的成功。例如Mycin和Dendral等系統,在各自領域也能部分替代專家。
然而,專家系統遇到了很大的困難。在表示方面,很多重要的概念在傳統的符號邏輯中表示起來很困難,至少是很不優雅,例如行動、概率、優先級等等。符號邏輯也不能很好支持多種不同輸入,如圖像、音頻等等。在推理方面,推理效率和表達能力是一對矛盾,需進行權衡。表達能力越強,往往推理效率就越低;反之亦然。然而,專家系統更大的問題存在於知識的獲取方面——領域專家的知識是很難獲取的。專家系統一般假設知識獲取通過人手動來完成。然而,領域專家並不懂專家系統,而專家系統的知識工程師也不懂領域知識,因此,二者需要有極高的契合度才能共同完成知識的獲取。這點非常困難,更何況這兩類人的成本都很高。
期望越大,失望越大。專家系統並未實現它的全部願景。因此,有一種觀點認為專家系統徹底失敗了。另外一種觀點認為專家系統雖然沒有實現它的全部願景,但也有其成功之處。個人傾向於支持後一種觀點。雖然在學術界,專家系統的研究日趨稀少,但在工業界,專家系統的精華思想,包括利用領域專家知識和基於規則的推理等等,依然有很大用武之地。
作者介紹
周熠,現任張江實驗室腦與智能科技研究院/上海腦科學與類腦研究中心認知智能研究組課題組長,研究員,中國科學技術大學兼職教授。研究方向為認知人工智慧,主要的研究興趣為如何受腦啟發,深度融合基於邏輯的符號流派和基於神經網絡的連接流派,及其在認知人工智慧領域中的應用,包括AI+教育、自動智商測試、智能語言處理等。
墨子沙龍是以中國先賢「墨子」命名的大型公益性科普論壇,由中國科學技術大學上海研究院主辦,中國科大新創校友基金會、中國科學技術大學教育基金會、浦東新區科學技術協會、中國科學技術協會及浦東新區科技和經濟委員會等協辦。
墨子是我國古代著名的思想家、科學家,其思想和成就是我國早期科學萌芽的體現,「墨子沙龍」的建立,旨在傳承、發揚科學傳統,建設崇尚科學的社會氛圍,提升公民科學素養,倡導、弘揚科學精神。科普對象為熱愛科學、有探索精神和好奇心的普通公眾,我們希望能讓具有中學及以上學力的公眾了解、欣賞到當下全球最尖端的科學進展、科學思想。
關於「墨子沙龍」