破題篇 IV:「復現」「智能」一相逢 P1

2020-12-25 騰訊網

作者 | 周熠

上海腦科學與類腦研究中心

張江實驗室腦與智能科技研究院

金風玉露一相逢,便勝卻人間無數。

——秦觀《鵲橋仙》

將「復現」作用於「智能」之上,也就是說,將不同的流派應用於不同的子領域,產生了人工智慧眾多重要的技術和工作。

符號流派應用於知識表示與推理等領域,產生了諸如邏輯推理、搜索、產生式系統、基於規則的推理、專家系統、文法等重要的技術。

「復現」啟發了人工智慧的各種流派,而「智能」指出了人工智慧的子領域。將「復現」作用於「智能」之上「復現智能」,即把這些流派的思想應用到各個子領域,就如同金風玉露相逢那樣,碰撞出了很多火花,從而產生了人工智慧眾多重要的技術和工作。

這些重要的技術和工作燦若繁星,在本系列中無法全部涉及,因此,我們首先挑選其中比較有代表性的技術走馬觀花地簡單介紹,儘量覆蓋到不同的流派和不同的子領域所擦出來的火花。沒被挑選的技術並不代表它們不重要。

不同流派(復現)作用於不同子領域(智能),產生了人工智慧眾多技術和工作

符號流派:

1、邏輯推理(Logic Based Reasoning)—符號流派應用在知識表示與推理領域。將邏輯學應用到人工智慧是一件自然而然的事。一方面,邏輯學本來就是用符號和形式化的方法研究如何表示知識和推理知識。這無疑是智能(特別是高級智能)的一個重要方面。另一方面,計算機本質上是基於符號和邏輯學的。計算機的三個重要基礎——可計算理論、布爾電路和程式語言都和邏輯學息息相關。在計算機領域的成功,讓人們相信邏輯學在人工智慧領域也會成功。因此,邏輯推理自人工智慧誕生以來,一直是人工智慧學術界主要的研究方向之一。

邏輯學將知識表示成符號語句,再通過否定、蘊涵以及量詞等邏輯連接詞把這些語句連接起來。這樣,就可以通過連接詞之間的關係對這些知識進行推理。例如我們知道「所有的橙子都是水果」,並且「所有的水果都長在樹上」,那麼給我們「一個橙子」,我們就可以推斷出一個新的結論——「這個橙子一定也長在樹上」。

從人工智慧的角度,邏輯推理具有很多優勢。首先,邏輯學自帶語義。也就是說,除了用符號表示各種不同的知識之外,邏輯學還通過形式化的方法,對這些知識的確切含義給出了機器可以理解的解釋。這點,在其它人工智慧技術中幾乎不存在。其次,邏輯學有很強的可解釋性。當得到新的結論時,邏輯學可以解釋為什麼會得到這樣的結論。第三,邏輯學在知識表示方面高度精煉,可以用很小的代價在機器間傳承知識。第四,邏輯學在理論上自帶推理功能,可以從已有的知識推導出新的知識。第五,邏輯學一般自帶可靠性(所有得出的結論都是對的)和完備性(所有對的結論都可以得出)。這點無疑非常有吸引力。這也是為什麼邏輯學是形式化驗證(檢驗一個硬體系統或軟體系統絕對正確)的唯一方法。

基於傳統邏輯的推理

2、搜索(Search):符號流派和計算機算法在人工智慧諸多子領域(如行動選擇、知識表示與推理、約束可滿足問題求解、人工智慧規劃等等)的應用。搜索是一種通用方法。很多智能問題都可以看成是分支選擇的問題,從而都可以建模成搜索問題。例如,下棋,每一步的可能選擇是當前的所有可能落子。那麼下棋就可以建模成一棵搜索樹。其中每個節點是一個棋盤狀態。根節點是空白棋盤;葉子節點是最終可以確定勝利狀態的棋盤;而從每個節點到它的子節點就是在當前棋盤上落子。決策也是,在每個時間節點可以有很多選擇,每個選擇導致不同的後果,這也是典型的搜索問題。

搜索

搜索遇到的最大的問題是空間爆炸問題。搜索樹的分支隨著樹的深度而指數膨脹。假設每一個節點的分支為n,那麼第m層的節點個數就是n的m次方。這個數量是相當龐大的,以圍棋為例,粗略估算n=m=361。也就是說這個搜索樹分支達到361361=10923(要知道,宇宙中的粒子總數僅僅1080)。這個數字如此巨大,以至於簡單的搜索策略完全不可能奏效。

因此,如何設計更好的搜索算法是搜索的核心問題。這也和其他的領域相互交叉關聯起來。比較重要的搜索策略和算法包括深度優先搜索(Depth first search)、廣度優先搜索(Breath first search)、啟發式搜索(Heuristic Search)、剪枝(Pruning)、蒙特卡洛樹搜索(Monte Carlo Tree Search)、強化學習搜索(Reinforcement Learning Search)等等。

3、產生式系統(Production System):符號流派在人工智慧諸多子領域(如知識表示與推理和自然語言處理等等)中的應用。產生式系統採用「如果-那麼」(「if-then」)規則,每條規則形如:

如果 A1,A2,…,An,那麼B,

其中,A1,A2,…,An為前提條件,B為結論。它的直觀含義很明顯,如果當前的狀態滿足所有前提條件,那麼我們就得到結論B。

雖然這個基本思想如此的簡單,但是產生式系統的應用非常廣泛。事實上,在很多商業決策系統裡,工程師們就是用了大量的「如果-那麼」規則,只是有可能很多工程師在使用的時候並沒有在理論和方法論上把這種做法歸結到產生式系統上。而人工智慧其他領域很多基於規則的方法,包括在自然語言處理領域應用廣泛的基於規則的文法,如上下文無關文法,也隸屬於產生式系統。

基於規則的推理

4、邏輯程序(Logic Programming)和基於規則的推理(Rule Based Reasoning):符號流派和知識表示與推理的另一種碰撞。

很有意思的是,邏輯程序的根基與產生式系統一樣,都是基於形

如果 A1,A2,…,An,那麼B

的規則。而且它們的直觀含義也雷同,即當前提條件A1,A2,…,An成立時,後承條件B成立。那它們的區別在哪呢?其根本在於語義。

產生式系統是沒有語義的,或者說它們僅僅是在語法的層面上對這些符號進行操作。注意這兩者是有區別的。沒有語義並不代表就沒辦法操作。例如一個網頁,它包含很多信息,機器可以對其進行包括搜索在內的操作。但是,對機器而言,這個網頁是沒有語義的,因為機器無法理解其中的內容。同樣,產生式系統能操作但沒有語義。與之相對,邏輯程序設計有嚴格的語義,而且由於語法和假設不同,有多種不一樣的語義。比起產生式系統的簡單「if-then」,這些語義對規則多了整體上的解釋。

基於規則的推理是一個模糊的概念。廣義上,它包括產生式系統和邏輯程序等各種規則系統。狹義上,主要還是指後者以及由後者引申的一些技術。

5、專家系統(Expert System):符號流派在知識工程領域的重要應用。專家系統期望首先用機器表示領域專家的知識,然後通過機器自動推理來模擬專家在領域中的作用。專家系統的願景相當有誘惑力。由於領域專家在行業(如醫療)內特別稀缺,其服務往往也特別昂貴,如果能夠部分替代領域專家,很明顯會對社會和經濟產生重大影響。

專家系統

雖然在細節上有些差異,但大部分專家系統在表示方面都是採用符號邏輯,而在推理方面採用基於規則的推理,或者是產生式系統,或者是Prolog。在20世紀80年代,專家系統的研究與應用風生水起,直接導致了日本推出「五代機」計劃。同時,專家系統在應用上也取得了一定的成功。例如Mycin和Dendral等系統,在各自領域也能部分替代專家。

然而,專家系統遇到了很大的困難。在表示方面,很多重要的概念在傳統的符號邏輯中表示起來很困難,至少是很不優雅,例如行動、概率、優先級等等。符號邏輯也不能很好支持多種不同輸入,如圖像、音頻等等。在推理方面,推理效率和表達能力是一對矛盾,需進行權衡。表達能力越強,往往推理效率就越低;反之亦然。然而,專家系統更大的問題存在於知識的獲取方面——領域專家的知識是很難獲取的。專家系統一般假設知識獲取通過人手動來完成。然而,領域專家並不懂專家系統,而專家系統的知識工程師也不懂領域知識,因此,二者需要有極高的契合度才能共同完成知識的獲取。這點非常困難,更何況這兩類人的成本都很高。

期望越大,失望越大。專家系統並未實現它的全部願景。因此,有一種觀點認為專家系統徹底失敗了。另外一種觀點認為專家系統雖然沒有實現它的全部願景,但也有其成功之處。個人傾向於支持後一種觀點。雖然在學術界,專家系統的研究日趨稀少,但在工業界,專家系統的精華思想,包括利用領域專家知識和基於規則的推理等等,依然有很大用武之地。

作者介紹

周熠,現任張江實驗室腦與智能科技研究院/上海腦科學與類腦研究中心認知智能研究組課題組長,研究員,中國科學技術大學兼職教授。研究方向為認知人工智慧,主要的研究興趣為如何受腦啟發,深度融合基於邏輯的符號流派和基於神經網絡的連接流派,及其在認知人工智慧領域中的應用,包括AI+教育、自動智商測試、智能語言處理等。

墨子沙龍是以中國先賢「墨子」命名的大型公益性科普論壇,由中國科學技術大學上海研究院主辦,中國科大新創校友基金會、中國科學技術大學教育基金會、浦東新區科學技術協會、中國科學技術協會及浦東新區科技和經濟委員會等協辦。

墨子是我國古代著名的思想家、科學家,其思想和成就是我國早期科學萌芽的體現,「墨子沙龍」的建立,旨在傳承、發揚科學傳統,建設崇尚科學的社會氛圍,提升公民科學素養,倡導、弘揚科學精神。科普對象為熱愛科學、有探索精神和好奇心的普通公眾,我們希望能讓具有中學及以上學力的公眾了解、欣賞到當下全球最尖端的科學進展、科學思想。

關於「墨子沙龍」

相關焦點

  • 針對CBC字節反轉攻擊的研究與漏洞復現
    漏洞復現漏洞源碼漏洞復現過程以 CTF 模式為例<?(){$iv='';for($i=0;$i<16;$i++){$iv.漏洞利用與復現過程初始頁面顯示Injection 測試測試username:admin' or '1'='1
  • 復現造句和解釋_復現的例句有哪些-小孩子點讀
    復現(fù xiàn)。 復現參考例句: 1、實現標題預示性的手段是段落、主題句和微主題復現。 2、難得露面的白鰭豚,無翼夜行的幾維鳥,絕跡復現的泰卡雞,渾身清香的樹袋熊。
  • 密室逃脫--單詞復現篇
    本文主要是受奧秘之家創始人徐奧林先生在一席的演講一切皆可遊戲的啟發,所以這篇推文也是一個解謎遊戲,裡面除了所涉及的一個理論
  • 十首重逢詩:相逢的人會再相逢
    《淮上喜會梁川故人》【唐】韋應物江漢曾為客,相逢每醉還。浮雲一別後,流水十年間。歡笑情如舊,蕭疏鬢已斑。《喜見外弟又言別》【唐】李益十年離亂後,長大一相逢。問姓驚初見,稱名憶舊容。《嶺上逢久別者又別》【唐】權德輿十年曾一別,徵路此相逢。馬首向何處,夕陽千萬峰。
  • 八股文真的不堪嗎——八股文中的破題
    元仁宗皇慶初,復科舉,仍用經義,體式小變,其文有破題、解題、小講、謂之冒子,冒子後入官題,題下有原題、大講、餘意、亦曰從講,又有原經,亦曰考經,有結尾。後又小變,然冒題、原題、講題、結題,一定不易。明初小變,然文後尚有大結,猶其遺法,成、宏以後純為八比之格矣。
  • SAS實現批量計算字符型變量的IV值
    前兩篇文章介紹了
  • .| 姑蘇:做好「聚力、破題、革新」三篇文章,為「全省第一、全國...
    七問·我答 | 姑蘇:做好「聚力、破題、革新」三篇文章,為「全省第一、全國一流」貢獻姑蘇力量 2020-11-05 19:34 來源:澎湃新聞·澎湃號·政務
  • CVPR論文經不起復現推敲?是學術會議水了還是我飄了
    最近,在 Reddit 上一個「較真」的網友就對 CVPR2018 的一篇大會接收論文進行復現,發現了其中的問題。此貼在 Reddit 上引發了眾人的熱烈討論,其中包括對學術會議同行評審機制的審視。作者稱這種做法表現良好,但我的復現結果並不理想,因此我決定對其進行測試。作者提供了他們用的代碼,但是經過仔細檢查,我發現他們的測試準確率計算有誤,導致得出的所有結果無效。」
  • 2020中考支招:中考作文的破題技巧,學會這一招可快速打開思路
    這是不言而喻的,因為它的分值佔了整個試卷的相當大的部分,拿蘇州中考為例,整個試卷是130分,而作文佔了60分,而一篇好的作文能夠拿到高分第一步,需要我們對中考作文給出的題目進行理解分析,就是我們俗稱的破題,那麼今天我們針對破題這一塊,單從虛實轉化這個角度來聊一聊。
  • CVE-2017-11882復現及防禦
    本文作者:\xeb\xfe,加上之前的文章《一道 CTF 題 get 到的新姿勢》完成兩篇文章的任務
  • 想輕鬆復現深度強化學習論文?看這篇經驗之談
    本文作者認為復現論文是提升機器學習技能的最好方式之一,所以選擇了 OpenAI 論文《Deep Reinforcement Learning from Human Preferences》作為 target,雖獲得最後成功,卻未實現初衷。如果你也打算復現強化學習論文,那麼本文經驗也許是你想要的。
  • 運用詞彙的重現或者復現關係
    5.運用詞彙的重現或者復現關係 詞彙的重現或者復現關係是英語知識運用考查的一個方面。它是指某一詞以原詞、指代詞、同義詞、反義詞、上義詞(animal是tiger上義詞)、概括詞等重新出現在整個文章的前後,整個文章因為它的出現而得到了銜接。
  • 用Keras復現DCN算法
    可是DCN算法並沒有keras的實現代碼,而我之前也沒有用過keras,導致用keras復現DCN算法耗費了我一周多的時間,不過經過了一周的折騰,也算基本熟悉了keras的使用。keras由於過於的強調易用性,以及受制於tensorflow等底層框架的機制影像導致開發簡單應用很容易但是如果做復現最新論文算法的定製開發就會比較困難,而pytorch就比較好的平衡了易用性以及拓展性,用pytorch來實現上述功能則比較簡單,這也是pytorch應用越來越受歡迎的原因吧。不過由於實驗室之前的代碼都是用keras寫的,這裡的DCN算法也要用keras來實現。
  • 「哈嘍 你好嗎 衷心感謝 珍重再見 期待再相逢……」
    「哈嘍 你好嗎 衷心感謝 珍重再見 期待再相逢……」《我們這一家》第一次入坑是初中的時候那時候閉路電視的普及天線就開始無法接收到臺灣的信號偶然去朋友家第一次看之後 念念不忘多年後再次看到 一發不可收拾一連將B站裡的331集看完之後 又反覆看甚至睡前都拿出來聽著聲音入眠簡直印證了花媽常唱的那句「珍重再見 期待再相逢
  • 「鳳棲梧破題」2020年高考語文作文題目
    【鳳棲梧破題】一上來又是墨子,先秦諸子百家,墨家流派的創始人——墨翟的思想。他的主要思想之一是「兼愛」。這篇演講稿,可以大開大闔,從先秦的《詩經》,到《墨子》,再到現在的疫情之下,從日本捐助無錫口罩,當中國疫情控制時,無錫又把口罩成倍地捐贈回日本。
  • 通達OA低版本兩個文件上傳復現
    基本都是把已經復現成功的記錄下來了,沒復現成功的就沒寫,還在慢慢的積累。這次我復現的是兩個文件上傳漏洞。通達OA2015和通達OA2013都存在這個漏洞。文件上傳一/general/vmeet/privateUpload.php路徑http://x.x.x.x/general/vmeet/privateUpload.phpexp
  • 「尖刀班」,破題
    為切實解決金融企業的這一難題,市南法院立足自身實際,成立司法責任制綜合配套改革領導小組,梳理近十年來金融案件增長趨勢,篩選確定案件數佔比較高的金融企業和案件類型,理順訴前調解及繁簡分流工作機制,將金融案件全部剝離出來,交由速裁中心集中審理。
  • 破題產業AI,阿里雲做了什麼?
    阿里雲ET城市大腦率先破題科技黑不黑,關鍵看產業化潛力。破題產業AI,阿里雲真正做到了。ET城市大腦將像登月計劃一樣,孵化一系列世界領先的技術。目前已在杭州、衢州、澳門、吉隆坡等城市先後落地。阿里雲城市大腦通過數據維度切入各領域,並利用海量、實時的數據倒逼計算能力和算法的優化改進,從而釋放數據智能帶來的潛力。比如,ET城市大腦的阿里巴巴機器智能實驗室視覺計算團隊為了應對複雜場景下的車輛檢測任務,提出了基於區域融合決策和上下文相關的多任務深度神經網絡,可以解決多視角、多姿態及車輛遮擋等問題。
  • 復現一篇深度強化學習論文之後,我學到了什麼
    編者按:對強化學習的論文復現一直是個具有挑戰性的活兒
  • 人際關係題五種破題表態方式
    除了對問題:「你會怎麼辦」進行行為的闡述外,對題幹的分析部分,也就是破題表態,很重要。往往前幾句的表述可充分證明該考生對題目的理解和分析,體現出自身的價值觀和處事原則,也是個性化答題的關鍵。   接下來江蘇公務員考試網小編就從人際問題的幾種破題方法中一一探究。在破題之前我們要做的準備工作就是要先審好題,要看清楚題目中的情景、人物關係、矛盾點等信息給破題做準備。