本體論及其應用(上)

2021-01-17 中國數字醫學

1.  本體論/Ontology


人工智慧(AI)的發展歷史表明,知識對於智能系統來說是非常重要的。眾多的應用案例也顯示出,對於解決問題來說,豐富的知識要比優良的算法邏輯更重要。要擁有真正的智能系統,就需要採集、處理、復用和傳達知識。而本體論則是知識描述和應用的基礎。


術語「本體論」可以定義為概念化體系(conceptualization)的顯式規範。本體論用於描述領域(domain)的結構,即概念化體系。概念化體系描述領域相關的知識,但不包括領域中所發生事件的具體狀態。換句話說,概念化體系不會變化,或者變化非常少。本體論就是針對這種概念化體系的規範——概念化體系通過使用特定的建模語言及特定的術語來進行規範。為了能夠處理本體以及能夠基於本體進行自動化操作,就需要形式化規範。


本體論用來描述一個領域,而知識庫(基於本體論)用來描述事件的特定狀態。每一個知識庫系統或代理擁有自己的知識庫,而且只有能夠用本體論進行表達的知識才能夠存儲並在知識庫中應用。當一個代理想和另一個代理進行通信時,就需要利用由本體構建的信息結構。而為了相互理解通信內容,就必須在代理之間共享這些本體。


1.1 哲學本質


術語本體論來自於哲學。根據Webster詞典定義,本體論的含義是指:一個與存在的本質和關係相關的形上學的分支;一個關於存在本質或者存在種類的特定理論。


本體論(存在科學)是一個字詞,類似於形上學,可以在不同的情況下使用。它有時被認為等同於形上學,但人們更傾向於在更具體的情況下使用它。作為形上學的一部分,本體論規定了最基本的存在類別、世界的基本物質或結構。因此,本體論分析的是最普通、最抽象的概念或差異,構成世界上任何現象相關的所有更具體的描述;例如,時間、空間、物質、過程、因果、系統。


近階段,術語「本體論」被人工智慧研究人員所採用,使用它來定義世界模型的構建模塊。使用特定模型的代理(諸如自主機器人)只能夠感知到其本體能夠描述的那一部分世界。從這個意義上來看,只有其本體描述的事物,對於代理來說才是存在的。因此,本體是一個知識表達方案的最基本層次。例如,一個語義網絡表達的連結類型集合,是基於一系列「本體」區分對構建的,這些區分對包括:變化-不變、一般-具體。


本體論最初是哲學的一個分支,處理現實世界的本質和組織。它試圖回答「什麼是存在」,「什麼屬性能夠解釋存在」等問題。亞里斯多德把本體論定義為關於存在的科學。與其他具體科學不同,這些具體科學都是研究一類事物及其相關信息,本體論研究的是「所有存在事物及其相關屬性」。


這可以稱為「一般本體論」,相對應的是那些面向具體領域的各種特定本體論。一般本體論不關心某些具體的存在對象,而是關注於這些對象存在形式的嚴格描述,即結構特性。在實踐中,本體論可以作為區分理論,可以獨立應用於世界狀態。特別地,本文對以下事物之間的區分感興趣:世界實體之間(物理對象、事件、區域…);用於建模世界的元級類別之間(概念、屬性、質量、狀態、角色、部件…)。


基於哲學意義的本體論研究與知識庫系統相關。本體論奠定了在這些系統中應用知識的基礎。


1.2 本體論是什麼


雖然本體論很需要一個形式定義,但是術語「本體論」本身還沒有一個通用的定義。其定義大致可以歸類為三組:本體論是一個哲學術語,其含義是「存在理論」;本體論是概念化體系的顯式規範;本體論是描述某些領域的知識體,一般是常用知識領域。


第一個定義就是上文中討論的哲學含義。然而,對於AI領域來說,本體論則有許多不同的含義。第二個定義在AI領域被廣泛接受。第三個定義,把本體論視為知識的內在本體,而不是描述知識的手段。


概念化體系規範:概念化體系的顯式規範,其意義是指本體是概念和關係的描述(類似於程序的形式規範),這些概念和關係是為了代理或代理團體而存在的。

 
圖1 用於領域描述的本體論表達的預期模型


概念化體系可以定義為一個強語義結構,通過隱式知識來約束領域的結構。本體論是該結構的規範,即,它是一個邏輯理論,以某種語言來顯式表達概念化體系。概念化體系是語言無關的,本體論是語言相關的。需要注意的是,本體論不是必須表達所有可能的約束——概念化體系詳細水平取決於預期應用的需求;另外,基於本體論表達概念化體系取決於所使用的本體論語言。


因此,本體論對於實現知識共享和復用十分重要。本體論是用於制定本體申請的規範。實際上,一項本體申請就是一個以與本體所規定理論相一致(但不完全一致)的方式使用詞彙(即查詢和斷言)的協議。之後,代理申請本體,設計本體,並且知識能夠在這些代理之間共享。


知識體(知識庫)的表示要基於概念化體系規範。概念化體系是指一個抽象、簡化的,人們為了某些目的而呈現的世界視圖。每一個知識庫、知識庫系統或代理,都致力於描述某些顯式或隱式概念化體系。對於這些系統來說,「存在」就是可以表示的東西。當領域知識以聲明形式進行表示時,能夠被表示的對象集合就是論域(the universe of discourse)。這個對象集合及其之間的關係,由表達詞彙來反映,並由一個知識庫程序來表示知識。因此,在AI環境中,人們可以通過定義一組表示術語來描述一個程序的本體。在這樣的本體中,定義關聯著論域中實體的名稱(諸如類、關係、函數,或者其他對象)及其名稱意義的描述,以及約束這些術語使用的形式公理。從形式上來說,本體是邏輯理論的一種陳述。


本體論的骨幹通常是分類體系。而分類體系則是以分層結構形式對存在事物進行分類。分類體系通常是一個樹或者是一個表示包含關係的網格,也即是說,A歸入B就意味著A集合中的所有在B集合中也都存在。分類體系一般會限制類的使用——其中類是領域中所有可能個體集合的子集。此外,也可以定義屬性的分類體系。


然而,本體不需要受限於類的分類體系層級,也不需要受限於定義,該定義僅僅引入了術語,並沒有為這個世界增加任何一點知識。為了規範概念體系,還可能需要一些公理,這些公理用來約束對於已有術語的解釋。實際上,本體定義了用於在代理之間進行交換的查詢和斷言的詞彙集。因此,本體論的義務是對通信一致性的一個保證。


知識體:有些時候,本體被定義為描述某些領域(通常指常用知識領域)的知識體,使用上文所提到的表示詞彙。在這種情況下,本體不僅僅指詞彙,而且是指整個「上層」知識庫(包括用於描述該知識庫的詞彙表)。


典型的案例是CYC項目,基於本體論定義其知識庫。CYC是一個非常龐大的、多語境知識庫和推理引擎的名稱。CYC中的所有知識都是以邏輯斷言的形式進行聲明性表示。CYC中包含超過40萬條重要斷言,包括事實的簡單陳述、關於在滿足某事實狀態下如何獲得結論的規則、以及關於如何推理某種事實和規則的規則。通過推理引擎,利用演繹推理推導出新的結論。CYC常識知識可以用作面向任意知識密集型系統的知識庫基礎。從這個意義來說,知識體可以被視為系統知識庫的本體。


一般來說,客觀地區分本體應該是什麼,知識庫應該是什麼,是不可能的。它取決於本體論對未來應用的需求。


表示本體:在本文中,將使用本體論的這個定義:「概念體系的顯式規範」。在此基礎上,本體論限定了基於本體論術語的預期應用,因此,本體論構建了詞彙表和公理,能夠用於表達知識庫,並能用於在不同系統之間共享知識。


此外,還要求該規範是形式上的(就像一個程序是基於一個程式語言進行編寫的),以便於該本體能夠被計算機所處理。


(摘自:http://www.obitko.com/tutorials/ontologies-semantic-web/introduction.html  翻譯:袁浩  單位:北大醫療信息技術有限公司)


《中國數字醫學》微店,點擊以下閱讀原文進入


相關焦點

  • 老子的道本體論及其方法論意義
    這些都充分說明老子是中國哲學本體論的創始人。由此亦證明,中國哲學本體論的創立並不晚於古希臘。  (二)老子道本體論的現代詮釋  就世界範圍來看,哲學本體論的發展是有一個過程的。這個過程大體經歷了這樣幾個階段:客體至上論——主體至上論——「主—客」兩極論——主體際論——交往實踐觀及其「主體——中介客體——主體」模式論。
  • 列維納斯的「他者」思想及其對本體論的批判
    一、他者問題的提出列維納斯認為西方哲學的根本特徵在於它的本體論傳統。西方哲學史上有著各種各樣的本體論,柏拉圖的理念論,亞裡斯多德的實體論,黑格爾的邏輯學,海德格爾的"基礎本體論"。[3―p76]究其根源,當巴門尼德第一次提出"存在是一"時,便已奠定了本體論哲學的這種基本特徵及其走向。列維納斯認為西方文化在這種本體論的傳統中出現了危機,導致現代社會所面臨的種種惡果。原因就在於對"總體性"和"同一性"的追求中遺忘了"他者"。"他者"之為他者,原因顯然是"異","同"與"異"旨趣相差何止千裡。
  • 從本體論開始說起——運營商關係圖譜的構建及應用
    一.本體論全球資訊網之父Tim Berners-Lee教授在1998年將語義網絡(Semantic web)帶入人類的視線。目的是賦予網絡理解詞語、概念以及它們之間邏輯關係的能力,使人機互動變得更有效率。本體論(Ontology)做為語義網的核心,是研究實體存在及其本質的通用理論。
  • 從「重寫」到「本體論」
    41其中的許多討論都是圍繞狩獵採集社會而展開的,而本體論可以讓我們更好地理解狩獵採集社會及其生存之道,這使得狩獵採集社會研究者需要對人類學的本體論進行關注與透徹理解。對於何謂本體論,科恩(Eduardo Kohn)認為本體論是對真實(reality)的研究,即一個包含但不限於人類建構的世界的研究。
  • 文藝的人民本體論
    作為馬克思主義文藝學的當代中國最新發展成果,習近平同志在文藝工作座談會上的重要講話,提出了一系列富有時代推進特徵的文藝思想命題,其中的重要命題之一,甚至可能是諸多命題中的前置條件命題,就是文藝存在的人民本體論,因為它實際上已經成為具有普遍價值指涉的一般知識成果
  • 本體論(六)| 康德的本體論思想及主張
    ,而對於康德而言,什麼是本體論呢?康德在論述本體論證明的時候,透露出他對本體論的看法,他把本體論理解為,純粹概念的推論其中,上帝論證最核心就是本體論證明,他們置一切經驗於不顧,完全是先天地從純粹的概念去推論最高原因的存在本體論使用的是一種特殊規定的語言,他的意義來源於概念之間的關係之中,柏拉圖後期理念論中所使用的理念或通種,就是些這樣的概念。
  • 論「是」的本體意義
    由於問題主要涉及我們自身思想的可能性, 所以我們擬暫時撇開Being在漢語裡應如何翻譯的問題, 而直接從漢語中系詞「是」 的實際表述功能和哲學言說本體的可能性出發。當然, 如果我們依此途徑可以對哲學本體論獲得更好的理解, 那麼Being 在漢語裡應如何翻譯的問題也就有了一個相應的「解決」 。
  • 譚苑苑:再談《資本論》的勞動本體論思想
    ——兼與譚苑苑博士商榷》(《當代經濟研究》2017年第1期,以下簡稱「胡文」)一文中則認為,馬克思在《資本論》中的勞動本體論立場已經發生動搖,馬克思沒有在本體論意義上探討勞動,只是在一般意義上展開了對勞動及其相關問題的研究,《資本論》應該以資本為本體。
  • 新時期以來文藝本體論建設反思
    從絕對本質主義到本質論與存在論相結合從哲學理論層面來看,新時期以來的文藝本體論建設還包含文藝本質論與文藝存在論的論爭。這兩者在尋求各自獨立發展的基礎上,找到了共同推進文藝本體論建設的統一方向,並由此形成了獨立統一的關係。本質論探討的是某一事物用以區別於其他事物的最直接、最核心的特徵。文藝本質論指對「文藝是什麼」的終極追問,它是文藝本體論在哲學範疇上的體現。
  • 辯證法的本體論基礎:黑格爾與馬克思
    擺脫這種境況,需要從根本上對黑格爾和馬克思的辯證法開展出本體論基礎的研討。本文試圖就此闡明以下要點:(1)辯證法不是任何一種形式方法;形式方法只能滯留於「外部反思」的運用及其主觀主義的實質之中,從而表明其自身乃是形式主義的和反辯證法的。(2)黑格爾哲學立足於絕對者主體的自我活動,這一本體論立場在復活希臘辯證法的同時,決定性地重構了方法概念,並使方法成為實體性內容的自我展開過程。
  • 論中西本體論的差異|鄧曉芒
    用「是」作為世界「本體」,豈不是拋開「實事」而給強辭奪理大開方便之門?所以語言及其「是」在中國並沒有自己獨立的地位,而只是人們手中的一種任意支配的工具,歸根結底是政治權力的工具,體現的是「話語霸權」。有霸權(包括話語霸權)的人是可以不聲不響地做的,根本不用管在語言上說不說得通,就連話語霸權,也只是一個服務性的輔助工具,真正起作用的是「槍桿子」而不是「筆桿子」。
  • 本體論和認識論
    皮浪的懷疑論斷無意中勾勒出了哲學發展的的一個脈絡,即本體論哲學,認識論哲學和語言哲學。 哲學和科學密不可分。我們做任何科學研究,都不可避免地涉及到兩個基本的哲學問題。第一個問題,現實的本性。什麼是現實?什麼是存在?解決這類問題的哲學領域叫做本體論。第二個問題,獲取知識的方法。
  • 聯通主義:「網際網路+教育」的本體論
    各種「網際網路+教育」的創新實踐在我國大地上不斷湧現,變革著教育的組織體系與服務體系。「網際網路+教育」是教育信息化發展的新階段,也是技術推動教育產生革命性變革的基礎(陳麗,2016)。這些在不斷發展的多樣化的「網際網路+教育」創新實踐與前期教育信息化實踐應用有何本質的不同?這些本質的不同又會帶來教育實踐體系與理論體系的何種變化?
  • 闡釋學的蛻變與本體-目的論的建構
    海德格爾的「前理解」和加達默爾的「成見」在基礎本體論上是一致的,即都是建立在海德格爾關於存在的學說之上。  本體論自18世紀的唯理論者沃爾夫到海德格爾以前,一直是作為一種導致有關存在本質的必然真理的演繹方法。與康德所論的本體不同。康德所論的本體,是指與他所稱的現象——顯現於一位觀察者的事物——相對立的事物本身。人們可以認識現象,但不能把握本體。
  • 印度佛教本體論簡述——方立天
    大乘瑜珈行派(有宗)的唯識本體說,是一個多層次的複雜學說,是唯識學認識論體系的核心內容,其間涉及心識、阿賴耶識和種子諸說,也涉及三性說,理清這些概念的思想脈絡及其相互關係,對揭示唯識思想的實質,把握該派獨特的本體學說,看來是很有必要的。唯識學思想體系的基本命題是「萬法唯識」,「一切唯識」,「唯識所變」,「唯識無境」。「唯」,僅,不離;「識」,心識。
  • 藝術本體論不能含糊
    原標題:藝術本體論不能含糊 中國藝術批評界對本體論問題並不重視,許多批評家和策展人認定當代藝術的突破仍要繼續依賴語言形態的不斷翻新,要依靠對某種社會形態的尖銳批判來完成。這個判斷大體上本沒有什麼錯,但是由於過於簡單粗糙且急功近利,在沒有藝術本體論學養的前提下,所謂語言的翻新就是花樣的鍊金,繼續執行現代主義業已衰竭的線性演進方案,要麼淪為強弩之末,要麼就演變為炫目的景觀大比拼。而漠視藝術本體、單方面強調藝術的社會性和幹預性實際上就突破了現代性以來藝術自治、審美獨立的界限,使藝術失去自我根基,進退失據,倒逼藝術自身的隱退,徹底同化為文獻學素材、社會學檔案。
  • 孫正聿:存在論、本體論和世界觀
    孫正聿:存在論、本體論和世界觀 ——「思維和存在的關係問題」的辯證法 2017年06月30日 22:17 來源:《哲學研究》 作者:孫正聿 字號 內容摘要:
  • 中國哲學有沒有本體論?
    哲學和本體論這些名詞是由西方學術的詞語中翻譯過來,既已翻譯了科目名稱,當然便要找找有沒有這些科目的內容。所以要了解甚麼是「本體論」,首先要看看西方學術中的「哲學」和「本體論」是說些甚麼,然後再在中國學問中找,看有沒有相類似的學問,如有,便把這些內容稱為「中國哲學」、「中國的本體論」。
  • 略論佛教本體哲學——胡曉光
    這三個宗系,都有自己的本體論。本文試圖對大乘佛教的各種體論做一番邏輯分析,從而澄明佛教本體的本質規定。一、何謂「本體」?本體就是事物的本性,哲學的本體是一個共相本體,即普遍性與必然性的理則。科學的本體是一個殊相本體,即萬象森羅的分理。在西方哲學史中,講本體有兩大哲學主義,一是唯物主義哲學本體論,二是唯心主義哲學本體論。
  • 新書推薦《數理本體論——存在與量度》
    在學科上,本體論同語言、數學與各門具體科學密切相關,是這些知識的精華,因此涉及的方面廣泛而宏博,太史公曰「究天人之際,通古今之變,成一家之言」,本體論其實就是這樣一門通識的、博物的學問,在現代還需要加上另一個要求,那就是精確的、實用的。為此,作者花費了較多的時間與精力創作了本著,力求概括各種知識、在思想上努力吸取新的觀點。本著也解釋了以往著名思想家的一些觀點,辨析正誤,這有助於理解他們深奧的思想。