本體和知識圖譜之間的區別是什麼?

2021-01-13 雷鋒網

譯者:AI研習社(洛克麥金託、小海綿)

雙語原文連結:What’s the Difference Between an Ontology and a Knowledge Graph?

隨著語義應用程式成為業界越來越熱門的話題,客戶經常來EK詢問有關本體和知識圖譜的問題。具體來說,他們想知道兩者之間的區別。本體和知識圖譜是一回事嗎?它們有何不同?兩者之間是什麼關係?

在這篇博客中,我將引導您了解本體和知識知識圖譜,講述它們之間的區別以及它們如何組織大量數據和信息。

什麼是本體?

本體是語義數據模型,用於定義domain中事物的類型以及可用於描述它們的屬性。本體是廣義的數據模型,這意味著它們僅對具有某些屬性的事物的一般類型進行建模,而並不包含有關我們domain中具體個體的信息。例如,本體論不能描述您的狗,斑點和它的所有個體特徵,主要描述狗的一般概念,嘗試描述大多數狗可能具有的特徵。這樣做可以使我們在將來用本體來描述其他狗。

本體有三個主要組成部分,通常描述如下:

類: 存在於數據中的不同類型的。關係:連接兩個類的屬性。屬性:描述單個類的屬性。例如,假設我們有以下關於書籍、作者和出版商的信息:

首先,我們要標識類(數據中事物的唯一類型)。這個示例數據似乎捕獲了關於書籍的信息,因此它是類的一個很好的候選項。具體來說,示例數據捕獲了關於書籍的某些類型的內容,比如作家和出版商。再深入一點,我們可以看到我們的數據還捕獲了關於出版商和作者的信息,比如他們的位置。這給我們留下了這個例子中的四個類:

書籍作者出版商位置下一步,我們需要標識關係和屬性(為了簡單,我們可以將關係和實體屬性都視為屬性)。使用我們在之前定義的類,我們可以查看數據並開始列出我們看到的每個類的所有屬性。例如,在書籍類中,一些屬性可能是:

書籍有作者書籍有出版商書集是在一個日期出版的書籍之後有續集(其他書)其中一些屬性是連接兩個類的關係。例如,關係屬性「書籍有作者」是一個連接書籍類和作者類的關係。其他屬性,像「書籍發布的日期」是實體屬性,只描述一個類,而不是將兩個類連接在一起。

需要注意的是,這些屬性可能適用於任何給定的書籍,但它們不一定適用於每一本書。例如,很多書都沒有續集。這在我們的本體中很好,因為我們只是想確保我們捕獲了可能適用於許多(但不一定是所有)書籍的屬性。

雖然上面的屬性列表很容易閱讀,但是重寫這些屬性以更清楚地定義我們的類和屬性會有所幫助。例如,「書籍有作者」可以寫成:

書→有作者→作者

儘管你可以包括更多的屬性,這取決於你的用例,對於這個博客,我已經定義了以下屬性:

書→有作者→作者 書→有出版商→出版商書→出版於→出版日期書→後面是→書 出版商 →位於→位置位置→位於→位置記住,我們的本體是一個通用的數據模型,這意味著我們不想在本體中包含關於特定書籍的信息。相反,我們希望創建一個可重用的框架,將來我們可以用它來描述其他書籍。

當我們結合類和關係時,我們能夠以圖的形式查看本體:

什麼是知識圖譜?

使用本體作為一個框架,我們可以添加關於個別書籍、作者、出版商和位置的真實數據來創建一個知識圖譜。利用上面表中的信息和本體,我們可以創建每個本體關係的特定實例。比如,如果我們的本體中有這樣的關係「書籍→有作者→作者」,這個關係的單個實例如下:

如果我們把我們擁有的關於《殺死一隻知更鳥》這本書的所有信息加進去,我們可以看到知識圖譜的開端:

如果我們對所有的數據都這麼做,我們最終會得到一個使用本體對數據進行編碼的圖。通過使用知識圖譜,我們可以將數據看作一個關係網絡,而不是作為單獨的表格在我們無法理解的數據點間繪製新的連接。具體來說,使用SPARQL,我們可以查詢數據和使用推理功能(讓知識圖譜建立之前沒有定義的連接)。

那麼本體和知識圖譜有什麼不同呢?

正如你在上面例子中所看的,當你將本體(我們的數據模型)應用到一組單獨的數據點(書籍、作者和出版商數據)時,那麼就是創建了一個知識圖譜。換句話說:

本體+數據=知識圖譜

AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,為AI學術青年和開發者的交流互助和職業發展打造一站式平臺,致力成為中國最大的科技創新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。

相關焦點

  • 知識圖譜在金融資管領域的應用、實踐與展望
    ·第四,從應用的形態上來看,專業領域知識圖譜的應用往往涉及決策分析支持,需要用知識圖譜支持邏輯推理,並提供較強的可解釋性。根據熵簡科技的產業實踐經驗,相比其他專業領域而言,金融領域的知識圖譜有兩個顯著特點。首先,金融知識具有較高的複雜性和層次性。
  • 【乾貨】最全知識圖譜的概念篇
    由於網際網路內容的大規模、異質多元、組織結構鬆散的特點,給人們有效獲取信息和知識提出了挑戰。知識圖譜(Knowledge Graph) 以其強大的語義處理能力和開放組織能力,為網際網路時代的知識化組織和智能應用奠定了基礎。最近,大規模知識圖譜庫的研究和應用在學術界和工業界引起了足夠的注意力。知識圖譜旨在描述現實世界中存在的實體以及實體之間的關係。
  • 從本體論開始說起——運營商關係圖譜的構建及應用
    一.本體論全球資訊網之父Tim Berners-Lee教授在1998年將語義網絡(Semantic web)帶入人類的視線。目的是賦予網絡理解詞語、概念以及它們之間邏輯關係的能力,使人機互動變得更有效率。本體論(Ontology)做為語義網的核心,是研究實體存在及其本質的通用理論。
  • 如何構建知識圖譜?
    1 什麼是知識圖譜知識圖譜是谷歌在2012年提出來的,最初的目的是優化其搜尋引擎。在現實世界中是存在很多的實體的,各種人、物,他們之間是相互聯繫的。知識圖譜就是對這個真實世界的符號表達,描述現實世界中存在的一些概念,以及它們之間的聯繫。
  • 中科院趙軍帶你認識:知識圖譜的關鍵技術
    該報告首先介紹知識圖譜的發展脈絡,特別是與傳統知識表示方法的區別和聯繫,然後介紹知識圖譜構建和應用中的關鍵技術,進而討論知識圖譜及其構建與應用中的關鍵技術如何服務於大數據環境下的推薦系統,最後簡要介紹基於知識圖譜的推薦系統的前沿學術進展。
  • AI產品經理的入門必修課(4)——知識圖譜
    02 知識圖譜是什麼了解知識圖譜是什麼之前,先了解數據、信息、知識之間的關係。數據是指聲音、圖像、符號,通常指最原始的記錄,數據間彼此孤立,沒有經過加工和解釋。信息是指數據經過加工處理後,建立了某種聯繫或增加了某些屬性;信息可以經過加工和處理轉化為數據進行存儲,數據是信息的表現形式。
  • 試驗知識圖譜分析
    通常我們把知識分為領域知識、百科知識、場景知識、語言知識以及常識知識等,並且根據所存儲的知識的類型,可以對知識圖譜的類型進行劃分,包括:領域知識圖譜和通用知識圖譜。試驗知識圖譜是一種信息可視化方法,也是知識可視化方法。
  • 6個方面分析:知識圖譜的價值和應用
    正是因為有獲取和形成知識的能力,人類才可以不斷進步。知識圖譜對於人工智慧的重要價值在於,知識是人工智慧的基石。機器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動物也具備感知能力,甚至某些感知能力比人類更強,比如:狗的嗅覺。而「認知語言是人區別於其他動物的能力,同時,知識也使人不斷地進步,不斷地凝練、傳承知識,是推動人不斷進步的重要基礎。」
  • 華為開發者大會HDC.Cloud硬核技術解讀:知識圖譜構建流程及方法
    3月13日下午14:00起舉行的華為開發者大會2020(Cloud)第三期華為DevRun Live開發者沙龍中,華為雲自然語言處理技術專家鄭毅將分享《企業級知識計算平臺的技術解讀和案例實踐》,帶你了解華為雲知識計算平臺及相關技術、知識圖譜構建流程及方法,以及知識計算行業案例。下文主要講述「知識圖譜構建流程及方法」,讓我們先睹為快。一、什麼是知識圖譜?
  • 2020 WAIC明略科技HAO圖譜Open API 吳信東深度解讀知識圖譜的自動...
    數據圖譜不是知識圖譜吳信東認為,大多數情況下,我們所說的、所用到的圖譜並沒有後臺知識,只是數據圖譜,而不是知識圖譜。知識圖譜應該有三個組成部分,首先是概念,即圖譜的節點。概念跟概念之間是連接,是關係,即圖譜的邊。只有概念和關係還不夠,還需要背景知識解釋概念,和連接的語義。
  • 是時候該關注「知識圖譜」了!
    知識圖譜是什麼通俗地講,知識圖譜就是將複雜的知識通過數據挖掘、信息處理、知識計量和圖形繪製等一系列方式,把所有不同種類的信息連接在一起得到的一個關係網絡。在知識圖譜裡,用節點表示現實世界中存在的「實體」,用邊示意實體與實體之間的「關係」。
  • 百分點認知智能實驗室:信息抽取在知識圖譜構建中的實踐與應用
    編者按坦率地講,各行各業對如何落地知識圖譜這個問題,或多或少都心存一絲疑惑。人類知識和機器可理解的知識有什麼區別?知識圖譜如何突破自身局限性,從「萬事通」轉為「科學家」?
  • 晉梅:金融知識圖譜的應用探索
    以下整理來自嘉賓分享實錄:金融知識圖譜的概念和應用在信息爆炸時代,對客觀事實的各種描述是海量的、無序的、混亂的信息,而知識被定義為是對客觀規律和信息的歸納總結。基於此概念,知識圖譜是一種用圖的結構對知識進行表達的方式,它的基本組成要素是節點和邊,節點用於表示實體,邊用於呈現關係。
  • 知識圖譜改變銀行業務模式?基於GraphDB探索FIBO
    譯者:AI研習社(季一帆)雙語原文連結:Exploring FIBO Using the Inference and Property Path Features of GraphDB簡介本體或知識圖譜可不是隨拿隨用的,使用者需要做出相應的努力才能發揮其作用,使其成為有效可用的工具
  • 2020年中國面向人工智慧「新基建」的知識圖譜行業白皮書
    >用圖模型來描述知識和建模萬物關係的語義網絡 知識圖譜是一種用圖模型來描述知識和建模世界萬物之間關聯關係的大規模語義網絡,是大數據時代知識表示的重要方式之一。 知識圖譜的構建遵循知識抽取、知識融合、知識加工、知識應用的基本流程。從海量結構化和非結構化數據中進行實體、關係、屬性和事件的信息提取,通過本體和實體對齊、指代消解解決多種類型的數據衝突問題,完成知識融合。將知識存儲到知識庫中,最後進行進一步的知識推理和圖譜應用。
  • 明略科技HAO圖譜Open API:開放企業級知識圖譜構建能力
    領域圖譜包括:由大量實例組成的數據圖譜、由因果關係組成的因果圖譜、由領域本體結構和領域詞表組成的語義工具;圖譜增強的應用:針對領域內的特定場景需求,基於圖譜做可視化交互、分類、檢索、推薦、文本生成等特定任務。目前 HAO 圖譜開放的 Text2KG API 接口,提供了文本轉圖譜的能力,但後臺還做了一些面對 PDF、PPT、word 等半結構化文檔的信息抽取接口。
  • 「2018年全國知識圖譜與語義計算大會」開始徵文!
    全國知識圖譜與語義計算大會是兩個全國性會議的合併:中文知識圖譜研討會 the Chinese Knowledge Graph Symposium (CKGS) 和中國語義網際網路與 Web 科學大會 Chinese Semantic Web and Web Science Conference (CSWS)。
  • 事理圖譜:事件演化的規律和模式
    事件之間在時間、空間上相繼發生的演化規律和模式是一種十分有價值的知識。然而,現有的典型知識圖譜均以實體及其屬性和關係為研究核心,缺乏對事理邏輯這一重要人類知識的刻畫。為了彌補這一不足,事理圖譜應運而生,它能夠揭示事件的演化規律和發展邏輯,刻畫和記錄人類行為活動。在圖結構上,事理圖譜是一個有向有環圖,其中節點表示事件,有向邊表示事件之間的演化關係。
  • Data Fabrics與知識圖譜之間的共生關係
    Datafabrics極大地簡化了從這些平臺浩如煙海的原始資料中提取數據的過程;反過來,知識圖譜提供了一些基本功能,使Datafabrics能夠實現這一目標。因此,Data fabrics相當重要,它被認為是協調和集成數據的最成熟的手段。在知識圖譜技術的支持下,Datafabrics可以為任何獨立的業務需求提供校準所有類型數據的最佳方式。
  • 究竟知識圖譜是什麼?它又與人工智慧有著怎樣的聯繫呢?
    谷歌將語音搜索、Google Assistant、Google Lens、Google Home諸多軟硬體產品均接入谷歌知識圖譜,以構建更大的知識網絡,阿里也利用自己的電商優勢捕獲海量數據形成更有效的用戶畫像併入自己的知識網絡,並聯合清華大學、中科院等機構組建高級知識圖譜研究團隊…… 那究竟知識圖譜是什麼?它又與人工智慧有著怎樣的聯繫呢?