本體和知識圖譜之間的區別是什麼?

2020-12-14 雷鋒網

譯者:AI研習社(洛克麥金託、小海綿)

雙語原文連結:What’s the Difference Between an Ontology and a Knowledge Graph?

隨著語義應用程式成為業界越來越熱門的話題,客戶經常來EK詢問有關本體和知識圖譜的問題。具體來說,他們想知道兩者之間的區別。本體和知識圖譜是一回事嗎?它們有何不同?兩者之間是什麼關係?

在這篇博客中,我將引導您了解本體和知識知識圖譜,講述它們之間的區別以及它們如何組織大量數據和信息。

什麼是本體?

本體是語義數據模型,用於定義domain中事物的類型以及可用於描述它們的屬性。本體是廣義的數據模型,這意味著它們僅對具有某些屬性的事物的一般類型進行建模,而並不包含有關我們domain中具體個體的信息。例如,本體論不能描述您的狗,斑點和它的所有個體特徵,主要描述狗的一般概念,嘗試描述大多數狗可能具有的特徵。這樣做可以使我們在將來用本體來描述其他狗。

本體有三個主要組成部分,通常描述如下:

類: 存在於數據中的不同類型的。關係:連接兩個類的屬性。屬性:描述單個類的屬性。例如,假設我們有以下關於書籍、作者和出版商的信息:

首先,我們要標識類(數據中事物的唯一類型)。這個示例數據似乎捕獲了關於書籍的信息,因此它是類的一個很好的候選項。具體來說,示例數據捕獲了關於書籍的某些類型的內容,比如作家和出版商。再深入一點,我們可以看到我們的數據還捕獲了關於出版商和作者的信息,比如他們的位置。這給我們留下了這個例子中的四個類:

書籍作者出版商位置下一步,我們需要標識關係和屬性(為了簡單,我們可以將關係和實體屬性都視為屬性)。使用我們在之前定義的類,我們可以查看數據並開始列出我們看到的每個類的所有屬性。例如,在書籍類中,一些屬性可能是:

書籍有作者書籍有出版商書集是在一個日期出版的書籍之後有續集(其他書)其中一些屬性是連接兩個類的關係。例如,關係屬性「書籍有作者」是一個連接書籍類和作者類的關係。其他屬性,像「書籍發布的日期」是實體屬性,只描述一個類,而不是將兩個類連接在一起。

需要注意的是,這些屬性可能適用於任何給定的書籍,但它們不一定適用於每一本書。例如,很多書都沒有續集。這在我們的本體中很好,因為我們只是想確保我們捕獲了可能適用於許多(但不一定是所有)書籍的屬性。

雖然上面的屬性列表很容易閱讀,但是重寫這些屬性以更清楚地定義我們的類和屬性會有所幫助。例如,「書籍有作者」可以寫成:

書→有作者→作者

儘管你可以包括更多的屬性,這取決於你的用例,對於這個博客,我已經定義了以下屬性:

書→有作者→作者 書→有出版商→出版商書→出版於→出版日期書→後面是→書 出版商 →位於→位置位置→位於→位置記住,我們的本體是一個通用的數據模型,這意味著我們不想在本體中包含關於特定書籍的信息。相反,我們希望創建一個可重用的框架,將來我們可以用它來描述其他書籍。

當我們結合類和關係時,我們能夠以圖的形式查看本體:

什麼是知識圖譜?

使用本體作為一個框架,我們可以添加關於個別書籍、作者、出版商和位置的真實數據來創建一個知識圖譜。利用上面表中的信息和本體,我們可以創建每個本體關係的特定實例。比如,如果我們的本體中有這樣的關係「書籍→有作者→作者」,這個關係的單個實例如下:

如果我們把我們擁有的關於《殺死一隻知更鳥》這本書的所有信息加進去,我們可以看到知識圖譜的開端:

如果我們對所有的數據都這麼做,我們最終會得到一個使用本體對數據進行編碼的圖。通過使用知識圖譜,我們可以將數據看作一個關係網絡,而不是作為單獨的表格在我們無法理解的數據點間繪製新的連接。具體來說,使用SPARQL,我們可以查詢數據和使用推理功能(讓知識圖譜建立之前沒有定義的連接)。

那麼本體和知識圖譜有什麼不同呢?

正如你在上面例子中所看的,當你將本體(我們的數據模型)應用到一組單獨的數據點(書籍、作者和出版商數據)時,那麼就是創建了一個知識圖譜。換句話說:

本體+數據=知識圖譜

AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,為AI學術青年和開發者的交流互助和職業發展打造一站式平臺,致力成為中國最大的科技創新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。

相關焦點

  • AI產品經理的入門必修課(4)——知識圖譜
    02 知識圖譜是什麼了解知識圖譜是什麼之前,先了解數據、信息、知識之間的關係。數據是指聲音、圖像、符號,通常指最原始的記錄,數據間彼此孤立,沒有經過加工和解釋。信息是指數據經過加工處理後,建立了某種聯繫或增加了某些屬性;信息可以經過加工和處理轉化為數據進行存儲,數據是信息的表現形式。
  • 6個方面分析:知識圖譜的價值和應用
    而「認知語言是人區別於其他動物的能力,同時,知識也使人不斷地進步,不斷地凝練、傳承知識,是推動人不斷進步的重要基礎。」 知識對於人工智慧的價值就在於,讓機器具備認知能力。而構建知識圖譜這個過程的本質,就是讓機器形成認知能力,去理解這個世界。
  • 王昊奮:大規模知識圖譜技術
    網際網路正從僅包含網頁和網頁之間超連結的文檔全球資訊網(Web of Document)轉變成包含大量描述各種實體和實體之間豐富關係的數據全球資訊網(Web of Data)。國內外網際網路搜尋引擎公司紛紛以此為基礎構建知識圖譜,如Google知識圖譜(Google KnowledgeGraph),百度「知心」和搜狗的「知立方」,以此來改進搜索質量,從而拉開了語義搜索的序幕。
  • 百分點認知智能實驗室:信息抽取在知識圖譜構建中的實踐與應用
    編者按坦率地講,各行各業對如何落地知識圖譜這個問題,或多或少都心存一絲疑惑。人類知識和機器可理解的知識有什麼區別?知識圖譜如何突破自身局限性,從「萬事通」轉為「科學家」?
  • 「SHAI2018嘉賓系列—PlantData丁軍」AI浪潮中的知識圖譜專家
    大會官網:www.shai2018.org丁軍PlantData CEO,知識圖譜理論與實戰專家華東理工大學博士,PlantData創始人,知識圖譜理論與實戰專家,在語義網、本體、知識工程及知識圖譜等領域有多年以上的研究和產業化經驗,長期從事行業知識圖譜構建及應用方面研究。
  • 人工智慧大神深度解剖知識圖譜的六大應用-虎嗅網
    因為知識圖譜這個詞最先是由谷歌在2012年提出的,作為谷歌的兩大重要技術儲備,一個是深度學習,形成了谷歌大腦;另一個就是知識圖譜,用來支撐下一代搜索和在線廣告業務。這是一個通用的知識圖譜的框架,我們可以看到知識圖譜不是空中樓閣,而是基於現有數據的再加工,包括關係資料庫中的結構化數據、文本或XML中的非結構化或半結構化數據、客戶數據、領域本體知識以及外部知識,通過各種數據挖掘
  • 知識圖譜改變銀行業務模式?基於GraphDB探索FIBO
    簡介本體或知識圖譜可不是隨拿隨用的,使用者需要做出相應的努力才能發揮其作用,使其成為有效可用的工具。我們知道,領域知識的用處極大,然而這些知識卻總是不完備的,將領域知識表示為圖中的數據可不容易。FIBO的內容多種多樣,其中,RDF和OWL本體是包含業務知識的核心實體。這些業務知識可表示為RDF-XML、Turtle、JSON-LD和N-Quads/N-Triples等形式。此外:FIBO詞彙表基於SKOS分類法,用於RDF-XML、Turtle和JSON-LD序列化的分類管理。
  • 以史為鑑:從數字計算機到知識圖譜的這 60 多年
    引言「忘記過去的人註定要重蹈覆轍」—— George Santayana從某種程度上來說,我們可以認為知識圖譜實現了計算機科學早期的願景:創造智能化的系統,從而大規模集成知識和數據。本世紀初,研究者們提出了「知識圖譜」這一術語,谷歌自 2012 年起便大力推廣「知識圖譜」技術,讓它在學術界和工業界迅速流行了起來。
  • 知識圖譜前沿跟進,看這篇就夠了,Philip S. Yu 團隊發布權威綜述...
    實體可以是真實世界中存在的對象,也可以是抽象的概念;關係則表示實體之間的關聯;實體及其關係的語義描述包含定義良好的類型和屬性。如今,屬性圖已經被廣泛使用,其中節點和關係都具有屬性。術語「知識圖譜」和「知識庫」幾乎是同義詞,只有很微小的差別。當我們考慮知識圖譜的圖結構時,可以將其視為一個圖。當涉及形式語義問題時,它又可以作為對事實進行解釋和推理的知識庫。
  • 這周日,北理工將邀數位大咖研討「知識圖譜與智能問答」
    在過去幾個月中,其有效地融合了高校資源和業界資源推出了Python、知識圖譜、機器學習等系列專題學習與研討活動,其中知識圖譜專題涉及了知識圖譜構建技術、知識圖譜應用、大規模知識圖譜數據存儲、知識圖譜與聊天機器人等主題,引起了北京地區廣大師生和業界人員的高度關注。
  • 一文全覽,ICLR 2020 上的知識圖譜研究
    我們曾對 ICLR 2020 上的圖機器學習趨勢進行介紹,本文考慮的主題為知識圖譜。作者做波恩大學2018級博士生 Michael Galkin,研究方向為知識圖和對話人工智慧。在AAAI 2020 舉辦之際,他也曾對發表在AAAI 2020上知識圖譜相關的文章做了全方位的分析,具體可見「知識圖譜@AAAI2020」。
  • BAMNet: 基於知識圖譜的問答系統
    KBQA之所以具有挑戰性,其中一個原因是問題描述和知識圖譜之間存在詞彙空缺(lexical gap)。具體來說,同樣一個問題描述,可以有不同的表達形式,而知識圖譜使用的可能是另一套標準化的詞彙和說法,因此兩者間的對應關係並非那麼明晰。大量基於信息檢索的方案對問題描述和知識圖譜分別進行嵌入表徵,而恰恰沒有考慮到兩者間更精細的對應關係。
  • 圖靈獎得主論體系結構創新,自動構建知識圖譜,盡在WAIC開發者日
    他指出,每個人都了解什麼是知識,大腦結合快速和緩慢兩種思維系統來產生知識。同時提出以下類比:神經網絡生成知識類似於快速思維,常規計算機生成知識類似於緩慢思維,通過有意識和努力的思考產生。那麼知識如何分類呢?Sifakis 將知識分為了事實和推論、隱含的經驗知識、科學和技術知識、非經驗知識(如數學和計算機知識)和元知識(知識的知識)。
  • 第四屆達觀杯 x CCKS算法大賽圓滿收官,激發知識圖譜實踐新思路
    從第一屆的「個性化推薦」為賽題,第二屆「文本分類」;第三屆文本智能信息抽取」,到第四屆與CCKS聯合舉辦的「基於本體的金融知識圖譜自動化構建技術評測」,達觀數據持續通過在技術與應用場景之間搭建互通的橋梁,讓優秀的技術在解決實際問題中發揮最大價值。在第十四屆全國知識圖譜與語義計算大會現場,達觀數據副總裁王文廣總結了本次測評大賽的情況。
  • -- 用知識圖譜消除商業與數據之間鴻溝
    ,但這個結果想要告訴我們什麼?」 因此同一條評論、用戶行為等過程數據,通常需要打上多種標籤,同時要把標籤之間的語義關係表達出來,這樣的方式近似人類語言中的概念與知識體系。學術界稱之為「知識圖譜」。 2、發現數據中的特徵作為新的知識 簡單的統計方法,發現的僅僅只是淺顯的客觀事實,但對於企業的業務決策優化,無法提供結論或建議。
  • 在剛剛結束的ACL 2019上,知識圖譜領域都發生了哪些大事?
    大家好,ACL 2019 剛剛結束,我在風景如畫的佛羅倫斯參加了為期一周的講座,教程和研討會!在本文中,我將回顧一下知識圖譜如何步步為營地融入 NLP 研究社區。基於知識圖譜的對話系統傳統的對話系統分為目標導向型(goal-oriented)和閒聊型(chit-chat)智能體。
  • 明略科技HAO圖譜:從數據到知識的應用實踐
    認知系統,包括關聯挖掘、知識圖譜的構建,以及基於知識圖譜的檢索、推薦平臺。行動系統,除了交互式BI,面對行業的小程序或者APP,還有一些硬體產品,比如機械臂、電子工牌等。目前,HAO圖譜,能夠把語音或者文本這類一維的序列翻譯成高維的圖結構,形成由實體和關係組成的圖譜。
  • 深度解剖知識圖譜的四大應用
    什麼是知識圖譜?知識圖譜本質上是一種語義網絡,是基於圖的數據結構,以圖的方式存儲知識並向用戶返回經過加工和推理的知識。它由「節點」和「邊」組成,節點表示現實世界中的「實體」,邊表示實體之間的「關係」。一般來說,知識圖譜分為通用知識圖譜和領域知識圖譜。
  • 重啟人工智慧:當深度學習遇上知識圖譜
    知識圖譜,這個炒過 20 年的老古董,或許在那兒能有一番作為。「這就是我們需要做的事情。雖然現在不流行,但這就是為什麼流行的東西不起作用」 ,這是對科學家、暢銷書作家、企業家 Gary Marcus 多年來一直在說的話的一種粗略的過度簡化,不過至少他本人是這麼說的。所謂「流行的東西不起作用」部分指的是深度學習,而「我們需要做什麼」部分指的是對人工智慧採取更全面的方法。
  • 從ACL 2020看知識圖譜研究進展
    1.1 背景知識介紹知識圖譜(Knowledge Graph)是一種多關係圖,其中,節點表示實體,邊表示實體之間的關係。知識圖譜存儲來自不同來源的關於人、地方和世界的事實。這些事實以三元組形式保存(頭實體、關係實體、尾部實體),並表示為(h, r, t) 。