老焦專欄|一個典型的知識圖譜應用建設案例

2020-12-12 EAWorld

轉載本文需註明出處:微信公眾號EAWorld,違者必究。

1

知識圖譜的幾種典型應用方式

基於知識圖譜的應用可以分為幾種典型的類型,這幾種應用使用的場景各有不同,在使用技術上也各有側重,我們希望能夠根據不同類型,總結出一些通用的場景,指導應用建設:

1)知識推理類型就是通過已知的知識,推理出未知的知識,這在知識圖譜應用的建設中,具備非常大的誘惑力,例如大型裝備的故障診斷,當裝備發生故障的時候,會接到很多的故障報警信息,利用知識推理可以快速定位故障的原因,提高故障定位的速度,減少對人的依賴;

2)知識呈現類是將各種實體關係進行處理,用一定的方式呈現出來,幫助使用者理解複雜的事物,找出規律或者答案。例如在公共安全領域用「數據對碰」的方式找出嫌疑人與案件之間的關聯, Palantir、i2 等公司都有這種知識可視化呈現的工具;

3)知識問答類應用根據提問者語音或者文字的輸入,找到相關的知識,完成與提問者之間的互動,通常語音客服、員工助手等應用都屬於這一類型。一般來說問答類應用分為聽清、聽懂、能做三個部分,聽清可以基於目前百度、騰訊、科大訊飛等組件完成。由於這些應用往往面向特定的專業領域, 聽懂和會做就可以採用領域知識圖譜技術,通過交互得到 5W1H (Why、What、When、Where、Who、How)幾個方面信息,讓計算機按提問者要求完成工作。

4)知識共享類應用主要解決在不同機構之間知識共享。很多機構之間,由於法律法規等原因,無法直接獲取對方數據,只能在相互之間通過知識圖譜進行溝通,例如某市大數據中心有稅務數據,公安偵查需要稅務數據,但是根據法律不能直接調用具體的稅務數據進行偵查,除非對具體主體立案。這種情況下,公安部門可以提供主體的一些典型特徵,大數據中心根據特徵提供相關主體的列表,公安部門根據列表縮小範圍,繼續偵查,得到新特徵,再調取列表。經過幾次知識的碰撞,確定相關嫌疑人,再進行立案調查。

2

基於相關矩陣的知識推理類應用:

大型裝備故障自動診斷

知識推理的方法比較多,如果看理論文獻,有自上而下的演繹法,在給定一個或者多個前提的基礎上,推斷出一個必定成立的過程。也有自下而上的歸納法,基於已觀察的結果,得出一個結論,歸納法又分成溯因推理和類比推理。不過這些太理論化了。

領域知識圖譜應用中,最常見的推理就是基於規則的推理。在建設知識圖譜的過程中,會產生很多規則,這些規則有可能依附於概念之間的關係,也可能是事件、處置的描述方式,用規則的方式來表述知識,是一種最常見的方式。規則包括條件規則、規則樹、規則矩陣、規則流等多種方式,這裡我們介紹一種以相關矩陣做為規則的實際應用情況。

前面提到,在大型裝備出現故障時,往往接收到大量的故障信號,如何判定故障發生的具體原因,是一個比較複雜的問題,這裡就是介紹解決這個問題的(寫這個段落時,我比較猶豫,因為這裡會涉及到具體的裝備製造業務,最後還是咬咬牙寫下來,畢竟知識圖譜建設中,關鍵是業務的理解,實際上我們的方法也有助於快速的理解業務。當然,我會儘可能寫的簡單一些)。我們以某飛機舵控系統為例,簡單化的方式我們把它分為電源、核心電路板、接口電路板、控制器、電機 5 個部分,每個部分的故障分別為斷路、CPU損壞、接口線路斷路、控制器燒毀、電機卡死 5 個故障,已有故障現象的知識為當電機轉角異常時電機卡死,當電機轉角異常、控制器輸出信號異常時控制器燒毀,當電機轉角異常、控制器輸出異常、控制計算機輸出異常時控制晶片損壞,當電機轉角異常、控制器輸出異常、控制計算機輸出異常時接口線路斷路,當電機轉角異常、控制器輸出異常、控制計算機輸出異常、電源電壓異常時電源斷路,如下圖所示:

(點擊圖片可放大)

上面的設備部件故障模式與故障徵兆的對應關係,可以如下表所示,矩陣中的 1 代表故障模式同故障徵兆具有關聯關係,即某種故障發生的時候,對應的故障徵兆(測試現象)會發生。例如矩陣中的第一行,表示「電源斷路故障"發生的時候,「電源電源異常」「控制計算機輸出信號異常」「控制器輸出信號異常」「電機轉角異常」這些現象均會發生:

如果將上圖用規則表述,可以用下面的方式做推理計算:

IF 控制計算機信號輸出異常

IF 控制器輸出信號異常

THEN 電機卡死

ELSE

THEN 控制器燒毀

ELSE

IF 電源電壓異常

THEN 晶片損壞 或者 接口線路斷路

(都是控制計算機故障,具體故障需要進一步分析,現有數據並不能確認)

ELSE

THEN 電源電路

這裡出現了一個新問題,如果裝備有上千個部件/元件,每個部件/元件有大量故障現象,按照上述的 IF/ELSE 模式進行規則推理的編寫會非常複雜,因此在推理時不會使用 IF/ELSE 方式進行推理。而是將這些部件和故障按上圖方式,形成一個非常大的相關矩陣,上圖矩陣中每一行都對應一個具體的故障模式,這樣就可以根據每一行的特徵,利用二值相關性模型進行快速定位故障,目前有專業的故障推理機從事這方面工作。如果沒有專業的故障推理機,對於簡單一些的情況,也可以使用代碼生成的方式生成上述的 IF/ELSE 推理程序。

(點擊圖片可放大)

上面介紹的推理過程可以看出,故障診斷場景下推理的關鍵是形成故障與部件之間的相關矩陣,而形成相關矩陣的過程,也就是故障知識圖譜建設的過程。下面我們介紹一下故障知識圖譜形成的過程,如何建模,如何抽取,如何驗證,以便對知識圖譜建設方法有個更加清晰的認識。

本文針對領域知識圖譜,建設方法以「自頂向下」為主,「自下而上」為輔,對於故障診斷這樣的場景,「自頂向下」的知識來自於裝備設計,也就是說在裝備的設計過程中,就可以確定裝備內部各部件的拓撲結構、故障類型、測試方式,讓故障診斷的知識圖譜成為裝備設計環節的一部分,也就是說知識的抽取是在設計階段進行的。當裝備投入使用後,新的故障出現在對設計階段形成的圖譜進行補充,可以認為是一個「自下而上」的方式。

既然在裝備設計過程中形成知識圖譜,就需要有一個描述裝備、故障、測試幾者之間關係的模型,這也是知識建模的重要內容:業界一般用「多信號流圖」的方式描述,如下圖的示例。

(點擊圖片可放大)

這個圖形中,把裝備的部件、每個部件的故障模式、部件之間的關係、每個部件的測試點以及輸入輸出情況,用圖形化的方式描述了出來。在裝備設計中完成相關「多信號流圖」的設計,就可以通過「多信號流圖」產生前面的故障診斷相關矩陣。除此之外「多信號流圖」還可以完成知識驗證的工作,例如裝備設計中測試的完備性,推理故障之間的關聯性,出現新故障知識是推理知識是否合理等等,是裝備設計的一個重要手段。「多信號流圖」提高了知識圖譜的建設工程化水平,讓設計者用更容易理解和操作的方式進行設計,同時它也是一個多方面知識融合的過程。

我相信絕大多數讀者並不從事裝備設計領域,因此沒必要深入了解「多信號流圖」,但這種圖形化模式的提出對知識圖譜建設非常有借鑑價值。對應到傳統信息化軟體的設計你會發現,UML就是一種圖形化的建模方式,類圖屬於軟體靜態關係的圖形化描述,時序圖、狀態圖、序列圖等等是軟體動態關係的圖形化描述,部署圖是軟體物理結構的圖形化描述,因此在知識建模過程中,可以考慮建立自有的圖形化描述,提高知識抽取的工程化能力。

下圖總結了採用知識圖譜建設方法論,進行裝備故障診斷時各個階段的主要工作,包括:

(點擊圖片可放大)

1、知識建模階段,對裝備、功能(控制、分離、引導、連接...)、輸入輸出(能量、物質、信號)等基本概念的抽象,以及利用「多信號流圖」進行圖形化描述(類似面向對象的 UML 方式);

2、知識抽取階段,可以在研發過程中設計裝備的「多信號流圖」,對於研發階段沒有進行這方面設計的可以從維修手冊中抽取。用多信號流圖可以產生故障樹與故障相關矩陣。

3、知識驗證階段,可以利用相關矩陣推斷新增加的知識是否有效,也可以驗證測試是否完備,例如兩個故障模式在故障矩陣中故障特徵是一致的,就可能需要增加測試點;

4、利用故障知識圖譜,可以在開發實時診斷的應用,利用推理機實時確定故障發生的部件,產生故障應急的預案等等。

感謝胡政博士為本文提供的案例,他曾是國防科技大學裝備綜合保障技術重點實驗室的核心成員,我國裝備保障領域的知名專家。他創辦的湖南擎新公司,專注於大型裝備的實時故障診斷、檢測技術的研究與實踐,完成了多項重大武器裝備的故障診斷知識圖譜的建設。

3

總 結

企業軟體從流程化開始起步,逐步實現數據化,今天我們希望它能夠更加智能化。而目前智能化還主要體現在圖像識別、語音識別的應用,究其原因是目前以機器學習為核心的技術並不能滿足很多場景,諸如缺少大量數據、結果不夠明確、需要明晰推理過程。而建立專業領域知識圖譜,正是將人工智慧應用從簡單應用轉向知識密集但數據缺少的複雜應用。

《老焦專欄 | 解開知識圖譜神秘的面紗》、《老焦專欄 | 知識圖譜建設方法論》,在這一系列的三篇文章醞釀了很長時間,借鑑了企業軟體流行的面向對象方法,提出了一個工程化實施知識圖譜建設的方法論,包括知識建模中的領域劃分、概念與關係建模,知識抽取的自動化、非自動化方法,最後列舉了知識圖譜的四種應用形式,並通過一個裝備故障監測的示例,講解了如何基於知識圖譜進行推理、如何在知識圖譜建模時類似 UML 的方式建立知識模型。

後面我們還會針對知識圖譜這一話題,進行持續的探討,敬請期待。

- The End -

相關焦點

  • 一個典型的知識圖譜應用建設案例
    1知識圖譜的幾種典型應用方式基於知識圖譜的應用可以分為幾種典型的類型,這幾種應用使用的場景各有不同,在使用技術上也各有側重,我們希望能夠根據不同類型,總結出一些通用的場景,指導應用建設:1)知識推理類型就是通過已知的知識,推理出未知的知識,這在知識圖譜應用的建設中
  • 【乾貨】最全知識圖譜綜述#2: 構建技術與典型應用
    我們專知的技術基石之一正是知識圖譜-構建AI知識體系-專知主題知識樹簡介。下面我們特別整理了關於知識圖譜的技術全面綜述,涵蓋基本定義與架構、代表性知識圖譜庫、構建技術、開源庫和典型應用。主要基於的參考文獻來自[22]和[40], 本人(Quan)做了部分修整。昨天我們介紹了《知識圖譜的概念以及構建技術-知識提取、知識表示、知識融合》,今天介紹知識圖譜的知識推理和典型應用。
  • 縱覽知識圖譜在AI領域的有效應用,2019知識圖譜前沿技術論壇即將開幕
    滴滴的出行知識圖譜是這些實體、屬性及行為的數位化表示。為了讓數據發揮更大的作用,我們構建並深入挖掘了大規模的領域知識圖譜,並依託這些圖數據構建各種不同場景的有效解決方案。本次報告敘述了領域知識圖譜在滴滴生態中的廣泛研究和應用,包括基於實體圖譜的圖計算、圖嵌入、知識融合等案例服務,以及業務知識圖譜中以智能對話機器人和信息推薦為代表的應用。
  • 產品經理的知識圖譜應用
    圖1.1-3 三元組案例從不同視角,基於圖1.1-3的案例,我們來看一下知識圖譜在不同技術的理解。從網際網路視角來看,跟文本之間的超連結一樣,通過圖譜建立數據之間的語義連結。比如,張三的妻子是李四,通過圖數據方式支持實體、實體之間的關係的檢索。
  • 實戰課堂丨大數據關係信息挖掘:知識圖譜應用案例分享
    負責聯想創投大數據機器智能產品和行業應用模型開發。擁有多年高性能計算、大數據、人工智慧行業經驗 。畢業於美國紐約州立大學,曾在IBM認知團隊任行業解決方案專家。榮之聯實戰課堂第4期的《解讀大數據分析:新技術,新實踐》主題沙龍上,聯想創投(香港)機器智能實驗室高級產品經理錢廣銳跟大家分享了《大數據關係信息挖掘:知識圖譜應用案例分享》。
  • 知識圖譜在小米的應用與探索
    通過引入知識圖譜,這些產品在內容理解、用戶理解、實體推薦等方面都有了顯著的效果提升。本文的主要內容包括:小米知識圖譜介紹:包括小米的商業模式、小米人工智慧部、知識圖譜在人工智慧部的定位、小米知識圖譜的發展歷程、以及小米知識圖譜的落地場景。小米知識圖譜關鍵技術:小米知識圖譜在成長過程中的技術積累。小米行業知識圖譜探索:結合業務,跟大家分享下小米在行業圖譜上的探索。
  • 鄒磊 | 知識圖譜的數據應用和研究動態
    來源:《中國計算機學會通訊》2017年第8期《專欄》近年來,隨著「人工智慧」概念再度活躍,除了「深度學習」這個炙手可熱的名詞以外,「知識圖譜」也是研究者、工業界和投資人心目中的又一顆「銀彈」。簡單地說,「知識圖譜」是一種數據模型,是以圖形(Graph)的方式來展現「實體」、實體「屬性」,以及實體之間的「關係」。
  • 【綜述專欄】關於知識圖譜和語言模型的想法
    對於AI從業者來說,在廣袤的知識森林中,系統梳理脈絡,才能更好地把握趨勢。為此,我們精選國內外優秀的綜述文章,開闢「綜述專欄」,敬請關注。地址:https://www.zhihu.com/people/qin-hua-peng知識圖譜已經在推薦系統、搜尋引擎等應用場景下展現了它強大的威力,而當我們已經有了知識圖譜的時候,自然就會想,能不能讓模型通過知識圖譜,真正掌握所謂的「知識」呢?
  • 科普 | 典型的知識庫/連結數據/知識圖譜項目
    下面首先分別介紹了早期的知識庫項目和以網際網路為基礎構建的新一代知識庫項目。並單獨介紹了典型的中文知識圖譜項目。1. 早期的知識庫項目Cyc  :  Cyc 是持續時間最久,影響範圍較廣,爭議也較多的知識庫項目。
  • 知識圖譜KnowledgeGraph核心技術培訓班
    、高等院校及科研院所:隨著人工智慧的快速發展,知識圖譜knowledge graph作為一個主要領域活躍起來。本次對前沿的知識圖譜方法及應用進行了全面的講解,同時進行深入的案例分析,幫助學員掌握和利用深度學習進行具體工作的開展。本次培訓由北京中科軟博信息技術研究院、北京宏盛元亨文化交流中心具體承辦。如下;
  • 《知識圖譜完整項目實戰》學習指引
    一、前言本文是《知識圖譜完整項目實戰(附源碼)》系列課程的學習指引部分,主要是對《知識圖譜完整項目實戰》的課程特色、章節設置、關鍵技術和主要內容做一個簡介,目的是讓大家對本課程有一個系統性的認知。之所以有這樣一條,一方面因為我確實比較忙,拿不出那麼多的時間幫助大家逐個細節的解決問題;另外一個方面也是課程特色:課程特色1:案例驅動:圍繞一個完整的領域知識圖譜實戰項目展開
  • 百分點認知智能實驗室:信息抽取在知識圖譜構建中的實踐與應用
    信息抽取是知識工程、大數據、機器學習、自然語言處理的交叉技術。下文將重點探討信息抽取在知識圖譜的應用與實踐。2.  融合信息抽取的知識圖譜構建範式近年來,自然語言處理技術的飛速發展尤其是深度遷移學習技術給方興未艾的知識圖譜注入了一針「強心劑」。
  • 試驗知識圖譜分析
    、知識圖譜方面的應用研究。前言:知識圖譜是知識工程不斷發展衍生出的新一代知識工程技術,知識圖譜的概念最早是由谷歌在2012年正式提出,最初僅應用在智能搜索領域,目前已應用在多垂直領域,比如金融行業、醫療衛生、政府、能源與工業得到廣泛的應用。本期課程重點分為以下四個方面:試驗知識綜述、試驗知識圖譜分析、試驗知識圖譜構建技術和試驗知識圖譜技術展望。
  • 是時候該關注「知識圖譜」了!
    知識圖譜是什麼通俗地講,知識圖譜就是將複雜的知識通過數據挖掘、信息處理、知識計量和圖形繪製等一系列方式,把所有不同種類的信息連接在一起得到的一個關係網絡。在知識圖譜裡,用節點表示現實世界中存在的「實體」,用邊示意實體與實體之間的「關係」。
  • 知識圖譜系列:Task 1 知識圖譜介紹
    /team-learning-nlp/tree/master/KnowledgeGraph_Basic感謝Datawhale社區的無私分享想學習的小夥伴可以一起來1.知識圖譜知識圖譜本質上是語義網絡(Semantic Network)的知識庫。
  • 基於知識圖譜的智能問答
    基於知識圖譜的相關應用大致可以分為搜索、問答、決策、推薦等幾種常見的類別,對於知識圖譜的理解,可以參考之前的文章《三個角度理解知識圖譜》,本文主要就年初規劃的
  • 6個方面分析:知識圖譜的價值和應用
    當我們進行搜索時,搜索結果右側的聯想,來自於知識圖譜技術的應用。我們幾乎每天都會接收到各種各樣的推薦信息,從新聞、購物到吃飯、娛樂。個性化推薦作為一種信息過濾的重要手段,可以依據我們的習慣和愛好推薦合適的服務,也來自於知識圖譜技術的應用。
  • 2020年中國面向人工智慧「新基建」的知識圖譜行業白皮書
    根據覆蓋範圍的不同,知識圖譜可以區分為應用相對廣泛的通用知識圖譜和專屬於某個特定領域的行業知識圖譜:通用知識圖譜覆蓋範圍廣,注重橫向廣度,強調融合更多的實體,通常採用自底向上的構建方式,從開放連結數據(「信息」)中抽取出置信度高的實體,再逐層構建實體與實體之間的聯繫;行業知識圖譜指向一個特定的垂直行業,注重縱向深度,具有豐富的實體屬性和數據模式,通常採用自頂向下的構建方式
  • 很火的AI知識圖譜概念怎麼理解?是否能夠在工業網際網路中得到應用?
    由於網際網路內容的大規模、異質多元、組織結構鬆散的特點,給人們有效獲取信息和知識提出了挑戰。知識圖譜(Knowledge Graph) 以其強大的語義處理能力和開放組織能力,為網際網路時代的知識化組織和智能應用奠定了基礎。       最近,大規模知識圖譜庫的研究和應用在學術界和工業界引起了足夠的注意力。知識圖譜旨在描述現實世界中存在的實體以及實體之間的關係。
  • 一文讀懂知識圖譜的商業應用進程及技術背景
    通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關係網絡。知識圖譜提供了從「關係」的角度去分析問題的能力KG應用篇在知識圖譜應用這一塊我shi會通過介紹名人知識圖譜的聚類、知識圖譜在搜尋引擎、聊天機器人、金融科技領域等的商業應用。