老焦專欄|一個典型的知識圖譜應用建設案例

2020-12-14 EAWorld

轉載本文需註明出處:微信公眾號EAWorld,違者必究。

1

知識圖譜的幾種典型應用方式

基於知識圖譜的應用可以分為幾種典型的類型,這幾種應用使用的場景各有不同,在使用技術上也各有側重,我們希望能夠根據不同類型,總結出一些通用的場景,指導應用建設:

1)知識推理類型就是通過已知的知識,推理出未知的知識,這在知識圖譜應用的建設中,具備非常大的誘惑力,例如大型裝備的故障診斷,當裝備發生故障的時候,會接到很多的故障報警信息,利用知識推理可以快速定位故障的原因,提高故障定位的速度,減少對人的依賴;

2)知識呈現類是將各種實體關係進行處理,用一定的方式呈現出來,幫助使用者理解複雜的事物,找出規律或者答案。例如在公共安全領域用「數據對碰」的方式找出嫌疑人與案件之間的關聯, Palantir、i2 等公司都有這種知識可視化呈現的工具;

3)知識問答類應用根據提問者語音或者文字的輸入,找到相關的知識,完成與提問者之間的互動,通常語音客服、員工助手等應用都屬於這一類型。一般來說問答類應用分為聽清、聽懂、能做三個部分,聽清可以基於目前百度、騰訊、科大訊飛等組件完成。由於這些應用往往面向特定的專業領域, 聽懂和會做就可以採用領域知識圖譜技術,通過交互得到 5W1H (Why、What、When、Where、Who、How)幾個方面信息,讓計算機按提問者要求完成工作。

4)知識共享類應用主要解決在不同機構之間知識共享。很多機構之間,由於法律法規等原因,無法直接獲取對方數據,只能在相互之間通過知識圖譜進行溝通,例如某市大數據中心有稅務數據,公安偵查需要稅務數據,但是根據法律不能直接調用具體的稅務數據進行偵查,除非對具體主體立案。這種情況下,公安部門可以提供主體的一些典型特徵,大數據中心根據特徵提供相關主體的列表,公安部門根據列表縮小範圍,繼續偵查,得到新特徵,再調取列表。經過幾次知識的碰撞,確定相關嫌疑人,再進行立案調查。

2

基於相關矩陣的知識推理類應用:

大型裝備故障自動診斷

知識推理的方法比較多,如果看理論文獻,有自上而下的演繹法,在給定一個或者多個前提的基礎上,推斷出一個必定成立的過程。也有自下而上的歸納法,基於已觀察的結果,得出一個結論,歸納法又分成溯因推理和類比推理。不過這些太理論化了。

領域知識圖譜應用中,最常見的推理就是基於規則的推理。在建設知識圖譜的過程中,會產生很多規則,這些規則有可能依附於概念之間的關係,也可能是事件、處置的描述方式,用規則的方式來表述知識,是一種最常見的方式。規則包括條件規則、規則樹、規則矩陣、規則流等多種方式,這裡我們介紹一種以相關矩陣做為規則的實際應用情況。

前面提到,在大型裝備出現故障時,往往接收到大量的故障信號,如何判定故障發生的具體原因,是一個比較複雜的問題,這裡就是介紹解決這個問題的(寫這個段落時,我比較猶豫,因為這裡會涉及到具體的裝備製造業務,最後還是咬咬牙寫下來,畢竟知識圖譜建設中,關鍵是業務的理解,實際上我們的方法也有助於快速的理解業務。當然,我會儘可能寫的簡單一些)。我們以某飛機舵控系統為例,簡單化的方式我們把它分為電源、核心電路板、接口電路板、控制器、電機 5 個部分,每個部分的故障分別為斷路、CPU損壞、接口線路斷路、控制器燒毀、電機卡死 5 個故障,已有故障現象的知識為當電機轉角異常時電機卡死,當電機轉角異常、控制器輸出信號異常時控制器燒毀,當電機轉角異常、控制器輸出異常、控制計算機輸出異常時控制晶片損壞,當電機轉角異常、控制器輸出異常、控制計算機輸出異常時接口線路斷路,當電機轉角異常、控制器輸出異常、控制計算機輸出異常、電源電壓異常時電源斷路,如下圖所示:

(點擊圖片可放大)

上面的設備部件故障模式與故障徵兆的對應關係,可以如下表所示,矩陣中的 1 代表故障模式同故障徵兆具有關聯關係,即某種故障發生的時候,對應的故障徵兆(測試現象)會發生。例如矩陣中的第一行,表示「電源斷路故障"發生的時候,「電源電源異常」「控制計算機輸出信號異常」「控制器輸出信號異常」「電機轉角異常」這些現象均會發生:

如果將上圖用規則表述,可以用下面的方式做推理計算:

IF 控制計算機信號輸出異常

IF 控制器輸出信號異常

THEN 電機卡死

ELSE

THEN 控制器燒毀

ELSE

IF 電源電壓異常

THEN 晶片損壞 或者 接口線路斷路

(都是控制計算機故障,具體故障需要進一步分析,現有數據並不能確認)

ELSE

THEN 電源電路

這裡出現了一個新問題,如果裝備有上千個部件/元件,每個部件/元件有大量故障現象,按照上述的 IF/ELSE 模式進行規則推理的編寫會非常複雜,因此在推理時不會使用 IF/ELSE 方式進行推理。而是將這些部件和故障按上圖方式,形成一個非常大的相關矩陣,上圖矩陣中每一行都對應一個具體的故障模式,這樣就可以根據每一行的特徵,利用二值相關性模型進行快速定位故障,目前有專業的故障推理機從事這方面工作。如果沒有專業的故障推理機,對於簡單一些的情況,也可以使用代碼生成的方式生成上述的 IF/ELSE 推理程序。

(點擊圖片可放大)

上面介紹的推理過程可以看出,故障診斷場景下推理的關鍵是形成故障與部件之間的相關矩陣,而形成相關矩陣的過程,也就是故障知識圖譜建設的過程。下面我們介紹一下故障知識圖譜形成的過程,如何建模,如何抽取,如何驗證,以便對知識圖譜建設方法有個更加清晰的認識。

本文針對領域知識圖譜,建設方法以「自頂向下」為主,「自下而上」為輔,對於故障診斷這樣的場景,「自頂向下」的知識來自於裝備設計,也就是說在裝備的設計過程中,就可以確定裝備內部各部件的拓撲結構、故障類型、測試方式,讓故障診斷的知識圖譜成為裝備設計環節的一部分,也就是說知識的抽取是在設計階段進行的。當裝備投入使用後,新的故障出現在對設計階段形成的圖譜進行補充,可以認為是一個「自下而上」的方式。

既然在裝備設計過程中形成知識圖譜,就需要有一個描述裝備、故障、測試幾者之間關係的模型,這也是知識建模的重要內容:業界一般用「多信號流圖」的方式描述,如下圖的示例。

(點擊圖片可放大)

這個圖形中,把裝備的部件、每個部件的故障模式、部件之間的關係、每個部件的測試點以及輸入輸出情況,用圖形化的方式描述了出來。在裝備設計中完成相關「多信號流圖」的設計,就可以通過「多信號流圖」產生前面的故障診斷相關矩陣。除此之外「多信號流圖」還可以完成知識驗證的工作,例如裝備設計中測試的完備性,推理故障之間的關聯性,出現新故障知識是推理知識是否合理等等,是裝備設計的一個重要手段。「多信號流圖」提高了知識圖譜的建設工程化水平,讓設計者用更容易理解和操作的方式進行設計,同時它也是一個多方面知識融合的過程。

我相信絕大多數讀者並不從事裝備設計領域,因此沒必要深入了解「多信號流圖」,但這種圖形化模式的提出對知識圖譜建設非常有借鑑價值。對應到傳統信息化軟體的設計你會發現,UML就是一種圖形化的建模方式,類圖屬於軟體靜態關係的圖形化描述,時序圖、狀態圖、序列圖等等是軟體動態關係的圖形化描述,部署圖是軟體物理結構的圖形化描述,因此在知識建模過程中,可以考慮建立自有的圖形化描述,提高知識抽取的工程化能力。

下圖總結了採用知識圖譜建設方法論,進行裝備故障診斷時各個階段的主要工作,包括:

(點擊圖片可放大)

1、知識建模階段,對裝備、功能(控制、分離、引導、連接...)、輸入輸出(能量、物質、信號)等基本概念的抽象,以及利用「多信號流圖」進行圖形化描述(類似面向對象的 UML 方式);

2、知識抽取階段,可以在研發過程中設計裝備的「多信號流圖」,對於研發階段沒有進行這方面設計的可以從維修手冊中抽取。用多信號流圖可以產生故障樹與故障相關矩陣。

3、知識驗證階段,可以利用相關矩陣推斷新增加的知識是否有效,也可以驗證測試是否完備,例如兩個故障模式在故障矩陣中故障特徵是一致的,就可能需要增加測試點;

4、利用故障知識圖譜,可以在開發實時診斷的應用,利用推理機實時確定故障發生的部件,產生故障應急的預案等等。

感謝胡政博士為本文提供的案例,他曾是國防科技大學裝備綜合保障技術重點實驗室的核心成員,我國裝備保障領域的知名專家。他創辦的湖南擎新公司,專注於大型裝備的實時故障診斷、檢測技術的研究與實踐,完成了多項重大武器裝備的故障診斷知識圖譜的建設。

3

總 結

企業軟體從流程化開始起步,逐步實現數據化,今天我們希望它能夠更加智能化。而目前智能化還主要體現在圖像識別、語音識別的應用,究其原因是目前以機器學習為核心的技術並不能滿足很多場景,諸如缺少大量數據、結果不夠明確、需要明晰推理過程。而建立專業領域知識圖譜,正是將人工智慧應用從簡單應用轉向知識密集但數據缺少的複雜應用。

《老焦專欄 | 解開知識圖譜神秘的面紗》、《老焦專欄 | 知識圖譜建設方法論》,在這一系列的三篇文章醞釀了很長時間,借鑑了企業軟體流行的面向對象方法,提出了一個工程化實施知識圖譜建設的方法論,包括知識建模中的領域劃分、概念與關係建模,知識抽取的自動化、非自動化方法,最後列舉了知識圖譜的四種應用形式,並通過一個裝備故障監測的示例,講解了如何基於知識圖譜進行推理、如何在知識圖譜建模時類似 UML 的方式建立知識模型。

後面我們還會針對知識圖譜這一話題,進行持續的探討,敬請期待。

- The End -

相關焦點

  • 建立知識圖譜領域標準體系!張鈸院士、李涓子教授等共論知識圖譜
    「首批知識圖譜認證企業名單」發布為了總結梳理知識圖譜在各領域落地應用中的好經驗、好做法,電子標準院聯合聯想、華為等 32 家單位編寫了《認知智能時代:知識圖譜實踐案例集》及其速讀版,並在會上由張鈸院士和程多福副院長共同見證發布。
  • 知識圖譜構建的研究已走入下半場,但大規模落地應用仍需時間
    知識圖譜的一個重要特點就是可解釋性和發現新知識的能力,這是目前深度學習方法很難做到的。知識圖譜把領域知識或常識整理成結構化的形式,然後在此基礎上進行推理,類似於人腦的功能。比如評審專家的推薦,使用深度學習的方法進行訓練,專家的查找過程是個黑盒操作,無法追溯推薦的理由。
  • 如何構建知識圖譜?
    本文根據轉轉張青楠老師,在DataFun AI+ Talk中所分享的《二手電商知識圖譜構建以及在價格模型中的應用》編輯整理而成。一、知識圖譜概述這次的分享主要從以下四個部分:知識圖譜概述、知識圖譜構造、轉轉二手電商知識圖譜、在價格模型中的應用。
  • 老三觀天下:人物關係-知識圖譜
    一次偶然的機會,老三在360的搜索框內輸入了劉強東,竟然在網頁的右下部分發現了一個新鮮的東西-劉強東的關係圖譜,隨後便陸續輸入了馬雲、馬化騰、王健林等人的名字,除了馬化騰的未收錄,這幾個人的都有收錄,不過康熙、乾隆等人的都沒有收錄。
  • 衛健委舉行全民健康信息化應用發展典型案例情況新聞發布會
    原標題:國家衛生健康委員會2020年9月9日例行新聞發布會 介紹全民健康信息化應用發展典型案例有關情況  9月9日,國家衛生健康委員會召開例行新聞發布會,國家衛生健康委規劃司司長毛群安,國家衛生健康委人才中心黨委書記、主任張俊華,廣東省衛生健康委二級巡視員李建中,寧夏銀川市衛生健康委主任馬曉飛,北京市豐臺區方莊社區衛生服務中心副主任劉新穎介紹全民健康信息化應用發展典型案例有關情況
  • 物聯網融入智能交通 典型應用案例分析
    隨著技術的發展,物聯網的內涵不斷豐富,我國工業和信息化部電信研究院2011年對物聯網的定義為:物聯網是通信網和網際網路的拓展應用和網絡延伸,它利用感知技術與智能裝備對物理世界進行感知識別,通過網絡傳輸互聯,進行計算、處理和知識挖掘,實現人與物、物與物信息交互和無縫連結,達到對物理世界實時控制、精確管理和科學決策目的。
  • 2020年中國面向人工智慧「新基建」的知識圖譜行業白皮書
    白皮書從善政、惠民、興業、智融四個部分對知識圖譜技術在其他行業中的代表性應用場景進行梳理,對知識圖譜未來的發展和應用做出展望,同時對人工智慧「新基建」下,城市數位化、智慧化發展的創新場景進行展示。01善政城市治理知識圖譜應用場景:知識圖譜賦能城市智能公共管理系統,打造城市「數字大腦」環保知識圖譜應用場景:構建生態環境知識庫,形成統一環境數據標準
  • 本體和知識圖譜之間的區別是什麼?
    隨著語義應用程式成為業界越來越熱門的話題,客戶經常來EK詢問有關本體和知識圖譜的問題。具體來說,他們想知道兩者之間的區別。本體和知識圖譜是一回事嗎?它們有何不同?兩者之間是什麼關係?在這篇博客中,我將引導您了解本體和知識知識圖譜,講述它們之間的區別以及它們如何組織大量數據和信息。
  • 國內數據新聞研究的知識圖譜
    本文以知識圖譜分析軟體Citespace為分析工具,以數據新聞為主題,以CSSCI為來源類別進行高級檢索,在CNKI資料庫中選出290篇研究數據新聞的文獻(2012—2019年)並進行知識圖譜描繪,以期對我國數據新聞研究的軌跡和趨勢有一個清晰的認識。國內數據新聞研究現狀對數據新聞的研究由「熱」變「冷」。發文量是體現一個研究領域發展態勢的直觀數據。
  • 16個節能技術應用典型案例在京發布 助力綠色發展
    這是遠大能源利用管理有限公司總經理彭國平在企業項目入選國家節能中心重點節能技術應用典型案例(2019)後的介紹。而這也是該企業的技術連續第二年入選典型案例。中宏網記者 富宇 攝  10月16日,國家節能中心舉辦了重點節能技術應用典型案例(2019)首場發布推介服務活動,現場共發布16個重點節能技術應用典型案例。國家發展改革委環資司、國管局節能司等部門,入選典型案例技術企業所在的地方節能中心、相關行業協會、科研院所、典型案例技術和應用單位共150餘人參加了活動。
  • 魔圖互聯:知識圖譜推薦系統-給人們帶來更個性化的推薦
    首先是市場分析,第一,市場需求大,除了應用於推薦系統、輿情分析、文本檢測等應用。知識圖譜還可以應用於金融、零售、地產、電商等領域。第二,市場價值高,據聚合數據官方統計預估,未來五年將有30%的企業引入知識圖譜技術,並會這些企業節省10%的成本。
  • 含硫化氫尾氣制硫酸技術典型應用案例
    【中國環保在線 應用方案】為貫徹《中華人民共和國環境保護法》《中華人民共和國大氣汙染防治法》,推動大氣汙染防治領域技術進步,滿足汙染治理對先進技術的需求,生態環境部編制並發布了2018年《國家先進汙染防治技術目錄(大氣汙染防治領域)》(生態環境部公告2018年第76號)(簡稱《目錄》)。
  • 醫渡雲知識圖譜技術賦能臨床輔助決策
    本屆大會吸引眾多人工智慧、知識圖譜領域的專家出席,中國科學院數學與系統科學研究院研究員、中國科學院院士陸汝鈐院士,作為大會特邀嘉賓,在開幕式上發表了關於發展知識圖譜支撐平臺研究的主題報告,並在報告中回顧了學術界和企業界對知識圖譜支撐平臺的研究現狀。
  • 好看視頻將大力扶持泛知識創作者,打造全網首個視頻知識圖譜
    百度短視頻生態平臺總經理宋健表示:依託百度在知識信息服務上的技術與生態沉澱,好看視頻將結合用戶主動搜索、知識探索帶來的「主動流量」構建視頻知識圖譜,堅持做「Save time,為用戶解決問題」的短視頻平臺。同時,好看視頻還將通過三大舉措賦能泛知識類創作者,加碼優質創作生態構建。
  • 百望雲攜手清華五道口金融學院:構建產業鏈知識圖譜 把脈經濟動態
    過去一年多,百望雲與清華大學參股企業道口金科建立聯合研究實驗室,以百望雲海量中小企業服務資源優勢為基礎,憑藉雙方強大的行業研究能力,構建面向中國中小企業的產業鏈知識圖譜。  本次座談對前期企業產業鏈知識圖譜方向上的研究成果進行了回顧,包括疫情下全國復工復產分析報告、防疫物資供應鏈上下遊產業分析應用、百餘條產業鏈知識圖譜等研究成果,涵蓋醫療器械、醫療耗材、藥品、集成電路等產業,形成了規模龐大的產業鏈知識圖譜基礎設施。同時,雙方對合作成果下一步在政府、金融、產業網際網路等領域應用場景進行深入探討和展望。
  • 2020年中國智慧旅遊產業鏈上中下遊投資圖譜深度剖析(附典型案例...
    原標題:2020年中國智慧旅遊產業鏈上中下遊投資圖譜深度剖析(附典型案例名錄)   隨著全國疫情防控形勢持續趨向好,我國
  • ...走好網上群眾路線典型案例展示」優秀機構案例——陝西省總工會...
    由中央網信辦網絡評論工作局指導,中國網際網路發展基金會、人民網聯合開展的2020年度「網聚『政』能量 共築同心圓——各地走好網上群眾路線典型案例徵集展示活動」評選結果日前發布,經專家評審共160個案例獲選「各地走好網上群眾路線典型案例」。
  • 最高檢發布首批檢察改革典型案例
    新華網北京1月14日電(於子茹)最高人民檢察院日前以「推進執法司法制約監督機制建設」為主題發布全國檢察機關首批檢察改革典型案例。典型案例共7件,集中反映各地檢察機關在強化法律監督職能、健全內部制約監督制度機制等方面的經驗做法。
  • 知識圖譜從哪裡來:實體關係抽取的現狀與未來
    知識圖譜現有大型知識圖譜,諸如 Wikidata、Yago、DBpedia,富含海量世界知識,並以結構化形式存儲。如下圖所示,每個節點代表現實世界中的某個實體,它們的連邊上標記實體間的關係。這樣,美國作家馬克·吐溫的相關知識就以結構化的形式記錄下來。
  • 店場網布陣知識圖譜數據集對接雲大腦智能狗
    在大數據云計算人工智慧時代,已經捷足先登搶先定義了餐連網這一特定領域,已經佔領了餐飲O2O這一高頻剛需山頭領地,在餐飲O2O領域排兵布陣進行了大數據布局,進行了產業知識圖譜的設計構建。有了知識圖譜就可以大量複印衍生數據,積累形成數量巨多的大數據集。店場網為人工智慧提供的是體系化數據集,不是雜亂無章的數據堆,能夠讓專業人工智慧應用有針對性,不至於陷入老虎吃天無從下口的窘境。