6個方面分析:知識圖譜的價值和應用

2020-12-15 人人都是產品經理

知識對於人工智慧的價值就在於,讓機器具備認知能力和理解能力。構建知識圖譜這個過程的本質,就是讓機器形成認知能力,理解這個世界。

一、知識圖譜無處不在

說到人工智慧技術,人們首先會聯想到深度學習、機器學習技術;談到人工智慧應用,人們很可能會馬上想起語音助理、自動駕駛等等,各行各業都在研發底層技術和尋求AI場景,卻忽視了當下最時髦也很重要的AI技術:知識圖譜。

當我們進行搜索時,搜索結果右側的聯想,來自於知識圖譜技術的應用。我們幾乎每天都會接收到各種各樣的推薦信息,從新聞、購物到吃飯、娛樂。

個性化推薦作為一種信息過濾的重要手段,可以依據我們的習慣和愛好推薦合適的服務,也來自於知識圖譜技術的應用。搜索、地圖、個性化推薦、網際網路、風控、銀行……越來越多的應用場景,都越來越依賴知識圖譜。

二、知識圖譜與人工智慧的關係

知識圖譜用節點和關系所組成的圖譜,為真實世界的各個場景直觀地建模。通過不同知識的關聯性形成一個網狀的知識結構,對機器來說就是圖譜。

形成知識圖譜的過程本質是在建立認知、理解世界、理解應用的行業或者說領域。每個人都有自己的知識面,或者說知識結構,本質就是不同的知識圖譜。正是因為有獲取和形成知識的能力,人類才可以不斷進步。

知識圖譜對於人工智慧的重要價值在於,知識是人工智慧的基石。機器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動物也具備感知能力,甚至某些感知能力比人類更強,比如:狗的嗅覺。

而「認知語言是人區別於其他動物的能力,同時,知識也使人不斷地進步,不斷地凝練、傳承知識,是推動人不斷進步的重要基礎。」 知識對於人工智慧的價值就在於,讓機器具備認知能力。

而構建知識圖譜這個過程的本質,就是讓機器形成認知能力,去理解這個世界。

三、圖資料庫

知識圖譜的圖存儲在圖資料庫(Graph Database)中,圖資料庫以圖論為理論基礎,圖論中圖的基本元素是節點和邊,在圖資料庫中對應的就是節點和關係。用節點和關系所組成的圖,為真實世界直觀地建模,支持百億量級甚至千億量級規模的巨型圖的高效關係運算和複雜關係分析。

目前市面上較為流行的圖資料庫有:Neo4j、Orient DB、Titan、Flock DB、Allegro Graph等。不同於關係型資料庫,一修改便容易「牽一髮而動全身」圖資料庫可實現數據間的「互聯互通」,與傳統的關係型資料庫相比,圖資料庫更擅長建立複雜的關係網絡。

圖資料庫將原本沒有聯繫的數據連通,將離散的數據整合在一起,從而提供更有價值的決策支持。

四、知識圖譜的價值

知識圖譜用節點和關系所組成的圖譜,為真實世界的各個場景直觀地建模,運用「圖」這種基礎性、通用性的「語言」,「高保真」地表達這個多姿多彩世界的各種關係,並且非常直觀、自然、直接和高效,不需要中間過程的轉換和處理——這種中間過程的轉換和處理,往往把問題複雜化,或者遺漏掉很多有價值的信息。

在風控領域中,知識圖譜產品為精準揭露「欺詐環」、「窩案」、「中介造假」、「洗錢」和其他複雜的欺詐手法,提供了新的方法和工具。儘管沒有完美的反欺詐措施,但通過超越單個數據點並讓多個節點進行聯繫,仍能發現一些隱藏信息,找到欺詐者的漏洞,通常這些看似正常不過的聯繫(關係),常常被我們忽視,但又是最有價值的反欺詐線索和風險突破口。

儘管各個風險場景的業務風險不同,其欺詐方式也不同,但都有一個非常重要的共同點——欺詐依賴於信息不對稱和間接層,且它們可以通過知識圖譜的關聯分析被揭示出來,高級欺詐也難以「隱身」。

凡是有關係的地方都可以用到知識圖譜,事實上,知識圖譜已經成功俘獲了大量客戶,且客戶數量和應用領域還在不斷增長中,包括沃爾瑪、領英、阿迪達斯、惠普、FT金融時報等知名企業和機構。

目前知識圖譜產品的客戶行業,分類主要集中在:社交網絡、人力資源與招聘、金融、保險、零售、廣告、物流、通信、IT、製造業、傳媒、醫療、電子商務和物流等領域。在風控領域中,知識圖譜類產品主要應用於反欺詐、反洗錢、網際網路授信、保險欺詐、銀行欺詐、電商欺詐、項目審計作假、企業關係分析、罪犯追蹤等場景中。

那相比傳統數據存儲和計算方式,知識圖譜的優勢顯現在哪裡呢?

(1)關係的表達能力強

傳統資料庫通常通過表格、欄位等方式進行讀取,而關係的層級及表達方式多種多樣,且基於圖論和概率圖模型,可以處理複雜多樣的關聯分析,滿足企業各種角色關係的分析和管理需要。

(2)像人類思考一樣去做分析

基於知識圖譜的交互探索式分析,可以模擬人的思考過程去發現、求證、推理,業務人員自己就可以完成全部過程,不需要專業人員的協助。

(3)知識學習

利用交互式機器學習技術,支持根據推理、糾錯、標註等交互動作的學習功能,不斷沉澱知識邏輯和模型,提高系統智能性,將知識沉澱在企業內部,降低對經驗的依賴。

(4)高速反饋

圖式的數據存儲方式,相比傳統存儲方式,數據調取速度更快,圖庫可計算超過百萬潛在的實體的屬性分布,可實現秒級返回結果,真正實現人機互動的實時響應,讓用戶可以做到即時決策。

五、知識圖譜的主要技術

5.1 知識建模

知識建模,即為知識和數據進行抽象建模,主要包括以下5個步驟:

以節點為主體目標,實現對不同來源的數據進行映射與合併。(確定節點)利用屬性來表示不同數據源中針對節點的描述,形成對節點的全方位描述。(確定節點屬性、標籤)利用關係來描述各類抽象建模成節點的數據之間的關聯關係,從而支持關聯分析。(圖設計)通過節點連結技術,實現圍繞節點的多種類型數據的關聯存儲。(節點連結)使用事件機制描述客觀世界中動態發展,體現事件與節點間的關聯,並利用時序描述事件的發展狀況。(動態事件描述)

5.2 知識獲取

從不同來源、不同結構的數據中進行知識提取,形成知識存入到知識圖譜,這一過程我們稱為知識獲取。針對不同種類的數據,我們會利用不同的技術進行提取。

從結構化資料庫中獲取知識:D2R。

難點:複雜表數據的處理。

從連結數據中獲取知識:圖映射。

難點:數據對齊。

從半結構化(網站)數據中獲取知識:使用包裝器。

難點:方便的包裝器定義方法,包裝器自動生成、更新與維護。

從文本中獲取知識:信息抽取。

難點:結果的準確率與覆蓋率。

5.3 知識融合

如果知識圖譜的數據源來自不同數據結構的數據源,在系統已經從不同的數據源把不同結構的數據提取知識之後,接下來要做的是把它們融合成一個統一的知識圖譜,這時候需要用到知識融合的技術(如果知識圖譜的數據結構均為結構化數據,或某種單一模式的數據結構,則無需用到知識融合技術)。

知識融合主要分為數據模式層融合和數據層融合,分別用的技術如下:

數據模式層融合:概念合併、概念上下位關係合併、概念的屬性定義合併。數據層融合:節點合併、節點屬性融合、衝突檢測與解決(如某一節點的數據來源有:豆瓣短文、資料庫、網頁爬蟲等,需要將不同數據來源的同一節點進行數據層的融合)。

由於行業知識圖譜的數據模式通常採用自頂向下(由專家創建)和自底向上(從現有的行業標準轉化,從現有高質量數據源(如百科)轉化)結合的方式,在模式層基本都經過人工的校驗,保證了可靠性,因此,知識融合的關鍵任務在數據層的融合。

5.4 知識存儲

圖譜的數據存儲既需要完成基本的數據存儲,同時也要能支持上層的知識推理、知識快速查詢、圖實時計算等應用,因此需要存儲以下信息:三元組(由開始節點、關係、結束節點三個元素組成)知識的存儲、事件信息的存儲、時態信息的存儲、使用知識圖譜組織的數據的存儲。

其關鍵技術和難點就在於:

大規模三元組數據的存儲;知識圖譜組織的大數據的存儲;事件與時態信息的存儲;快速推理與圖計算的支持。

5.5 知識計算

知識計算主要是在知識圖譜中知識和數據的基礎上,通過各種算法,發現其中顯式的或隱含的知識、模式或規則等,知識計算的範疇非常大,這裡主要講三個方面:

圖挖掘計算:基於圖論的相關算法,實現對圖譜的探索和挖掘。本體推理:使用本體推理進行新知識發現或衝突檢測。基於規則的推理:使用規則引擎,編寫相應的業務規則,通過推理輔助業務決策。

5.6 圖挖掘和圖計算

知識圖譜之上的圖挖掘和計算主要分以下6類:

第一是圖遍歷,知識圖譜構建完之後可以理解為是一張很大的圖,怎麼去查詢遍歷這個圖,要根據圖的特點和應用的場景進行遍歷;第二是圖裡面經典的算法,如最短路徑;第三是路徑的探尋,即給定兩個實體或多個實體去發現他們之間的關係;第四是權威節點的分析,這在社交網絡分析中用的比較多;第五是族群分析;第六是相似節點的發現。

5.7 可視化技術

目前兩個比較常見的可視化工具是:D3.js和ECharts。

D3.js:全稱Data-Driven Documents,是一個用動態圖形顯示數據的JavaScript庫,一個數據可視化工具,它提供了各種簡單易用的函數,大大方便了數據可視化的工作。ECharts:是一款由百度前端技術部開發的,同樣基於Javascript的數據可視化圖標庫。它提供大量常用的數據可視化圖表,底層基於ZRender(一個全新的輕量級canvas類庫),創建了坐標系、圖例、提示、工具箱等基礎組件,並在此上構建出折線圖(區域圖)、柱狀圖(條狀圖)、散點圖(氣泡圖)、餅圖(環形圖)、K線圖、地圖、力導向布局圖以及和弦圖,同時支持任意維度的堆積和多圖表混合展現。

六、知識圖譜的應用

知識圖譜的應用場景很多,除了問答、搜索和個性化推薦外,在不同行業不同領域也有廣泛應用,以下列舉幾個目前比較常見的應用場景。

6.1 信用卡申請反欺詐圖譜

6.1.1 欺詐手法

銀行信用卡的申請欺詐包括個人欺詐、團夥欺詐、中介包裝、偽冒資料等,是指申請者使用本人身份或他人身份或編造、偽造虛假身份進行申請信用卡、申請貸款、透支欺詐等欺詐行為。

欺詐者一般會共用合法聯繫人的一部分信息,如電話號碼、聯繫地址、聯繫人手機號等,並通過它們的不同組合創建多個合成身份。比如:3個人僅通過共用電話和地址兩個信息,可以合成9個假名身份,每個合成身份假設有5個帳戶,總共約45個帳戶。假設每個帳戶的信用等級為20000元,那麼銀行的損失可能高達900000元。

由於擁有共用的信息,欺詐者通過這些信息構成欺詐環。

一開始,欺詐環中的帳戶使用正常,欺詐者會進行正常的購買、支付和還款行為,這種行為稱為「養卡」。「養卡」了一段時間後,信用額度會有所增加,隨著時間推移會增長到一個讓欺詐者相對「滿意」的額度。

突然有一天欺詐環「消失」了,環內成員都最大化地使用完信用額度後跑路了。

6.1.2 知識圖譜解決信用卡申請反欺詐問題

使用傳統的關係資料庫,來揭露欺詐環需要技術人員執行一系列的複雜連接和自連接,而且查詢構建起來非常複雜,查詢效率低、速度慢且成本高。

知識圖譜產品利用圖資料庫的天然優勢,直接將銀行欺詐環節可能涉及的所有有用的數據欄位:如申請號、帳戶、身份證、手機、地址、家庭電話、聯繫人、設備指紋等設計成圖譜的節點,定義好圖譜所需的所有節點和節點屬性後,定義兩兩節點間的關係。

如:申請號節點與設備指紋節點相連構成「申請設備」關係,人節點與地址節點相連構成「申請人地址」關係。

根據業務上設計好的圖譜進行建圖,建圖後,用戶可以直接在關聯圖譜平臺上,輸入某個節點值查詢節點的關聯信息,如:輸入某個黑手機號,看其關聯5層範圍內的涉及到的申請人信息,看該節點是否與其他節點關聯成欺詐環,看節點與歷史的黑節點間是否有過關聯等等。

用戶可藉助知識圖譜產品,在貸前防禦風險,貸中進行關聯分析找出可疑點,控制風險,貸後進行風險把關,讓損失降到最低。

6.2 企業知識圖譜

目前金融證券領域,應用主要側重於企業知識圖譜。企業數據包括:企業基礎數據、投資關係、任職關係、企業專利數據、企業招投標數據、企業招聘數據、企業訴訟數據、企業失信數據、企業新聞數據等。

利用知識圖譜融合以上企業數據,可以構建企業知識圖譜,並在企業知識圖譜之上利用圖譜的特性,針對金融業務場景有一系列的圖譜應用,舉例如下:

(1)企業風險評估

基於企業的基礎信息、投資關係、訴訟、失信等多維度關聯數據,利用圖計算等方法構建科學、嚴謹的企業風險評估體系,有效規避潛在的經營風險與資金風險。

(2)企業社交圖譜查詢

基於投資、任職、專利、招投標、涉訴關係以目標企業為核心向外層層擴散,形成一個網絡關係圖,直觀立體展現企業關聯。

(3)企業最終控制人查詢

基於股權投資關係尋找持股比例最大的股東,最終追溯至某自然人或國有資產管理部門。

(4)企業之間路徑發現

在基於股權、任職、專利、招投標、涉訴等關係形成的網絡關係中,查詢企業之間的最短關係路徑,衡量企業之間的聯繫密切度。

(5)初創企業融資發展歷程

基於企業知識圖譜中的投融資事件發生的時間順序,記錄企業的融資發展歷程。

(6)上市企業智能問答

用戶可以通過輸入自然語言問題,系統直接給出用戶想要的答案。

6.3 交易知識圖譜

金融交易知識圖譜在企業知識圖譜之上,增加交易客戶數據、客戶之間的關係數據以及交易行為數據等,利用圖挖掘技術,包括很多業務相關的規則,來分析實體與實體之間的關聯關係,最終形成金融領域的交易知識圖譜。

在銀行交易反欺詐方面,可以從從身份證,手機號、設備指紋、IP等多重維度對持卡人的歷史交易信息進行自動化關聯分析,關聯分析出可疑人員和可疑交易。

6.4 反洗錢知識圖譜

對於反洗錢或電信詐騙場景,知識圖譜可精準追蹤卡卡間的交易路徑,從源頭的帳戶/卡號/商戶等關聯至最後收款方,識別洗錢/套現路徑和可疑人員,並通過可疑人員的交易軌跡,層層關聯,分析得到更多可疑人員、帳戶、商戶或卡號等實體。

6.5 信貸/消費貸知識圖譜

對於網際網路信貸、消費貸、小額現金貸等場景,知識圖譜可從身份證、手機號、緊急聯繫人手機號、設備指紋、家庭地址、辦公地址、IP等多重維度對申請人的申請信息,進行自動化關聯分析,通過關係關係並結合規則,識別圖中異常信息,有效判別申請人信息真實性和可靠性。

6.6 內控知識圖譜

在內控場景的經典案例裡,中介人員通過製造或利用對方信息的不對稱,將企業存款從銀行偷偷轉移,在企業負責人不知情的情況下,中介已把企業存在銀行的全部存款轉移並消失不見。通過建立企業知識圖譜,可將信息實時互通,發現一些隱藏信息,尋找欺詐漏洞,找出資金流向。

相關焦點

  • 試驗知識圖譜分析
    、知識圖譜方面的應用研究。前言:知識圖譜是知識工程不斷發展衍生出的新一代知識工程技術,知識圖譜的概念最早是由谷歌在2012年正式提出,最初僅應用在智能搜索領域,目前已應用在多垂直領域,比如金融行業、醫療衛生、政府、能源與工業得到廣泛的應用。本期課程重點分為以下四個方面:試驗知識綜述、試驗知識圖譜分析、試驗知識圖譜構建技術和試驗知識圖譜技術展望。
  • 知識圖譜在小米的應用與探索
    通過引入知識圖譜,這些產品在內容理解、用戶理解、實體推薦等方面都有了顯著的效果提升。本文的主要內容包括:小米知識圖譜介紹:包括小米的商業模式、小米人工智慧部、知識圖譜在人工智慧部的定位、小米知識圖譜的發展歷程、以及小米知識圖譜的落地場景。小米知識圖譜關鍵技術:小米知識圖譜在成長過程中的技術積累。小米行業知識圖譜探索:結合業務,跟大家分享下小米在行業圖譜上的探索。
  • 鄒磊 | 知識圖譜的數據應用和研究動態
    因此實際的資料庫應用項目中就存在一個從概念模型到實現模型的轉換問題,例如如何根據ER圖來構建關係表。從這個角度來看,知識圖譜又不同於ER圖,因為知識圖譜不僅顯式地刻畫了實體和實體關係,而且其本身也定義了一種計算機所實現的數據模型。
  • 知識圖譜發展的難點&構建行業知識圖譜的重要性
    所謂知識,指的是點或邊對應的信息。知識圖譜以語義分析技術為基礎,以模型為核心,基於數據,利用深度神經網絡、NLP框架語義理解等智能處理技術對輸入的字、詞、篇章進行多層次、多維度的信息分析,提供可遠程調用的實體抽取、關係抽取和屬性抽取等算法服務接口能力。達到構建多領域知識圖譜平臺,服務不同行業和應用場景。
  • 產品經理的知識圖譜應用
    我們以李小龍為例,如果不用知識圖譜,用戶搜索「李小龍的兒子是誰」時,只能通過關鍵詞搜索的方式分析網頁中關鍵詞包含「李小龍」「兒子」等關鍵詞的網頁。通過知識圖譜的輔助,搜尋引擎通過背後的語義分析,返回更加精確,並且是結構化的數據。圖1.1-2李小龍的關係圖譜追本溯源知識圖譜起源於上世紀60年代的語義網絡。
  • 縱覽知識圖譜在AI領域的有效應用,2019知識圖譜前沿技術論壇即將開幕
    >知識圖譜的構建包括邏輯建模、隱含空間分析、人機互動和本體模型支撐等多種方法。我們分析各種構建方法的問題和挑戰,指出自動構建的要素和應用場景。  滴滴的出行知識圖譜是這些實體、屬性及行為的數位化表示。為了讓數據發揮更大的作用,我們構建並深入挖掘了大規模的領域知識圖譜,並依託這些圖數據構建各種不同場景的有效解決方案。本次報告敘述了領域知識圖譜在滴滴生態中的廣泛研究和應用,包括基於實體圖譜的圖計算、圖嵌入、知識融合等案例服務,以及業務知識圖譜中以智能對話機器人和信息推薦為代表的應用。
  • 基於知識圖譜的鄉村旅遊研究進展分析
    、應用數學、計算機科學等學科的理論與方法相結合,用可視化的技術來分析及展示數據之間的關係,將研究領域的發展歷程、研究現狀及整體知識框架以圖像的形式表達出來,尤其在對數量龐大的數據進行挖掘方面具有優勢,具體分析過程如圖1。
  • 知識圖譜深挖關係價值,海致星圖2年拿下25家金融大客戶
    海致星圖目前積累了客戶評價模型、營銷模型、風險模型共三類,超過100個業務模型,既可以用於對公業務,也可以用於零售業務,並且能做到開箱即用,直接對接銀行數據和系統,加快上線速度。最後,應用層直接對接現有金融機構業務系統,如風險預警系統、信貸管理系統等,是打通知識圖譜平臺和銀行自身業務流程的橋梁,使數據流和業務流融合,形成數據閉環,使算法在其中不斷得到優化。
  • 知識圖譜和問答系統
    信息抽取是個動詞,說的是過程。知識圖譜是這個動作的結果,存在庫裡。相當於我們以前的 IE Store,就是類似於關鍵詞索引一樣存取關係的庫。知識圖譜的名字與應用更近,更接地氣。因為IE作為基礎只是脫機處理,其結果才是聯機去幫助回答問題的。回到正題,知識圖譜與問答系統。問答系統需要IE的支持,我們很多年前就極力主張,幾篇 QA 的論文也是強調的這個。
  • 如何構建知識圖譜
    編輯導語:知識圖譜可以說是一個資料庫,在如今大數據時代,知識圖譜已經是企業中能夠起到很大作用的一個環節,可以提高工作效率等;本文作者分享了關於構建知識圖譜以及問題的解答,我們一起來看一下。知識圖譜作為大數據內容的搬運工,在知識算法和使用上,能夠放大組織沉澱數據應用價值;目前搜索巨頭、購物網站均已經通過應用知識網絡,實現了更深層次的「千人千面」。
  • 老焦專欄|一個典型的知識圖譜應用建設案例
    1知識圖譜的幾種典型應用方式基於知識圖譜的應用可以分為幾種典型的類型,這幾種應用使用的場景各有不同,在使用技術上也各有側重,我們希望能夠根據不同類型,總結出一些通用的場景,指導應用建設:1)知識推理類型就是通過已知的知識,推理出未知的知識,這在知識圖譜應用的建設中
  • 區塊鏈學堂|什麼是知識圖譜
    如果有需要的話,我們可以按照這個邏輯將所有電影信息整理成一張巨大的知識圖譜,方便信息的查詢和檢索。由此可見,知識圖譜為信息和數據的融合、統一、連結和復用提供了良好的框架,有助於提高信息數據的管理和分析效率。一方面知識圖藉助資源描述框架(RDF)清晰有效地呈現出數據結構、分類、詞彙表、元數據、參考信息和基本數據等各類數據和內容。
  • 一文讀懂知識圖譜的商業應用進程及技術背景
    通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關係網絡。知識圖譜提供了從「關係」的角度去分析問題的能力類似地,Alexa 也依託其早年收購的 True Knowledge 公司所積累的知識庫;Siri 則利用 DBpedia 和可計算的知識服務引擎 WolframAlpha;狗尾草公司推出的虛擬美少女機器人琥珀虛顏則用到了首個中文連結知識庫 Zhishi.me。伴隨著機器人和 IoT 設備的智能化浪潮,智能廚房、智能駕駛和智能家居等應用層出不窮。
  • 知識圖譜構建的研究已走入下半場,但大規模落地應用仍需時間
    認知圖譜主要有三方面創新,分別對應人類認知智能的三個方面: 1.(長期記憶)直接存儲帶索引的文本數據,使用信息檢索算法代替知識圖譜的顯式邊來訪問相關知識; 2. 對此問題,唐傑教授表示,工業級知識圖譜的應用,難點首先是知識的精準抽取與融合,多源異構數據的融合在實際應用場景中要複雜得多,而且數據質量也很難保證。可以根據各應用領域的特徵有針對性的建立抽取及融合模型,也可以結合一些預訓練模型進行分析。
  • 【乾貨】最全知識圖譜綜述#2: 構建技術與典型應用
    我們專知的技術基石之一正是知識圖譜-構建AI知識體系-專知主題知識樹簡介。下面我們特別整理了關於知識圖譜的技術全面綜述,涵蓋基本定義與架構、代表性知識圖譜庫、構建技術、開源庫和典型應用。主要基於的參考文獻來自[22]和[40], 本人(Quan)做了部分修整。昨天我們介紹了《知識圖譜的概念以及構建技術-知識提取、知識表示、知識融合》,今天介紹知識圖譜的知識推理和典型應用。
  • AI產品經理必修課:知識圖譜的入門與應用
    知識圖譜是AI的基礎功能,本篇文章筆者就知識圖譜是什麼?如何構建知識圖譜?怎麼應用?進行了討論分析,與大家分享。一、人工智慧時代已經來臨伴隨著全球智慧型手機銷量的首次下滑,移動網際網路已經不可避免地步入了下半場。
  • 實戰課堂丨大數據關係信息挖掘:知識圖譜應用案例分享
    負責聯想創投大數據機器智能產品和行業應用模型開發。擁有多年高性能計算、大數據、人工智慧行業經驗 。畢業於美國紐約州立大學,曾在IBM認知團隊任行業解決方案專家。榮之聯實戰課堂第4期的《解讀大數據分析:新技術,新實踐》主題沙龍上,聯想創投(香港)機器智能實驗室高級產品經理錢廣銳跟大家分享了《大數據關係信息挖掘:知識圖譜應用案例分享》。
  • 是時候該關注「知識圖譜」了!
    知識圖譜是表示關係的最有效的方式,提供了從「關係」的角度分析問題的能力,讓機器能夠像人一樣理解世界、獲取知識,進而做出決策和行動。在大數據的推動下,知識圖譜受到了業界和學術界的廣泛關注。自2012 年Google推出第一版知識圖譜軟體,相繼湧現出一大批面向不同領域和應用的知識圖譜,如Yago,DBpedia,MusicBrainz,PubMed等,為各類智能應用帶來了大量結構化知識。
  • 【知識圖譜】知識圖譜嵌入模型簡介
    由於在表達人類先驗知識上具有優良的特性,知識圖譜近年來在自然語言處理、問答系統、推薦系統等諸多領域取得了廣泛且成功的應用。知識圖譜嵌入 (Knowledge Graph Embedding) 是解決知識圖譜補全問題的重要方法之一,它通過將知識圖譜中的實體 (Entity) 和關係 (Relation) 嵌入到連續向量空間,從而在方便計算的同時保留知識圖譜中的結構信息。
  • 百分點認知智能實驗室:信息抽取在知識圖譜構建中的實踐與應用
    尤其是基於深度遷移學習,幫助構建法律百科詞條、公安文本知識圖譜等行業項目中,在實體抽取、關係抽取、事件抽取等方面都取得了理想的實踐效果。本文將從概念辨析、技術路徑、實踐總結,由虛到實、由淺入深引導大家理性看待知識圖譜技術的能與不能,以更好地在實踐中運籌帷幄。