究竟知識圖譜是什麼?它又與人工智慧有著怎樣的聯繫呢?

2020-11-29 電子發燒友

近年來,人工智慧技術(AI)一直是各行各業的討論焦點,與物聯網、分布式資料庫、5G、自然語言處理等等熱詞一同湧現在時代的浪潮前沿。然而,當各行各業關注於這些時代熱詞,探索研發新的AI場景時,卻常常忽視了最成熟也很重要的AI技術——知識圖譜。

或許你說不出知識圖譜的具體定義,但其實處於資訊時代的我們早已離不開它。當你打開百度,搜索某個字怎麼念,或者今年高考的高校錄取分數線,其結果的聯想就來自於知識圖譜的構建;當你打開淘寶或者今日頭條,其中按照你的興趣愛好定製的個性化推薦內容,背後也是知識圖譜在發揮作用……

而現在,網際網路巨頭們重新認識到在數據之上的知識的重要,紛紛在知識圖譜上暗暗較勁。

在百度新春內部演講中,李彥宏說,「知識圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個人工智慧當中非常基礎的構件,也是我們相對於其他任何一家公司的優勢所在。」在AI World 世界人工智慧大會上,百度副總裁、AI技術平臺體系(AIG)總負責人王海峰也避開萬眾矚目的眾多熱詞,將重心聚焦於知識圖譜上。

除了百度,谷歌、阿里、華為等玩家也在積極部署知識圖譜。谷歌將語音搜索、Google Assistant、Google Lens、Google Home諸多軟硬體產品均接入谷歌知識圖譜,以構建更大的知識網絡,阿里也利用自己的電商優勢捕獲海量數據形成更有效的用戶畫像併入自己的知識網絡,並聯合清華大學、中科院等機構組建高級知識圖譜研究團隊……

那究竟知識圖譜是什麼?它又與人工智慧有著怎樣的聯繫呢?

中文知識圖譜(Chinese Knowledge Graph) ,最早起源於Google Knowledge Graph。Knowledge Graph是在2012年由谷歌提出的,用於增強其搜尋引擎功能的知識庫。

知識圖譜本質上是一種語義網絡。其結點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關係。知識圖譜是一種結構化的語義知識庫,其基本組成單位是「實體-關係-實體」的三元組,以及實體及其相關屬性-值對,通過實體間的關係構成網狀的知識結構,每一個節點均為實體,實體具有屬性-值對,同時實體與實體之間通過關係相互連接,構成一個特定領域的知識網絡。

簡而言之,知識圖譜就是通過不同知識的關聯性而形成的網狀的知識結構。形成知識圖譜的過程實際上就是加工信息、建立認知、理解所應用的領域的過程。人類證實因為有了獲取知識、形成知識的能力才可以不斷進步;同樣,知識是人工智慧的基石,知識圖譜對於人工智慧的價值也正是在於它可以讓機器具備認知能力。

另外,知識對於AI的價值,王海峰的總結是,兩者結合可以正循環:「有了知識的人工智慧會變得更強大,可以做更多的事情。反過來,因為更強大的人工智慧,可以幫我們更好地從客觀世界中去挖掘、獲取和沉澱知識,這些知識和人工智慧系統形成正循環,兩者共同進步。」

更具體而言,知識圖譜可以說是AI應用行業的先決條件。目前,人工智慧已受到各行各業的關注,不只是BAT在戰略投資人工智慧,金融、汽車、零售、娛樂、製造等等行業都在積極擁抱人工智慧技術。然而,人工智慧要在行業中得到應用,首先必須要對行業建立起認知,只有真正理解了行業和場景,才能實現智能化。也就是說,只有建立了行業知識圖譜,才能給出行業AI方案。

例如在金融行業。眾所周知,金融是百度最先商用的AI場景,正如李彥宏曾說:「金融的數據化本質,加上業務規則清晰,使它成為人工智慧最佳的應用場景。」金融的知識相對垂直,因此也非常適合與知識圖譜技術結合。在五年前,百度就已將知識圖譜應用在股票領域,旗下產品股市通通過數據、信息與股票的關係,以及股票與股票之間的關係,在股票領域首創知識圖譜,實現智能選股。不只是百度金融(現度小滿)在應用知識圖譜,整個金融行業都在將知識圖譜應用在個人徵信、貸款風控、保險銷售、保險策劃、金融指數、反欺詐、客戶管理管理、智能客服等領域,出現了不少提供金融AI技術或者是金融知識圖譜服務的創業公司,百度金融(現度小滿)也一直在積極地推進智能金融科技的開放,包括金融知識圖譜的開放。

除了金融領域,諮詢也是知識圖譜應用的典型場景。

隨著內容創作進入自媒體時代,目前內容分發信息流日益流行,而信息流的基礎就是個性化推薦技術。要做好個性化推薦技術只需做好兩點:一個是理解用戶的閱讀興趣;另一個是理解資訊內容。然而兩點要做到都不容易,理解用戶的前提是足夠多的用戶興趣數據,理解內容的前提則是知識圖譜,平臺必須要有一定的「認知」才知道不同內容意味著什麼,適合哪些興趣的用戶,而不是簡單的關鍵詞匹配。

舉個例子,一個文章內容是馬雲最新演講解讀,是將其推薦給電商行業人士,還是希望獲得成功的年輕人,還是李彥宏等企業家們?每個人都可能感興趣,如何推薦就要結合對內容的認知,以及對用戶興趣以及當前場景的理解,這時知識圖譜就派上用場了。特別是在視頻領域,要理解內容不是靠文字識別,而是要靠機器視覺技術,對內容本身的理解難度更高,知識圖譜在這時則顯得更為重要。

現在,今日頭條、百度、一點資訊、搜狐、網易、企鵝、UC、微博等等都在做信息流。百度世界大會上宣布百度信息流月活超過6億,相比去年5月剛推出時日均閱讀量提升105倍,短視頻日均播放量提升169倍,這個成果,與知識圖譜的優勢密不可分。

王海峰在演講中也指出,「人工智慧與傳統產業融合的過程中,要想為這個行業提供更好的服務,就需要對這個行業進行定製化,要有行業知識,這時候就需要在通用知識圖譜的基礎上,有相應的行業知識圖譜,進而幫助這個行業提升生產力,幫助這些行業、產業升級。」

從王海峰的邏輯,我們窺見一條未來人工智慧走向應用的必經之路:

機器通過人工智慧技術與用戶的互動,從中獲取數據、優化算法,更重要的是構建和完善知識圖譜,認知和理解世界,進而服務於這個世界,讓人類的生活更加美好。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 知識圖譜如何打破人工智慧的認知天花板?
    來源 | AI前線 作者 | 劉暉 知識圖譜作為人工智慧的重要研究領域,其核心理念可追溯到第一次人工智慧浪潮。但直至進入人工智慧下半場,當具備能理解、會思考、可解釋等特徵的認知智能成為突破自身天花板的關鍵,知識圖譜才得以蓬勃發展。
  • ...曲線分析|gartner|知識圖譜|生成對抗網絡|intelligence|人工智慧
    人工智慧領域到底是越來越強大了?還是依舊比較「智障」呢?如果對比一下Gartner近三年的報告,就是一個比較有意思的事情了,有些技術逐漸落伍被淘汰了,有些技術依舊止步不前,也有些技術進步的速度非常之快。
  • 清華唐傑教授:認知圖譜是人工智慧的下一個瑰寶
    最後一個呢,一根草有幾個眼睛?一個眼睛。 可以看到,GPT-3 很聰明,可以生成所有的結果,這個結果是生成的,自動生成出來的,但是它有一個阿喀琉斯之踵,它其實沒有常識。 02 什麼是知識圖譜?
  • 2020年中國面向人工智慧「新基建」的知識圖譜行業白皮書
    新基建三大規劃領域中,兩大領域都直接提及人工智慧。新基建背景下,人工智慧將迎來新一輪快速發展。 當前人工智慧的發展仍然處於弱人工智慧的狀態,研究重心由感知智能過渡到認知智能。知識圖譜是一種用圖模型來描述知識和建模世界萬物之間關聯關係的大規模語義網絡,幫助機器實現理解、解釋和推理的能力,是認知智能的底層支撐。
  • 《人工智慧 知識圖譜 性能評估與測試規範》等兩項團體標準立項
    日前,由中國電子技術標準化研究院(以下簡稱「電子標準院」)向中國電子工業標準化技術協會提出的《人工智慧 知識圖譜 性能評估與測試規範》(項目號:CESA-2020-2-020)、《人工智慧 知識圖譜 分類分級規範》(項目號:CESA-2020-2-019)兩項團體標準正式獲批立項。
  • 白話知識圖譜及其在CMDB中的應用
    本文主要包含兩塊內容:1、對知識圖譜的基本概念和思想起源做一個簡單的介紹;2、知識圖譜對CMDB的啟發以及我們的實踐成果。閱讀時間約20分鐘1、什麼是知識圖譜你可以沒聽過知識圖譜,但一定聽過人工智慧。人工智慧可以簡單的分為兩大類:感知智能和認知智能。感知智能即視覺、聽覺、觸覺的感知能力。
  • 是時候該關注「知識圖譜」了!
    編者按隨著大數據、自然語言處理、人工智慧等技術的發展,知識圖譜成為近幾年的熱點技術,在生活服務、醫療輔助、金融風控等不同行業和領域,實現了眾多的智能化應用。知識圖譜是什麼通俗地講,知識圖譜就是將複雜的知識通過數據挖掘、信息處理、知識計量和圖形繪製等一系列方式,把所有不同種類的信息連接在一起得到的一個關係網絡。在知識圖譜裡,用節點表示現實世界中存在的「實體」,用邊示意實體與實體之間的「關係」。
  • 《青春豬頭少年》故事與量子力學有著怎樣聯繫?學術知識至關重要
    在這部作品中最長提及的是青春期症候群而用來形容和解答它的本質存在的學識理論竟然是量子力學。很多漫迷們看作品都是以劇情內容來觀看其中的元素及內容,而這部作品給漫迷帶來的體驗總有種要有較高的文化知識底蘊才能明白其中的道理。可還有大部分粉絲認為這部作品中所闡述的青春期症候群與量子力學壓根就沒有什麼關係,純粹屬於提升作品逼格混交在一起的胡說八道。
  • 6個方面分析:知識圖譜的價值和應用
    二、知識圖譜與人工智慧的關係知識圖譜用節點和關系所組成的圖譜,為真實世界的各個場景直觀地建模。通過不同知識的關聯性形成一個網狀的知識結構,對機器來說就是圖譜。形成知識圖譜的過程本質是在建立認知、理解世界、理解應用的行業或者說領域。每個人都有自己的知識面,或者說知識結構,本質就是不同的知識圖譜。
  • 實戰課堂丨大數據關係信息挖掘:知識圖譜應用案例分享
    聯想創投主要投資機器智能領域,比如深度學習、機器學習等前沿科技,目前人工智慧包括四個部分:機器學習,深度學習,語言處理,知識圖譜。今天跟大家分享幾個案例,包括我們的想法和經驗。最後結果是什麼呢?造一輛車需要不同的鋼材,首先要預測各種鋼的分布,預測每個階段每個季度,車場市場上,一輛車大概需要幾種材料,就能很好預測出某種高的需求,第一個預測鋼的需求,利用模型可以直接輸出,幫助公司預測未來各種實際需求,最後結果的預測準確度在90%以上。
  • 企業大數據挖掘:為員工構建職場知識圖譜
    這份體貼贏得了越來越多員工的信任和喜愛,目前在研究院中已經有 超過一半的會議 是由EDI來安排——是的,你沒猜錯,EDI是人工智慧。職場知識圖譜EDI為何如此聰明?一方面,EDI擁有精準的自然語言理解和對話能力;另一方面,利用深度學習和社交網絡融合等前沿技術,EDI為每個用戶構建了一張關於他們的職場知識圖譜。
  • 谷歌知識圖譜功能帶來的是什麼?
    知識圖譜的出現給他們的生存帶來了威脅,甚至對現存網際網路產業的商業模式造成了衝擊。可以預測,知識圖譜將導致一系列網站關門,而網站的減少又將造成網絡信息的流失。信息是網絡的基石,谷歌此舉究竟會帶來什麼呢?技術進步知識圖譜僅作為一項新功能,就已經收錄了約5億個詞條,信息量也已達到35億條,而且這個數據還在不斷地膨脹。
  • 2020 WAIC明略科技HAO圖譜Open API 吳信東深度解讀知識圖譜的自動...
    2020年7月11日,世界人工智慧大會WAIC·開發者日:開發·開源·社區主題論壇召開,全球有影響力的圖靈獎得主、頂級技術專家和開發者代表雲聚一堂,對當下人工智慧前沿理論技術和開發實踐進行深度解讀。數據圖譜不是知識圖譜吳信東認為,大多數情況下,我們所說的、所用到的圖譜並沒有後臺知識,只是數據圖譜,而不是知識圖譜。知識圖譜應該有三個組成部分,首先是概念,即圖譜的節點。概念跟概念之間是連接,是關係,即圖譜的邊。只有概念和關係還不夠,還需要背景知識解釋概念,和連接的語義。
  • 明略科技HAO圖譜Open API:開放企業級知識圖譜構建能力
    業內有一種聲音得到了大量認同:人工智慧的進一步發展與突破,需要從感知智能向認知智能的突破,知識圖譜能有效從數據中挖掘出知識,以更具可解釋性的 AI 指導人類在更多複雜場景中的智能決策和行動。7 月 11 日,在 2020 WAIC 世界人工智慧大會上,明略科技 HAO 圖譜,作為目前世界上第一個語音實時生成圖譜的企業級知識圖譜開發工具包,首次公開亮相,成功入圍了大會最高獎項 SAIL 獎(Super AI Leader)TOP30 的項目及 2020 年度 SAIL 榜單。
  • 究竟什麼是「人工智慧」?它和咋們老百姓有什麼關係?
    好的,我來簡單的解釋一下什麼是人工智慧。其實人工智慧離我們非常的近,你現在看的頭條就是傑出的人工智慧產品。是的,可能你一直以為頭條是一個新聞軟體,其實,頭條就是基於人工智慧推薦的新聞客戶端。那今日頭條這個人工智慧到底是怎麼回事呢?或這麼運行的?有一天,你在頭條問了一個問題「究竟什麼是「人工智慧」?
  • AI產品經理的入門必修課(4)——知識圖譜
    而在做這些內容時依賴的核心技術就是知識圖譜相關的技術。02 知識圖譜是什麼了解知識圖譜是什麼之前,先了解數據、信息、知識之間的關係。數據是指聲音、圖像、符號,通常指最原始的記錄,數據間彼此孤立,沒有經過加工和解釋。信息是指數據經過加工處理後,建立了某種聯繫或增加了某些屬性;信息可以經過加工和處理轉化為數據進行存儲,數據是信息的表現形式。
  • 本體和知識圖譜之間的區別是什麼?
    隨著語義應用程式成為業界越來越熱門的話題,客戶經常來EK詢問有關本體和知識圖譜的問題。具體來說,他們想知道兩者之間的區別。本體和知識圖譜是一回事嗎?它們有何不同?兩者之間是什麼關係?在這篇博客中,我將引導您了解本體和知識知識圖譜,講述它們之間的區別以及它們如何組織大量數據和信息。 什麼是本體?
  • 試驗知識圖譜分析
    、知識圖譜方面的應用研究。前言:知識圖譜是知識工程不斷發展衍生出的新一代知識工程技術,知識圖譜的概念最早是由谷歌在2012年正式提出,最初僅應用在智能搜索領域,目前已應用在多垂直領域,比如金融行業、醫療衛生、政府、能源與工業得到廣泛的應用。本期課程重點分為以下四個方面:試驗知識綜述、試驗知識圖譜分析、試驗知識圖譜構建技術和試驗知識圖譜技術展望。
  • 深度解析知識圖譜領域幾次發展的主要技術突破
    知識圖譜是人工智慧三大分支之一——符號主義——在新時期主要的落地技術方式。該技術雖然在 2012 年才得名,但它的歷史淵源,卻可以追溯到更早的語義網、描述邏輯、和專家系統。在該技術的的歷史演變中,多次出現發展瓶頸,也多次以工程的方式突破了這些瓶頸。
  • 需要知識的後深度學習時代,如何高效自動構建知識圖譜?
    知識圖譜可以做什麼?如何自動、高效地構建知識圖譜?前沿的知識圖譜自動構建技術有哪些?這篇文章將逐一解答這些問題。 日常生活中,我們經常遇到以下兩種信息展現方式: