聊天機器人對知識圖譜有哪些特殊的需求?

2021-02-11 DataFunTalk

1.聊天機器人需要更個性化的知識圖譜

對聊天機器人來說,除了需要實體知識圖譜和興趣知識圖譜等開放領域稀疏大圖,還需要針對機器人和用戶的個性化稠密小圖。機器人或Agent需要相應的知識圖譜來建模並展示自我認知能力,而用戶知識圖譜則可以被看作更精細化和個性化的用戶畫像知識表現。圖1對比了開放領域稀疏大圖和描述機器人屬性及用戶屬性的個性化稠密小圖的知識圖譜。

圖1  開放領域稀疏大圖與個性化稠密小圖的對比

機器人「琥珀·虛顏」,有自身的情感狀態、喜好、技能等知識維度,而用戶則需要表達其職業狀態和生活軌跡等信息。需要強調的是,無論是個性化小圖還是開放領域大圖,都不是獨立存在的,在實際工程應用時需要將它們融合在一起才能發揮更大的價值。例如,機器人喜歡的明星需要和實體知識圖譜中的明星娛樂圖譜關聯;同樣,機器人的愛好需要與興趣圖譜關聯;機器人需要與用戶形成親人、好友、僱傭等社會關係。

2.聊天機器人不僅需要靜態知識圖譜,還需要動態知識圖譜

若一個聊天機器人想要更像人,就需要從早到晚做不同的事情,也就是需要有自己的生活規律,研發時又該如何刻畫這個聊天機器人的生活軌跡呢?例如,圖2所示的聊天機器人自身的生活規律和用戶的實時狀態,應該如何刻畫?

圖2  聊天機器人自身的生活規律和用戶的實時狀態

顯然,想讓聊天機器人有生活規律,就需要在研發過程中在圖譜中體現時態知識。另外,聊天機器人作為用戶的個人助理,需要記住用戶圖譜——各種用戶已經發生、正在發生或即將發生的事件。知識圖譜中的用戶行程不僅是一個關係或屬性,還是一個由多元(N-ary)數據組成的事件。為了表示用戶行程,研發過程中需要定義多種事件類型,並在時間和空間兩個維度上對用戶的各種動態進行刻畫。

3.聊天機器人不僅需要表達客觀知識的知識圖譜,還需要可以刻畫主觀情感的知識圖譜

聊天機器人不能只是冷冰冰地回答用戶的問題或幫助用戶完成特定功能,它需要感知用戶的情感並在輸出答案回復的同時體現出相應的情感,這樣擬人化程度才更高。圖3所示為聊天機器人在與用戶交互的過程中,根據感知到的用戶情感狀態,與用戶進行交互的示例。

已有的知識圖譜大多是客觀的,即用於描述一些客觀的事實。如何使聊天機器人結合個性化圖譜,儘量形成一些主觀認知,進而刻畫機器人或用戶的情感元素呢?例如,用戶說「我心情不好」這屬於閒聊中的情感表達範疇,需要機器人將用戶當前的心情狀態更新到用戶知識圖譜的對應維度數值中。相應地,機器人也會有自己的心情、體力,甚至和用戶之間的好感度關聯。當機器人心情不錯,同時和用戶很親密時,它就會主動關心用戶。結合機器人和用戶情感因素的動態回復會更加溫馨且貼合場景。另外,在多輪對話時,當用戶說「來一首快樂的歌吧」時,需要進一步結合音樂知識的知識圖譜(快樂作為歌曲的曲風或風格標籤)和用戶知識圖譜中的音樂偏好,推薦符合用戶喜好的歌。

圖3  聊天機器人與用戶進行交互的示例

4.聊天機器人為了完成用戶要求需要對接外部服務或開放API

此時,要將傳統的關係型知識圖譜(刻畫二元關係)擴展到支持動態服務的動態圖譜(刻畫多元關係,事件屬於服務圖譜的一個特例)。同時,如何刻畫服務之間的各種關係(如因果、時序依賴等)也是圖譜擴展過程中需要考慮的。例如,完成訂餐後,會有很多後續(follow-up)服務(訂花或預約車等)可供消費。建立這些服務之間的關聯對進行精準的多輪對話過程中的場景切換是非常必要的,圖4所示為一個案例。

圖4  聊天機器人需要對接外部服務或開放API

5.聊天機器人不僅需要純文本的知識圖譜,還需要包含多媒體知識的知識圖譜

人類不僅把文字作為接觸世界的手段,還會結合圖像、語音和文字等多模態來了解外部世界。因此,在研發聊天機器人時所構建的知識圖譜也應該從單純文本自然擴展到多媒體知識圖譜。史丹福大學李飛飛教授創辦的ImageNet和Visual Genome正是在這方面進行努力的典範。對於用戶圖譜這樣更新頻度非常高且很稠密的知識圖譜,多媒體知識的引入能幫助聊天機器人從更多的維度了解用戶,並提供諸如Visual QA等潛在的問答服務。例如,小明正在和聊天機器人進行交互,聊天機器人通過自身搭載的攝像頭識別出當前交互的用戶是小明,然後根據小明的圖像與用戶ID的關聯,進一步得到自身保存的與小明相關的長短時記憶,了解到他將在4月20日~23日去南京出差,而4月24日要和小蘭共進晚餐。此時,通過用戶知識圖譜中的社交關係了解到小蘭是小明的女友。當聊天機器人需要進一步了解小蘭長什麼樣時,或者當小蘭出現在聊天機器人面前時,聊天機器人需要認出小蘭,這時就需要用到包含多媒體知識的知識圖譜。圖5是對上述描述的可視化說明。

總而言之,聊天機器人需要基於多源、異構的數據構建包含多類別且體現動態和個性化的知識圖譜。這其中包括基於來自網際網路的數據刻畫世界知識、基於用戶數據刻畫用戶畫像知識、針對機器人的各種基本屬性、社會關係、情感狀態、興趣愛好、日常生活等靜態和動態知識得到的融合圖譜,它是時空坐標中針對特定交互場景和時間節點的一個鏡像,圖6所示為一個案例。

圖5  聊天機器人需要包含多媒體知識的知識圖譜

圖6  聊天機器人需要基於多源、異構的數據構建包含多類別且體現動態和個性化的知識圖譜

根據聊天機器人所屬領域的自然語言理解具體技術的需要,建立知識圖譜後,使用分詞、實體識別與消歧等技術,將用戶輸入的自然語言中包含的實體與知識圖譜中的實體進行連結,使機器人可以理解用戶輸入的自然語言中包含的意圖,從而從知識圖譜中抽取合適的內容對用戶輸入進行回復。

6. 福利活動

小編今天為大家準備了王昊奮、邵浩等老師的新書:《自然語言處理實踐:聊天機器人技術原理與應用》,即日起截至3月22日(下周五)中午12:00,歡迎大家在本文留言區留言點讚人數最多的6名同學,將獲得這本新書哦!我們將在3月25日公布獲獎結果,大家快快來參與吧!

下面帶大家來了解下這本新書:

書名:《自然語言處理實踐:聊天機器人技術原理與應用》

作者:王昊奮  邵浩  等

出版日期:2019年3月

內容介紹

聊天機器人作為人工智慧技術的殺手級應用,發展得如火如荼,各種智能硬體層出不窮。本書系統地闡述了聊天機器人的分類和關鍵技術,不僅給出了實際案例,還展望了聊天機器人在通往更智能化、更人性化、更趣味化的道路上所面臨的挑戰。同時,針對聊天機器人在從感知智能到認知智能的跨越中所面臨的難題,本書著重討論了知識圖譜和深度學習技術在自然語言處理、問答、推理、服務融合等方面的應用。

本書適合有志於從事人工智慧行業,以及想了解聊天機器人到底是什麼的讀者閱讀。

等不及的小夥伴,可以自己先行購買呦~

京東自營連結(也可點擊文末閱讀原文直接購買)

https://item.jd.com/12539314.html

相關焦點

  • 基於知識圖譜的智能問答
    在問答形式上可以分為單輪問答、多輪以及聊天式的情感互動,其中單輪問答相對簡單,多輪問答以及情感互動還處於較為初級的發展階段。對於問答系統的實現方式也有多種,對技術需求也不盡相同,要根據具體的需求具體規劃。
  • 聊天機器人太傻了?或許是你沒有找到正確打開方式
    在聊天機器人中使用知識圖譜,我們的期望是能夠解決很多複雜的推理問題,包括常識推理問題。比如說「雞蛋放到籃子裡,是雞蛋大還是籃子大」,「蘇大強的大兒子是誰」等等。從而使得聊天機器人的對話更加具有「智慧」,不僅能記憶,還能推理、聯想和推薦,從感知層面真正跨越到認知層面。願望是美好的,但真正將知識圖譜落地卻鮮見成功案例。
  • 基於知識圖譜的人機對話系統|公開課筆記
    2012 年底,劉博士加入雲知聲 AI Labs,領導 NLP 團隊,全面負責自然語言理解和生成、人機對話系統、聊天機器人、知識圖譜、智慧醫療等方面的研發及管理工作。知性會話的主要特點有:一是跨領域,跨交互形式共享上下文,你可以看它的聊天和問答可以銜接在以前;二是它體現了領域專家的機器人定位,它對這些領域的知識非常了解,可以在聊天或者問答中體現出它掌握的領域知識。它有這方面的知識後,也可以主動發起一些對話。
  • 知識圖譜發展的難點&構建行業知識圖譜的重要性
    (實體),形成有向圖結構。下面介紹一下通用知識圖譜與行業知識圖譜構建的區別:通用知識圖譜以網際網路開放數據為基礎,如維基百科或社區眾包為主要來源,逐步擴大規模。以三元組事實型知識為主,較多的面向開放域的Web抽取,對知識抽取的質量有一定容忍度,以知識融合提升數據質量,應用領域主要在搜索和問答方面,對推理要求較低。
  • 知識圖譜與智能問答研討會將於北理工召開
    「北京理工大學大數據創新學習中心」有效地融合了高校資源和業界資源推出了Python、知識圖譜、機器學習等系列專題學習與研討活動,其中知識圖譜專題涉及了知識圖譜構建技術、知識圖譜應用、大規模知識圖譜數據存儲、知識圖譜與聊天機器人等主題,引起了北京地區廣大師生和業界人員的高度關注。
  • 入侵保險業,聊天機器人有招?
    保險業正在積極尋求AI領域相關技術賦能,這與保險行業數據數據密集型行業,且信息交互頻率高有一定關係。其中自2016年起,引入聊天機器人界面,國內國外保險業新老玩家都有不少涉足。保險業應用聊天機器人大家想到的往往僅是智能客服,事實上現今已不僅如此,且今天的智能客服也與昨日有別。這背後是風口推動還是剛需驅動,都有哪些不同玩法?
  • 產品經理的知識圖譜應用
    對知識圖譜也一樣,我們要明確出來儲存哪些實體,建立哪些關係,哪些是屬性,屬性值是什麼。當你打算構建一個知識圖譜,僅僅只靠技術人員去構建是不夠的,需要產品經理做出業務定義,理解業務所需要的圖譜數據,指明圖譜中哪些是實體,哪些是屬性,實體間有什麼樣的關係,這些都是要由產品經理定義好的。並且在建設圖譜來看,需要產品經理與技術人員之間更加深入的交流與配合,更加要求產品懂得技術的應用流程。
  • 這周日,北理工將邀數位大咖研討「知識圖譜與智能問答」
    在過去幾個月中,其有效地融合了高校資源和業界資源推出了Python、知識圖譜、機器學習等系列專題學習與研討活動,其中知識圖譜專題涉及了知識圖譜構建技術、知識圖譜應用、大規模知識圖譜數據存儲、知識圖譜與聊天機器人等主題,引起了北京地區廣大師生和業界人員的高度關注。
  • Jure Leskovec等頂尖學者傾情授課,斯坦福知識圖譜課程完結
    機器之心報導參與:杜偉、魔王斯坦福知識圖譜春季課程視頻上線 B 站,領域內頂尖學者和業界大牛傾情授課,對知識圖譜感興趣的小夥伴趕緊去觀看吧!從 Google 搜索,到聊天機器人、大數據風控、證券投資、智能醫療、自適應教育、推薦系統,這些應用無一不跟知識圖譜相關。知識圖譜在技術領域的熱度也在逐漸上升。
  • 客服機器人應用效果分析|Chatopera 讓聊天機器人上線
    聊天機器人的應用效果  多年前,我們曾暢想聊天機器人在企業裡的應用,2020年,時光如梭,現在企業大量使用機器人客服、外呼機器人和內部智能問答知識庫;知識圖譜和深度學習等加快在企業軟體中應用,可以說,聊天機器人的市場在快速成長。  那麼市場成長的速度究竟怎麼樣?
  • 縱覽知識圖譜在AI領域的有效應用,2019知識圖譜前沿技術論壇即將開幕
    為提升行業人員準確界定知識圖譜應用場景需求能力,提高知識圖譜技術的行業普及程度,進一步推進知識圖譜技術人工在智能領域的有效應用,北京理工大學與復旦大學再次聯手,發起2019年「知識圖譜前沿技術論壇」。本論壇不收取任何費用,旨在提供學界與業界的充分交流平臺,歡迎各界人士蒞臨本論壇。
  • 一文讀懂知識圖譜的商業應用進程及技術背景
    KG應用篇在知識圖譜應用這一塊我shi會通過介紹名人知識圖譜的聚類、知識圖譜在搜尋引擎、聊天機器人、金融科技領域等的商業應用。近年來,隨著人工智慧的再次興起,知識圖譜又被廣泛的應用於聊天機器人和問答系統中,用於輔助深度理解人類的語言和支持推理,並提升人機問答的用戶體驗等。
  • 技術動態 | 人工智慧開源軟體發展現狀連載——知識圖譜開源軟體
    知識圖譜 (Knowledge Graph)是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。在知識圖譜裡,每個節點表示現實世界中存在的「實體」,每條邊為實體與實體之間的「關係」,實體和關係又有其自身的「屬性」。實體、關係和屬性構成知識圖譜的核心三要素。知識圖譜本質上是語義網絡(Semantic Network)。
  • 對話機器人技術簡介:問答系統、對話系統與聊天機器人
    例如我們的問答系統就想回答關於國家與城市的問題,那麼我們可以假設自己已經有了很多關於國家、城市、國家與城市之間關係的知識。知識圖譜建模與查詢「有數據」的問答系統是指,例如你有一堆可以查詢的知識。一般來說很多問題是在其他領域工作中,已經有了類似數據的積累。或者是利用別人收集的數據,例如一些開放的中文知識圖譜,例如英文世界的freebase。還有或者就自己嘗試製造這樣的數據,例如從維基百科、從百度百科中獲取。或者……發揮想像力。
  • 知識圖譜:知識圖譜賦能企業數位化轉型 | AI 研習社職播間第 3 期
    大概介紹一下我們公司招聘的職位,因為我們主要做知識圖譜,所以主要招聘開發知識圖譜、人工智慧平臺及行業應用產品的工程師,但我們並不要求必須有知識圖譜經驗的工程師,只要求有工程應用開發經驗的工程師即可。職位主要有:資深 Java 工程師:我們的知識圖譜平臺主要是 Java 的平臺,因此我們主要招聘資深 Java 工程師,要求 3-5 年工作經驗,本科及以上學歷 。
  • AI產品經理必修課:知識圖譜的入門與應用
    信息是雜亂無章的點,而知識相對來說更有邏輯性。在當今這個信息爆炸的時代,知識對人們來說顯然更便於理解和記憶。圖一,圖片出處:https://www.siilo.com/blog/information-vs-knowledge2. 什麼是知識圖譜?
  • 業界| 用知識圖譜+NLP,海知智能努力讓機器人的開發像發微信一樣簡單
    機器之心原創參與:王藝、藤子海知智能專注於知識圖譜和NLP技術中的語義理解,推出了第三方機器人技能插件開放平臺「魔戒」、用於知識圖譜的生產及應用的智能分析員「水晶球」和知識圖譜生產線「聚寶盆」。其NLP技術客戶包括小米、海爾、平安、新華社,以及度秘 DuerOS、思必馳 DUI 平臺等對話式人工智慧系統。
  • 如何構建知識圖譜?
    1.2 知識圖譜的基本組成在電商的知識圖中,包括用戶、商家、商品,他們帶有各自的屬性,彼此之間又互相聯繫。知識圖譜的基本組成三要素:實體、屬性、關係。實體-關係-實體 三元組;實體-屬性-屬性值三元組,在電商的知識圖譜中,用戶和商品都是實體。在知識圖譜中,有一類特殊的實體叫做本體,也叫做概念或語義類。它是一些具共性的實體構成的集合。
  • 史上最大規模:這有一份1.4億的中文開源知識圖譜
    機器之心整理 參與:鄭麗慧、杜偉 知識圖譜是人工智慧新時代的產物,簡單地說知識圖譜就是通過關聯關係將知識組成網狀的結構,然後我們的人工智慧可以通過這個圖譜來認識其代表的這一個現實事件,這個事件可以是現實,也可以是虛構的。
  • 實戰課堂丨大數據關係信息挖掘:知識圖譜應用案例分享
    知識圖譜知識圖譜是是一種基於圖的數據結構,由節點和邊組成。在知識圖譜裡,每個節點表示現實世界中存在的實體,每條邊為實體與實體之間的關係。其中,點與點之間的關聯,舉一個比較簡單的例子,我晚上坐G10這趟火車從北京到上海,有可能建立起一些知識的實體。