這周日,北理工將邀數位大咖研討「知識圖譜與智能問答」

2020-12-11 雷鋒網

雷鋒網 AI科技評論按:9月10日,北京理工大學 大數據創新學習中心 將在北京理工大學召開「知識圖譜與智能問答研討會」,屆時將邀請學術界與知名業界的專家做主題報告和面對面的研討。

「北京理工大學大數據創新學習中心」於2016年12月成立,長期開展大數據挖掘的學習與交流活動。在過去幾個月中,其有效地融合了高校資源和業界資源推出了Python知識圖譜機器學習等系列專題學習與研討活動,其中知識圖譜專題涉及了知識圖譜構建技術、知識圖譜應用、大規模知識圖譜數據存儲、知識圖譜與聊天機器人等主題,引起了北京地區廣大師生和業界人員的高度關注。

報告專家

陳華鈞,浙江大學計算機科學與技術學院教授

陳華鈞教授為浙江大學計算機科學與技術學院教授、博導,主要研究方向為語義網際網路與知識圖譜、大數據、生物信息計算等。浙江省大數據智能計算重點實驗室副主任、中國中文信息學會理事/語言與知識計算專家委員會副主任、中國人工智慧學會知識工程與分布智能專委會委員等。在 IJCAI, WWW, AAAI/IAAI,ICDE, TKDE, Briefings in Bioinforamtics 等國際頂級會議或期刊上發表多篇論文,並曾獲國際語義網際網路會議 ISWC 最佳論文獎。作為主要參與者,獲得教育部技術發明一等獎、國家科技進步二等獎等獎勵。全國知識圖譜與語義計算大會CCKS2016 程序委員會主席,聯合創辦國際語義技術聯合會議 JIST 等。

漆桂林,東南大學教授

漆桂林教授為東南大學教授、博導,獲得「六大人才高峰」資助,中國中文信息學會語言與知識計算專業委員會副主任和中國科學技術情報學會知識組織專業委員會副主任,開放知識圖譜聯盟 openKG 的聯合創始人之一,新華社中國經濟信息社特約專家語義 Web 著名國際期刊 Journal of Web Semantics 的編委。曾任中國語義 Web 和 Web 科學大會主席、國際會議 JIST 程序委員會主席。指導學生在國際會議 ICTAI 獲得最佳學生論文獎。發表高水平學術論文 100 餘篇,出版專著一部。6 項專利獲得授權或者受理。先後承擔包括國家自然科學基金和歐洲第七框架項目Marie Curie IRSES在內的多項科研項目,並且承擔了華為、百度等企業項目,作為第二負責人參與了由科大訊飛牽頭的 863 課題「高考機器人」的一個子課題。在知識工程、大數據語義分析、知識圖譜等領域有將近 20 年的研究和產業化經驗。

閆峻,微軟亞洲研究院高級研究員

Dr Jun Yan graduated from Peking University in 2006 and then joinedMicrosoft Research Asia. He is currently research manager of Data Mining andEnterprise Intelligence Group. His research interests include Text Data Analysis,Knowledge Mining, Information Retrieval etc. He has more than 80 papers publishedin conferences and journals of related areas and has played as PC, senior PC ofconferences including SIGKDD, SIGIR, AAAI etc. He is currently deputy director ofMicrosoft-Peking University joint lab.

丁力,全球首款語義搜尋引擎 Swoogle 作者

丁力是海知智能CTO,聯合創始人,OpenKG 發起人之一,全球首款語義搜尋引擎 Swoogle 作者,美國開放政府數據 Data.gov 語義技術專家,國際語義網大會挑戰賽第二名。北京大學計算機系本科及碩士。UMBC 博士,斯坦福博士後,RPI 研究員。前高通研究院科學家。主要研究方向為語義搜索,知識圖譜政府數據公開,機器學習與中文自然語言處理等。發表上百篇論文,引用量過萬,Google H-index >30。

肖國輝,義大利博爾扎諾自由大學計算機學院助理教授

肖國輝現為義大利博爾扎諾自由大學計算機學院助理教授,北京大學應用數學本科、碩士,奧地利維也納工業大學計算機博士。目前他的主要研究領域包括知識表示與推理,數據集成,時空數據推理,專攻基於本體的數據訪問(OBDA)的理論和技術。並研究如何將這些技術和理論應用於實際的工業案例。目前為Ontop 研究團隊的負責人,主持 OBDA 技術的研究,開發和應用。Ontop 為當前最先進的 OBDA 系統,其研發主要依託於歐盟第 7 框架項目 Optique。發表論文50 餘篇,其中多篇發表在國際頂級學術會議及期刊。

王昊奮,OpenKG 發起人之一

王昊奮,上海瓦歌智能科技公司總經理,深圳狗尾草智能科技公司 CTO,OpenKG 發起人之一。在語義技術和圖數據管理方面有比較豐富的經驗和積累,共發表 75 餘篇高水平論文,其中包括 35 餘篇 CCF A 類和 B 類論文。作為技術負責人,他帶領團隊構建的語義搜索系統在十億三元組挑戰賽(Billion Triple Challenge)中獲得全球第 2 名的好成績;在著名的本體匹配競賽OAEI 的實體匹配任務中獲得全球第 1 名的好成績。他帶領團隊構建了第一份中文語義互聯知識庫 zhishi.me,被邀請參加 W3C 的 multilingual 研討會並做報告。他還帶領團隊參加了百度知識圖譜競賽獲得所有任務第一名的好成績。此外,他還長期作為 ISWC, WWW, AAAI 等國際頂級會議程序委員會委員。目前,王昊奮擔任 CCF YOCSEF 上海主席,中文信息學會語言與知識計算專委會副秘書長,中國計算機學會術語工作委員會執行委員等社會職位。

鄒磊博士,北大副教授

Lei Zou received his BS degree and Ph.D. degree in Computer Science atHuazhong University of Science and Technology (HUST) in 2003 and 2009,respectively. He received a CCF (China Computer Federation) Doctoral DissertationNomination Award in 2009 and won Second Class Prize of CCF Natural ScienceAward in 2014. Since September 2009, he joined Institute of Computer Science andTechnology (ICST) of Peking University (PKU) as a faculty member. He has been anassociate professor in PKU since August 2012. His recent research interests includegraph databases, knowledge graph, particularly in graph-based RDF data management. He has published more than 30 papers, including more than 20 papers published inreputed journals and major international conferences, such as SIGMOD, VLDB,ICDE, TODS, TKDE, VLDB Journal.Lei Zou’s research is supported byNSFC-Young Excellent Talent Project and National Key Research and DevelopmentProgram of China. His work has been cited by more than 1300 (Google ScholarCitation statistics).

鮑捷,中國中文信息學會語言與知識計算專委會委員

鮑捷博士有十餘年的人工智慧研究經驗,研究領域有神經網絡、知識表現與推理、語義網、機器學習、自然語言處理等。中國中文信息學會語言與知識計算專委會委員。歷任美國三星研發中心研究員,MIT 訪問研究員,BBN 訪問研究員,RPI 博士後,Iowa State Univ 博士,W3C Web 本體語言工作組成員,國際語義網會議 ISWC 組委會和程序委員會成員。

魏晨,圖靈機器人認知計算小組負責人

魏晨,圖靈機器人認知計算小組負責人。於 2012 年獲得碩士學位。碩士期間在數據挖掘領域發表了 2 篇會議論文,1 篇 ISF 期刊,Springer 書的一章,和 1 本書(在亞馬遜售賣)。曾經是美國政府特邀訪問學者,也曾在科英布拉大學做研究員。目前在圖靈機器人工作。研究興趣包括推薦系統,知識圖譜和文本挖掘。圖靈機器人公司是以語義理解為核心驅動力的人工智慧公司,致力於「讓機器理解世界」, 產品服務包括機器人開放平臺,機器人 OS 和場景方案。公司成立於2010 年,2013 年推出全球第一款中文人工智慧語音助手-蟲洞語音助手,累計4500 萬用戶量。2014 年推出開放人工智慧機器人平臺,至今已有 60 多萬合作夥伴和開發者。讓開發者和廠商能夠在 10 分鐘內創建專屬的聊天機器人。2015 年推出圖靈 OS。2016 年推出圖靈 OS 1.5。


報告內容

1、cnschema:開放中文知識圖譜的進展

丁力 ,9:40—10:20

報告內容:cnSchema.org 是一個基於社區維護的開放的知識圖譜 Schema 標準。cnSchema 的詞彙集包括了上千種概念分類(classes)、數據類型(data types)、屬性(propertities)和關係(relations)等常用概念定義,以支持知識圖譜數據的通用性、復用性和流動性。結合中文的特點,我們復用、連接並擴展了 Schema.org,Wikidata,Wikipedia 等已有的知識圖譜 Schema 標準,為中文領域的開放知識圖譜、聊天機器人、搜尋引擎優化等提供可供參考和擴展的數據描述和接口定義標準。通過cnSchema, 開發者也可以快速對接上百萬基於 Schema.org 定義的網站,以及 Bot的知識圖譜數據 API。本報告描述了我們遇到的挑戰和工作方向,給出了案例分析和發展路徑。最後介紹了 schema 目前完成/在研的若干志願者任務。

2、虛擬化知識圖譜的關鍵技術和應用

肖國輝,10:20—10:40
報告內容:基於本體的數據訪問技術(ontology-based data access,OBDA)可以將現有的資料庫虛擬化為知識圖譜。虛擬化的知識圖譜通過提供了一種高層次的查詢接口,使得最終用戶不需關心底層的數據存儲和組織。此技術的核心為查詢重寫,可以重用現有的資料庫的功能。本報告首先將介紹 OBDA 技術的基本知識。然後講解 Ontop 系統怎樣實現知識圖譜虛擬化。最後,我們討論知識圖譜虛擬化技術在石油、能源、醫療、考古、測繪、海事安全、電子商務等領域的具體應用案例和前景。

3、聊天機器人產業化落地的思考和實踐

王昊奮,10:50—11:30

報告內容:近年來,聊天機器人作為 AI 技術的殺手級應用,發展得如火如荼,各種智能硬體層出不窮。本次演講將系統地闡述聊天機器人的分類和關鍵技術,並分析 Apple Siri、IBM Watson、Google Allo、Facebook Messenger 和 Amazon Echo等典型代表的優缺點,並第一次給出聊天機器人行業的技術面面觀。在此基礎上,將展望聊天機器人通往更智能化、更人性化、更趣味化的道路上所面臨的挑戰,並聚焦到知識圖譜技術在問答、推理和服務融合等方面的機遇和挑戰。

4、OpenKG 與 cnSchema

陳華鈞,11:30—12:10

報告內容:OpenKG 旨在促進知識圖譜數據的開放與互聯,促進知識圖譜與語義技術的廣泛應用與普及,本報告概要介紹了開放知識圖譜 OpenKG 的一些正在開展的工作,這包括開放圖譜資源庫、連結的開放中文百科知識圖譜、開放知識圖譜的 Schema——cnSchema。並結合 cnSchema 的一些工作,介紹了知識圖譜在智能搜索及問答領域的潛在應用場景。

5、佛學和農業知識圖譜構建及問答系統介紹

漆桂林,13:30—14:10

報告內容本報告中,我們首先介紹佛學和農業知識圖譜構建的相關技術,包括如何從百科中抽取領域相關的知識,以及然後對百科中缺失的數據進行補全;其次,我們將介紹佛學和農業知識圖譜問答的相關技術,並做系統演示。

6、Knowledge Learning for Question Answering in Healthcare Domain

閆峻,14:10—14:50
報告內容:In this talk, we will mainly introduce an application of knowledge miningand natural language processing in healthcare domain, including bi-directionknowledge graph construction, knowledge explicit representation by synonymlearning and question retrieval with knowledge data with application scenarios.

7、Natural Language Question Answering over Knowledge Graph

鄒磊,15:00—15:40

報告內容:AS more and more structured data become available on the web, thequestion of how end users can access this body ofknowledge becomes of crucialimportance. As a de facto standard of a knowledge base, RDF (Resource DescriptionFramework)repository is a collection of triples, denoted as <subject, predicate,object>. Although SPARQL is a standard way to access RDF data, it remains tediousand difficult for end users because of the complexity of the SPARQL syntax and theRDF schema. An ideal system should allow end users to profit from the expressivepower of Semantic Web standards (such as RDF and SPARQLs) while at the sametime hiding their complexity behind an intuitive and easy-to-use interface. In this talk, I first review two categories of existing methods on natural language questionanswering (Q/A) over RDF knowledge graph---one is IR (InformationRetrieval)-based and the other one is called semantic parsing method. Then, I will talkabout our RDF Q/A system (gAnswer), which is based on graph matching-basedtechnique. The most challenge to RDF Q/A task is the ambiguity of natural languagequestion sentence. The contribution of our method is that we combine thedisambiguation and query evaluation in a uniform process, i.e., we push down thedisambiguation into the query evaluation stage. Based on the queryresults over RDFgraphs, we can address the ambiguity issue efficiently. gAnswer joined QALD-6knowledge graph Q/A competition (hosted by ESWC) and it won the second place inthe Q/A precision. We host an online demo of our system atganswer.gstore-pku.com.

8、精益地構造問答系統

鮑捷,15:40—16:20
報告內容:問答系統是一種複雜系統,難以一次性整體構造,也不存在單一算法的解決方案。端到端的訓練算法在現實落地中經常會遇到困難。本次講座探討如何精益地構造問答系統,即如何循序漸進的從簡單到複雜,去「生長」一個問答系統。

9、如何搭建 Chatbot 以及聊天機器人理論框架

魏晨,16:20—17:00

報告內容:隨著人工智慧的高潮,聊天機器人漸漸引起了人們的青睞。如何快速的搭建一個聊天機器人,其背後的主要技術是什麼。在搭建的過程中,需要借鑑怎樣的理論框架。圖靈機器人將會進行分享。


活動信息

本次活動面向北京理工大學師生、北京地區高校師生及科研機構免費開放提供茶歇,參會人員食宿與交通費用自理。

時間:2017年9月10日(周日) 9:00—17:30

地點:北京理工大學(中關村校區) 研究生院  101報告廳

報名方式:點擊這裡(雷鋒網註:由於座位有限,人數規模將控制在150人左右)

主辦方:北京理工大學大數據創新學習中心

協辦方:雪晴數據網,北京友萬信息科技有限公司

合作媒體:雷鋒網(公眾號:雷鋒網)

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 知識圖譜與智能問答研討會將於北理工召開
    「北京理工大學大數據創新學習中心」有效地融合了高校資源和業界資源推出了Python、知識圖譜、機器學習等系列專題學習與研討活動,其中知識圖譜專題涉及了知識圖譜構建技術、知識圖譜應用、大規模知識圖譜數據存儲、知識圖譜與聊天機器人等主題,引起了北京地區廣大師生和業界人員的高度關注。
  • 基於知識圖譜的智能問答
    基於知識圖譜的相關應用大致可以分為搜索、問答、決策、推薦等幾種常見的類別,對於知識圖譜的理解,可以參考之前的文章《三個角度理解知識圖譜》,本文主要就年初規劃的
  • 百分點認知智能實驗室:基於知識圖譜的問答技術和實踐
    編者按:隨著網際網路軟硬體相關技術的飛速發展,人們逐漸從資訊時代進入智能時代。知識圖譜作為承載底層海量知識並支持上層智能應用的重要載體,在智能時代中扮演了極其重要的角色。而利用知識圖譜支撐上層應用仍存在諸多挑戰,因此基於知識圖譜的自然語言問答展開研究是十分有必要的。
  • 明略數據基於知識圖譜的問答系統淺析
    人類傾向於使用多樣化、非結構化的表達來描述問題和知識,而計算機則偏愛唯一化、結構化的知識。問答系統的研究,直接作用於縮短和跨越這一語義鴻溝,將多樣而模糊的問題語義,映射到具體而唯一的計算機知識庫中。優秀的問答系統有兩個關鍵點:精確的問題理解和高質量的知識來源。近年來隨著大數據的發展,這兩點紛紛迎來了數據層面的發展契機。
  • 知識圖譜和問答系統
    這種情形下,這個用圖譜來支持問答的技術就應該可以開花結果的。當然這一切就是一個時間問題。最終一定是成為搜索的一個部分的,這一點沒有疑問。知識圖譜回答了 What和Who的實體類事實型問題以後,回答更難的How和Why的問題是搜索變得越來越智能的必由之路。
  • 區塊鏈學堂|什麼是知識圖譜
    用隱私計算的方式將數據進行加密處理後再分享使用,將解決製造企業的這一顧慮,有助於打破數據孤島,並為充分挖掘數據價值做好準備。知識圖譜則能對區塊鏈上存儲的經過隱私計算保護的海量數據進行結構化的梳理,方便決策者使用和分析這些數據,從中及時發現並解決企業生產管理中的問題,預測並把握企業乃至行業的發展趨勢和機會,可以說為工業互聯賦予了認知智能。
  • 知識圖譜研討實錄05丨肖仰華教授帶你讀懂概念圖譜構建
    知識圖譜是一種大規模語義網絡,已經成為大數據時代知識工程的代表性進展。知識圖譜技術是實現機器認知智能和推動各行業智能化發展的關鍵基礎技術。由復旦大學肖仰華教授策劃的《知識圖譜:概念與技術》課程體系,已在國內進行了多次巡迴演講,受到參會人員一致好評。課程主要目的和宗旨是系統講述知識圖譜相關知識,讓同學們對知識圖譜的理論和技術有一個系統的認知。本實錄來自該課程老師和同學的研討。
  • 知識圖譜發展的難點&構建行業知識圖譜的重要性
    知識圖譜是智能社會的重要生產資料,如果把人工智慧比作一個「大腦」,那麼深度學習是「大腦」的運轉方式,知識圖譜則是「大腦」的知識庫,而大數據、GPU並行計算和高性能計算等支撐技術就是「大腦」思維運轉的支撐。
  • 知識圖譜:知識圖譜賦能企業數位化轉型 | AI 研習社職播間第 3 期
    我們公司的優勢可以從兩方面來說:一是技術方面:我們公司專注於知識圖譜、智能問答應用領域多年,通過多年面向企業和政府的大型項目經驗將知識圖譜技術工具化、平臺化,可基於用戶場景快速開發人工智慧應用。而右邊的這個知識圖譜運維管理平臺,則能讓我們低成本地去運維這個圖譜,這是我們的產品現在在做的事情,我們的工程師在做整套的算法、管理運維平臺並將應用層結合到用戶場景中,這些都需要進行很多開發的工作。
  • 知識圖譜大牛組團來阿里,他們都聊了什麼?
    近日,由阿里巴巴聯合中國中文信息學會語言與知識計算專委會 (KG 專委) 舉辦的知識圖譜研討會在杭州召開。研討會由阿里巴巴集團副總裁牆輝(玄難)主持,知識圖譜領域國內知名專家參與了此次研討。長期從事知識工程和新聞及社會網路挖掘研究。主持研製大規模跨語言知識圖譜 XLORE。大數據時代需要把數據轉化成知識,為數據增添語義信息,獲得對大數據的洞察,使數據產生智慧,以提供決策支持等智能服務。知識圖譜把網際網路的信息表達成更接近人類認知世界的形式,可以把網際網路的內容從符號映射成計算機可理解和計算的語義信息。
  • 7月26-28||圖資料庫系統和知識圖譜應用高級實踐活動首輪通知
    有效的知識圖譜必然是需求驅動下深根行業的具體應用場景。目前熟悉知識圖譜體系人才緊缺,很多行業不能明確地描述自己場景的需求,更不清楚行業知識體系的數據模式,也沒有有效的一站式知識存儲、知識管理系統。為此,北京理工大學大數據創新中心牽頭擬邀請多位知名學者舉辦為期3天的圖資料庫(gStore)與知識圖譜高級實踐活動。
  • 知識圖譜在小米的應用與探索
    ,已賦能小愛同學,小米有品、智能問答、用戶畫像、虛擬助手、智能客服等網際網路產品。中間層是問答服務、智能客服等應用能力層,上層是小愛同學、商城等網際網路業務和傳統業務層,這些都是知識圖譜的落地場景,其中小愛同學是小米公司推出的虛擬人工的智能助理,小愛同學適用於手機、音響、電視、手錶以及手環等穿戴設備,通過搭載小愛同學的智能硬體,可以滿足用戶獲取知識和信息的需求。
  • 知識圖譜推理問答:如何讓機器像人類一樣學會推理
    AI TIME PhD 知識圖譜專題第三期,清華大學計算機系、知識工程實驗室的博士四年級研究生史佳欣,將結合知識圖譜推理問答的數據集,為大家梳理主流的研究方法,分析各種方法的優缺點,並對將來的研究工作作出展望。
  • 疫情可視化,基於知識圖譜的智能疫情監測服務平臺如何做?
    PlantData《基於知識圖譜的智能疫情監測服務平臺》案例入選。基於知識圖譜的智能疫情監測服務平臺1 案例背景新冠肺炎疫情形勢不斷變化,在防治工作中,基於知識圖譜的智能疫情監測服務平臺能夠利用全面、有效,及時的數據和可視化技術準確感知疫情態勢和防控措施落實情況,為決策者、指揮者、管理人員提供數據服務;通過確診病例的親屬關係
  • 是時候該關注「知識圖譜」了!
    知識圖譜是什麼通俗地講,知識圖譜就是將複雜的知識通過數據挖掘、信息處理、知識計量和圖形繪製等一系列方式,把所有不同種類的信息連接在一起得到的一個關係網絡。在知識圖譜裡,用節點表示現實世界中存在的「實體」,用邊示意實體與實體之間的「關係」。
  • 知識圖譜線上培訓課程
    知識圖譜課程全面系統講授、研討知識圖譜相關概念與技術主題,對當前行業落地過程的一系列困難進行答疑解惑,使學員系統地掌握知識圖譜概念與技術。同時,本次課程還邀請了兩位華為雲的專家,結合華為雲知識計算即服務(KaaS)解決方案,為學員深度解析知識圖譜行業實踐經驗。
  • 攝星智能發布首個防務領域知識圖譜星河,構建可控智能防務新業態
    十九大報告中提出了科技是核心戰鬥力的思想,強調了科技興軍的作用,要著重加快軍事智能化發展,軍委科學技術委員會主任劉國治中將說,這是我們國家實現創新超越、實現強軍的一個難得戰略機遇,也是我們實現彎道超車的難得戰略機遇。
  • 從知識圖譜到認知圖譜:歷史、發展與展望
    知識圖譜由節點和邊組成,節點表示實體,邊表示實體與實體之間的關係,這是最直觀、最易於理解的知識表示和實現知識推理的框架,也奠定了現代問答系統的基礎。從20世紀80年代的知識庫與推理機,到21世紀初的語義網絡和本體論,其核心是早期版本的知識圖譜,要麼側重知識表示,要麼側重知識推理,但一直苦於規模小、應用場景不清楚而發展緩慢。
  • 知識圖譜助力新基建(新知)
    知識圖譜是目前與人類大腦思維本質最趨近的人工智慧底層技術,可通過實體、關係、事件挖掘實現對客觀世界的認知,並且由已有的知識產生新的知識。目前,知識圖譜作為知識的一種形式,已經在語義搜索、智能問答、數據分析、自然語言理解、視覺理解、物聯網設備互聯等多個方面發揮越來越大的作用。
  • 實戰課堂丨大數據關係信息挖掘:知識圖譜應用案例分享
    榮之聯實戰課堂第4期的《解讀大數據分析:新技術,新實踐》主題沙龍上,聯想創投(香港)機器智能實驗室高級產品經理錢廣銳跟大家分享了《大數據關係信息挖掘:知識圖譜應用案例分享》。為了構造出數據分析的模型,數據分析模型的構建有很多方法,我們使用機器學習、大數據平臺和數據扒取平臺做精準模型。機器智能數據構建流程是將內部數據和外部數據,通過大數據平臺,通過模型分析幫助用戶建立模型的過程。