KDD 2020首屆時間檢驗應用科學獎公布,清華大學研究團隊獲獎

2020-12-08 OFweek維科網

ACM SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,國際數據挖掘與知識發現大會,簡稱 KDD)是數據挖掘領域國際頂級學術會議,今年的 KDD 大會將於 8 月 23 日至 27 日在線上召開。

8 月 13 日, SIGKDD 2020 官方公布了 2020 年 ACM SIGKDD 創新獎、服務獎、論文獎、新星獎、時間檢驗研究獎、時間檢驗應用科學獎等六項大獎的獲得者,這些獎項是針對數據科學、機器學習、大數據和計算機科學領域的傑出個人和研究團隊而設立的。

值得一提的是,今年 KDD 頒發了首屆時間檢驗應用科學獎(Test of Time Award for Applied Science)獎項,以表彰在數據科學的實際應用中具有影響力的研究。清華大學計算機科學與技術系唐傑、李涓子等人憑藉他們在 2008 年發表的關於學術社交網絡挖掘的研究成果獲得了這一獎項。

獲獎論文題目為 ArnetMiner: Extraction And Mining Of Academic Social Networks,論文作者包括清華大學計算機科學與技術系的唐傑、張靜、姚利敏、李涓子,以及來自 IBM 中國研究實驗室的張莉和蘇中。

在這篇文章中,作者主要介紹了一個自主研發的面向研究者社會網絡的挖掘搜索系統 ArnetMiner 的體系結構和關鍵技術。下面我們來將詳細解讀一下這篇文章。

研究背景

近些年,學術社交網絡發展迅速,為眾多研究學者提供了良好的交流平臺,也產生了巨大的學術信息數據集。隨著數據挖掘和人工智慧技術的發展,針對學術社交網絡進行數據挖掘和知識提取,進而為科學研究領域提供全方位的服務成為一大研究熱點。

在作者開始這項研究之時,學術圈已有 DBLP、CiteSeer、Google Scholar 等學術搜索系統發布,但是往往存在以下兩項不足之處:

1)缺乏語義信息。無論用戶輸入的個人資料或使用啟發式方法提取的各類信息,語義存在不完整或不一致性,缺少有效獲得大規模語義信息的方法;

2)缺乏異構對象的統一建模方法。以前,學術網絡中不同類型的信息如學者、論文、會議期刊是單獨建模的,因此無法準確捕捉它們之間的依賴關係。

為解決這兩個問題,作者所在的研究團隊開發了ArnetMiner系統。該系統旨在解決以下幾個問題:

1)如何自動從網際網路海量信息中提取研究人員的個人檔案?

2)如何集成不同來源提取的學術相關信息(例如研究人員的個人檔案和出版物)?

3)如何以統一的方法為不同類型的信息建模?

4)如何基於已構建的網絡,提供強大的挖掘和搜索服務?

ArnetMiner系統(簡稱AMiner)

圖1:AMiner系統框架圖

圖 1 給出了 AMiner 系統框架圖,AMiner 系統自下而上主要包括五個部分:

1)研究者個人信息抽取(Extraction):即從網絡上自動識別到研究者的個人主頁,並訓練一個統一的模型,從中抽取研究者的各種基本信息。同時,從不同來源的論文資料庫抽取或收集作者所發表的論文信息;

2)個人信息融合(Integration):通過使用研究者姓名作為標識符,將提取的研究者的個人資料和提取的出版物信息進行整合。提出了馬爾科夫隨機場概率模型,以解決融合不同來源論文數據時面臨的重名歧義問題;

3)存儲和訪問(Storage and Access):系統將集成的數據存儲在研究者網絡知識庫(RNKB)中,利用MySQL作為存儲資料庫,並使用反向文件索引方法進行信息索引;

4)建模(Modeling):文章提出一個概率生成模型,通過對學術網絡中的研究者、論文、會議等不同類型的信息進行綜合分析,對每種信息進行主題分布估計;

5)搜索服務(Search Services):基於建模結果,提供多種搜索服務,包括專家搜索、關聯關係搜索、論文推薦以及引用推薦等。

該系統重點解決三個技術難點:

1)學術網絡中研究者個人信息自動抽取問題;

2)不同來源學術論文融合過程中的重名排歧問題;

3)學術網絡中研究者、論文、會議等異質實體的統一建模問題。

相關焦點

  • KDD 2020創新獎、時間檢驗獎等六項大獎出爐!
    作者 | 陳大鑫編輯 | 陳彩嫻8月13日 KDD 2020 宣布了2020年ACM SIGKDD創新獎、服務獎、論文獎、新星獎、時間檢驗研究獎、時間檢驗應用科學獎等六項大獎的獲得者,這些獎項是針對數據科學,機器學習,大數據和計算機科學領域的傑出個人和研究團隊而設立的。
  • KDD 2020大獎出爐!清華大學唐傑斬獲時間檢驗應用科學獎
    來自清華大學唐傑榮獲時間檢驗應用科學獎,還有兩位華人學者湯繼良和盛勝利均上榜。 KDD 2020 大獎出爐! 近日,KDD 2020 宣布了今年 ACM SIGKDD 六項大獎的獲得者,這六大獎項分別是時間檢驗研究獎、時間檢驗應用科學獎、新星獎、創新獎、學位論文獎、服務獎。
  • KDD 2020大獎出爐!清華大學唐傑斬獲時間檢驗應用科學獎
    【新智元導讀】近日,KDD 2020公布了6大獎項的獲得者。來自清華大學唐傑榮獲時間檢驗應用科學獎,還有兩位華人學者湯繼良和盛勝利均上榜。KDD 2020 大獎出爐!近日,KDD 2020 宣布了今年 ACM SIGKDD 六項大獎的獲得者,這六大獎項分別是時間檢驗研究獎、時間檢驗應用科學獎、新星獎、創新獎、學位論文獎、服務獎。這些獎項是為那些在數據科學、大數據分析和挖掘、機器學習以及計算機科學領域做出傑出貢獻的研究人員設立的,旨在表彰那些對整個行業產生深遠影響的人。
  • 每人獲獎300萬元,馬化騰發起的「科學探索獎」公布首屆50位獲獎人
    來源 | 科學探索獎剛剛,首屆「科學探索獎」的50位獲獎人名單出爐。
  • 2020年科學突破獎公布 清華校友陳諧獲得新視野物理學獎
    2020年科學突破獎公布 清華校友陳諧獲得新視野物理學獎清華新聞網9月6日電(通訊員 田陽)北京時間9月5日,2020年科學突破獎(Breakthrough Prize)揭曉。除生命科學突破獎、基礎物理學突破獎、數學突破獎外,面向年輕學者的新視野物理學獎和新視野數學獎也同時公布。
  • 首屆「未來科學大獎」在京揭曉 薛其坤、盧煜明獲獎
    首屆「未來科學大獎」在京揭曉 薛其坤、盧煜明獲獎來源:新華網 2016-9-19 閻冬  歷經一年半的嚴格提名、篩選和評審,中國首個由大陸企業家、科學家共同發起的民間科學大獎——首屆未來科學大獎新聞發布會今日在京舉行並正式揭曉獲獎科學家名單。「物質科學獎」由清華大學教授薛其坤獲得,「生命科學獎」則由香港中文大學教授盧煜明獲得。
  • 2020年度第十屆吳文俊人工智慧科學技術獎獲獎名單公布!
    昨日,2020年度第十屆吳文俊人工智慧科學技術獎獲獎名單在其官網上公示,擬對101個成果授獎,其中包括吳文俊人工智慧最高成就獎1項,吳文俊人工智慧傑出貢獻獎3項,吳文俊人工智慧自然科學獎20項,吳文俊人工智慧技術發明獎8項,吳文俊人工智慧科技進步獎25項、吳文俊人工智慧科技進步獎企業技術創新工程項目17項,吳文俊人工智慧科技進步獎科普項目3項、吳文俊人工智慧優秀青年獎
  • 首屆「科學探索獎」公布,中科院海洋所研究員高翔入選
    半島記者 徐傑23日,記者從中科院海洋所獲悉,在近日公布的首屆「科學探索獎」獲獎名單中,中科院海洋所研究員高翔成為50位獲獎人之一。十年來,高翔一直潛心專注於俯衝帶地球動力學及其相關的地震和海嘯等自然災害的研究,以實際行動踐行「科技報國、創新為民」的價值觀,先後提出了「大地震易產生於光滑海底俯衝區域」和「大地震與慢地震在流變學上分離」等突破性地震學理論,被認為可直接用於指導防震減災工作。相關成果以第一作者發表在國際頂級學術期刊上,引起了國際同行的廣泛關注和充分肯定,並被用作多個相關國際大型科學考察計劃的主要科學依據。
  • 「中國諾獎」2020未來科學大獎獲獎名單公布
    未來科學大獎委員會於9月6日在北京公布2020年獲獎名單。他們均是來自生命科學、物理、化學、數學、計算機等基礎和應用研究領域極具成就的科學家。11月16-22日將舉行未來科學大獎周,為期一周的議程主要包括與知名高校合作舉辦獲獎人學術報告會,對具備前沿、交叉、應用特徵的學科或領域進行深入探討的病毒與人類健康國際論壇、產學研論壇、青少年對話獲獎人及頒獎典禮。
  • 智譜AI首席科學家唐傑團隊獲數據挖掘頂會時間檢驗應用科學獎
    近日,清華大學教授、北京智譜華章科技有限公司(以下簡稱:智譜.AI)首席科學家唐傑及其團隊獲得了ACMSIGKDD2020時間檢驗應用科學獎。這是華人團隊首次在該領域獲得此國際獎項。所謂時間檢驗獎,指的是這篇論文要在過去十年間對研究,方法論以及實踐產生重大影響。
  • 首屆中國大學慕課精彩100評選展播活動獲獎名單公布
    本次活動通過學習數據分析、課程評價、專家評審等程序,從課程內容、教學設計、製作效果等多維度對申報課程的質量、創新性、適用性等方面進行評審,最終產生100門「最美慕課」,其中一等獎20名,二等獎30名,三等獎50名,另設教學設計獎、人氣獎、組織獎3項專項獎。  2013年是「中國慕課元年」。在教育部的大力推動下,中國大學慕課呈現出「起點高、定位準,起步早、發展快、後勁足」的發展特色。
  • 2020年「科學探索獎」公布!他成為寧波首位獲此殊榮的科學家
    9月26日,記者從寧波團市委獲悉,在經過4個多月的評審後,2020年「科學探索獎」獲獎名單正式向社會公布。此次共有50位青年科學家獲獎,寧波市青聯副主席、中國科學院寧波材料技術與工程研究所研究員王立平榜上有名,入選領域為「先進位造」。
  • 2020年「科學探索獎」公布,他成為寧波市首位獲此殊榮的科學家
    9月26日,記者從寧波團市委獲悉,在經過4個多月的評審後,2020年「科學探索獎」獲獎名單正式向社會公布。此次共有50位青年科學家獲獎,寧波市青聯副主席、中國科學院寧波材料技術與工程研究所研究員王立平榜上有名,入選領域為「先進位造」。
  • 2020年最重要的科技人才獎獲獎名單!
    國家最高科學技術獎 每年評選一次,每次授予不超過兩名, 由國家主席親自籤署、頒發榮譽證書、獎章和800萬元獎金。截至2020年1月,共有33位傑出科學工作者獲得該獎。  黃旭華院士、曾慶存院士獲得2019年國家最高科學技術獎,2020年哪兩位專家榮獲國家最高科技獎,將在2020年1月揭曉,大家拭目以待。
  • 獎金最高的2020年科學突破獎公布,黑洞照片拍攝者等獲獎
    突破獎每年都會表彰在生命科學,基礎物理學和數學領域的成就,而這些學科旨在提出最終極的問題,並尋求最深刻的答案。突破獎也被稱為全世界最慷慨的科學獎,單獎為三百萬美金。 今年,總額兩千一百六十萬美元的獎金被用於獎勵以下領域的科學突破:製作第一張黑洞圖像,確定肥胖症的生物學基礎,發現痛覺的生物化學機制,以及其他重要成就。
  • 谷歌的KDD 2017:九篇錄用+雙料博士論文獎
    KDD 2017 已於近日落下帷幕,作為數據科學、信息檢索、數據挖掘和機器學習的頂級會議,KDD 為學術界和工業界提供了一個寶貴的交流機會。以下是谷歌深度參與或介入的 KDD 活動議程全名單,筆者編譯如下:組織委員會Panel 主席: Andrew Tomkins 研究程序委員會主席: Ravi Kumar 應用數據科學程序委員會主席: Roberto J.
  • 2020未來科學大獎公布,4位學者獲獎
    2011年9月,張亭東獲頒葛蘭素史克中國研發中心「生命科學傑出成就獎」。2012年,張亭東被中國科協評為「全國優秀科技工作者」。2014年7月1日,張亭東被授予上海交通大學醫學院名譽教授。2015年9月19日,張亭棟獲「求是傑出科學家獎」。12月22日,獲第六屆中國中醫科學院唐氏中醫藥發展獎——中藥研究獎。
  • 首屆首獎!南京大學周志華教授獲2020「CCF-ACM人工智慧獎」
    首屆首獎!>10月14日,中國計算機學會(CCF)獎勵委員會宣布,決定授予我校人工智慧學院院長、周志華教授2020年首屆「CCF-ACM人工智慧獎」,以表彰他在機器學習的多個領域做出的傑出貢獻該獎於2020年設立,每年評選並頒發一次,獲獎人數不超過3名。獲獎理由:周志華教授在「集成學習」、「多標記學習」等機器學習的多個領域做出了傑出貢獻,在理論與方法上取得原創性成果,發明的技術應用於多種真實場景取得顯著成效。
  • 2020年度陳嘉庚科學獎揭曉!施一公、馮小明等人獲獎
    8月28日下午,中國科學院在北京召開新聞發布會,公布2020年度陳嘉庚科學獎獲獎項目和陳嘉庚青年科學獎獲獎人。圖|中科院2020年度陳嘉庚科學獎獲獎項目為:數理科學獎——「實驗發現五夸克態」(北京大學高原寧)、化學科學獎——「新型優勢雙氮氧配體和高效不對稱催化」(四川大學馮小明)、生命科學獎——「剪接體的結構與分子機理研究
  • 2020諾貝爾物理學獎出爐,清華大學教授有望摘下物理學諾獎?
    Ric3位發現C肝病毒的科學家,摘得2020諾貝爾生理學或醫學獎、攬下1000萬瑞典克朗獎金之後,北京時間6日下午18時左右,瑞典皇家科學院又宣布了2020年諾貝爾物理學獎獲得者。做出這樣的判斷,就是張首晟關於量子自旋霍爾效應,並且在以後的研究中被證實。從這些圍繞霍爾效應的突破性科學研究可以看出,該領域產生諾貝爾物理學獎的概率確實比較高。