據SIGIR2020大會今年詞頻統計,推薦系統和機器學習佔到前兩名。圖片來源:Unsplash
■本報記者 鄭金武
近日,第43屆國際計算機協會信息檢索大會(SIGIR2020)落下帷幕。原計劃在陝西西安舉行的SIGIR2020大會,受疫情影響改為線上舉行。
「根據今年詞頻統計,推薦系統和機器學習佔到前兩名。」SIGIR2020大會共同主席、吉林大學人工智慧學院院長常毅在接受《中國科學報》採訪時,對信息檢索領域的研究方向進行了分析。
然而,從今年的SIGIR大會錄取論文內容看,信息檢索與人工智慧、自然語言處理、數據挖掘等技術融合創新,是大會的重要特點。而阿里巴巴、百度等公司團隊多篇論文的入選,又彰顯了信息檢索領域技術創新與工業界結合的緊密性。
在常毅看來,「交叉融合,與工業界結合緊密」,也正是SIGIR成為信息檢索領域頂級會議的重要法寶。
交叉融合促進技術創新應用
「會議開幕式上近十年關鍵詞的動態演化,顯示推薦系統與機器學習是近期SIGIR會議最熱門的方向。機器學習最新方法和模型在信息檢索領域的創新性應用,也是學者們關注的焦點。」常毅介紹。
機器學習是中國科學院院士、西安交通大學教授徐宗本此次大會報告的關鍵詞。「機器學習是在一系列前提條件的基礎上運行和應用,有助於人工智慧的巨大成功,而人工智慧也有助於機器學習進一步發展和突破瓶頸。」
機器學習需要大量用於訓練的數據集。「研究人員從一個不完整的數據集中逐步進行機器學習,並由易到難,為處理非常複雜的不完備數據集提供可行的方法。」徐宗本表示,類似由易到難的進階式訓練,有利於突破機器學習的瓶頸,並取得進展。
自2008年至今,天津大學智能與計算學部副教授張鵬一直致力於開拓量子人工智慧與自然語言理解這一交叉領域的研究工作。其入選今年SIGIR會議的論文,是基於量子幹涉的檢索神經匹配模型研究。
「在人類認知和人類相關性判斷過程中,研究表明存在量子幹涉現象的大量證據。在此基礎上,我們將量子幹涉的理論建模在神經匹配模型中,將神經匹配模型擴展到量子概率詮釋。」張鵬說,這一神經匹配模型在信息檢索任務中應用時,表現出不錯的檢索效果。
類似的交叉融合研究,在本屆SIGIR大會論文中比比皆是。常毅表示,信息檢索與人工智慧、自然語言處理、數據挖掘等技術融合創新,既促進了信息檢索領域的長足發展,也帶動了相關技術的創新應用。
與工業界結合緊密
常毅說,隨著算法、算力的不斷提升,SIGIR會議成果在現代學術界、工業界都顯示出重要的研究與應用價值,推動信息檢索成為大學和企業都非常關注的專業領域,吸引了更多相關領域的頂級科學家和頂級信息技術公司科研人員加入。
「近十年來,學術團體的研究方向與工業界的實際應用,與機器學習的關係越來越緊密。」常毅說,這樣的緊密結合,也有利於學術的不斷發展。
在今年的SIGIR大會上,阿里巴巴的研究團隊表現突出,共有20多項研究成果入選,是全球論文數量最多的科技公司。有專家表示,阿里巴巴在多個成果中,都展現了人工智慧在理解文本信息任務上的突破。
在其中一篇論文中,阿里巴巴研究團隊提出了一種能夠理解文本言外之意的方法,通過推敲給定隱晦文本的全局語義、局部語義,以及可能存在的噪聲,有效提高了模型識別隱晦文本是否包含色情、暴力等內容的精確率。
據統計,百度、華為、騰訊、平安科技等科技公司,在今年的SIGIR會議上的論文投稿量都很可觀,這些論文都來自於信息檢索相關技術在實際場景中的應用,而應用又促進技術創新的案例。例如,平安科技公司團隊的論文,是平安科技人工智慧前沿技術與壽險線上營銷業務深度融合的一項創新成果。
信息檢索和自然語言處理是人工智慧的基礎技術,要實現突破,不僅需要全新的模型,還需要結合實際應用提出更創新的訓練和推理方法。而阿里巴巴、騰訊等經濟體豐富的場景,恰為自然語言處理等技術的研究提供了良好條件。
中國青年學者唱主角
在今年的SIGIR會議上,中國和美國學者論文在投稿率錄用率排名中,分別名列第一、第二。
據介紹,SIGIR 2020會議上華人學者的表現十分突出。入選的論文中共有317位華人學者,其中有1人發表9篇論文。另外,第一作者華人學生共有55人,以一作身份發表2篇論文的學生有7人。
本屆會議最佳論文獎由康奈爾大學Thorsten Joachims團隊獲得。而清華大學本次獲得了多個獎項,包括最佳論文榮譽提名獎和兩個最佳短論文獎。其中,兩個最佳短論文獎的第一作者分別是常健新和於是。值得一提的是,於是目前是清華大學大三學生。
「這些成績,都顯示了中國學者在信息檢索相關領域的創新與貢獻。」常毅說,「今年SIGIR會議的一大亮點,是有更多非論文作者尤其是青年學生加入到信息檢索社群中來。」
常毅介紹,假如青年學者定義為青年學生、青年博士、青年教師,則今年SIGIR會議上青年學者的參與比例超過了75%。
常毅表示,青年學者積極參加國際學術會議,多學習、多交流,將有助於他們打開視野、開拓思路,結識海內外、業內外資深而優秀的研究者、業內同行和同學。
「青年學者應通過交換計劃、訪問計劃,積極開展國際合作。」常毅說。
《中國科學報》 (2020-08-06 第3版 信息技術)