2020-11-08 18:59 來源:澎湃新聞·澎湃號·湃客
前沿進展:可視化與自然語言處理交叉研究(袁曉如)
近年來有越來越多的工作專注於AI與可視化的結合,如可解釋機器學習及自動化可視化等方向。來自北京大學的袁曉如研究員主要從可視化與自然語言處理結合的角度梳理了相關的工作。其中包括IEEE VIS 2019的最佳論文FlowSence, 提出了自然語言支持的數據流的可視化構建過程,並支持基於模板的規則匹配。其它相關工作包含利用自然語言進行可視化查詢及可視化描述生成。
深度學習時代的科學可視化(陶鈞)
來自中山大學的陶鈞副教授總結了科學可視化與深度學習相結合的相關工作。具體而言,共有三種可以結合的方式。其中第一種方式是在不改變輸入輸出的情況下替換現有的計算方法,利用深度學習的方法解決原有問題。該方面的工作集中在超解析度、流場計算、流線重構等應用中,且主要利用深度網絡端對端的特性來學習輸入與輸出的複雜變換,通常採用GAN的架構進行學習。第二種方式可以產生原有計算方法無法生成的結果,相比於第一種方式是更為複雜的端對端的學習模式。該方式意圖捕捉參數與輸出之間的聯繫,主要任務依然是數據或圖像生成,但此時輸入信息與輸出之間嚴重不對等。最後一種方式主要意圖利用深度學習網絡中學到的信息,如通過自編碼器對數據進行編碼從而學習數據之間的關聯。最後陶鈞老師總結了未來可以探索的方向,包括如何在更多類型的數據之間建立聯繫,如何將人的領域知識嵌入到深度學習模型中,如何探索深度學習模型學習到的信息。
Recent Advances in the Area of AI for VIS (王韻)
來自微軟研究院的王韻研究員介紹了近年來利用人工智慧輔助可視化設計的相關工作,主要介紹了三個方面的任務:可視化生成、數據敘事及可視化交互。對於可視化生成,現有工作包括利用深度學習生成可視化代碼(如Vis2Code)、可視化自動推薦(如DeepEye及VizML)及帶有約束的可視化生成(如Draco及DziBan)。對於可視敘事,現有工作集中在如何自動生成信息圖表(如Text-to-Viz、DataShot),如何提取可視化結構生成可視化模板以方便重新利用可視化(如Retrieve-then-Adapt)及可視化圖片描述的生成。最後一部分研究自然語言技術支持的交互及其它多模態交互,以及圖表問答。
沉浸式可視化(巫英才)
來自浙江大學的巫英才教授總結了沉浸式可視化的相關工作。可視化是通過交互進行推理分析的科學,現有的大多數可視化以鍵盤滑鼠為交互設備,而隨著沉浸式設備的普及就使得沉浸式可視化從科幻走向了現實。沉浸式可視化將交互從二維界面擴展到了三維世界,使得用戶的交互變得更為自然,這種可視化方式可以為用戶帶來新的與眾不同的「渲染感」與「參與感」。最後巫老師從三個方面介紹了渲染式可視化的研究內容:沉浸式感知與可視化、沉浸式交互的設計及沉浸式可視化創作工具。
Interactive Visual Anomaly Detection and its Applcation (曹楠)
來自同濟大學的曹楠教授總結了近年來異常檢測與可視分析交叉的相關工作。異常檢測是數據挖掘中的經典任務,其試圖挖掘出在其它數據中所不同的模式。異常檢測主要有三個挑戰。其一是異常檢測的定義十分多元,在不同領域及場景中有不同的定義,其二是異常檢測通常需要標籤數據,然而在真實場景中這種數據非常稀疏,最後是其面臨著可解釋的問題,而可視化可以很好地解決這三個問題。接著,曹老師將現有的工作根據用戶行為、數據類型、異常檢測技術、可視技術及交互技術進行了分類。其中用戶行為是指異常檢測應用的場景,如社交媒體中的用戶之間的交互及交易行為。數據類型包括文本、網絡、時空數據及高維數據。異常檢測技術有基於分類、聚類及資訊理論等的方法。可視化技術包括序列可視化、圖可視化、文本可視化等。交互技術包括監測追蹤、瀏覽、模式分析、知識外化與精煉等。最後,曹老師總結了該領域可能的研究機會,如現有工作缺少關於協同行為及文本數據異常檢測的研究,除此之外,如何為模型提供反饋以進行模型精煉是未來的研究熱點。
大規模科學數據可視化(畢重科)
來自天津大學的畢重科副教授概覽了2017-2019三年的大規模科學科學可視化的相關工作。科學工程及模擬計算會生成大規模的科學數據,利用可視化及可視分析的技術可以從中得到數據及模型的知識與結論,以輔助假設驗證。畢老師從並行計算、深度學習增強的科學可視化、參數空間探索、流可視化及可視化評估等方向進行了快速瀏覽。最後畢老師總結了未來大規模科學數據可視化的研究方向,包括原位可視化與可視分析的結合、面向可視化任務的稀疏數據管理辦法、可視化並行性能的提高、可視化表達與展示的探索、複雜科學數據語義理解的增強技術及與人工智慧的結合。
社交媒體可視化(陳思明)
來自復旦大學的陳思明副教授總結了社交媒體可視化的工作,可以根據社交媒體中的數據對象(地理時空數據、網絡數據及文本數據)將可視化技術進行分類,其中結合地理時空數據的工作研究基於地理空間的信息傳播、包含時空分布的社會事件及人群移動軌跡分析,該部分的研究挑戰在於如何從整體模式探究個體模式以及如何從多維數據中提煉出故事類敘事。而結合網絡數據的社交網絡可視化關注於社交群體的活動行為模式的探索與預測性分析,如語義地圖可視化(D-Map+,E-Map及R-Map)及多視圖的可視化探索(WeSeer及SocialBubble),該部分的挑戰在於時變動態網絡的語義理解與探索。關於與文本相關結合的工作重點介紹了文本流數據對比的可視化Co-Bridges技術。最後陳老師認為社交媒體可視分析依然方興未艾,未來可以探索的方向包括動態網絡與語義特徵的探索、交互式語義探索及對社交媒體的故事敘述。
數據可視分析挑戰賽回顧(趙穎)
最後來自中南大學的趙穎副教授分享了其在可視化競賽多年來的經驗。趙穎老師首先總結了國內外知名的可視化競賽,包括VAST Challenge、ChinaVis挑戰賽、阿里天池大數據可視化競賽、數據新聞競賽、Tableau可視化比賽、科學可視化競賽等。接著趙穎老師介紹了ChinaVis挑戰賽的發展情況,自2015年至2020年,共有2570人報名參賽,及616個作品提交。其中大部分參與者是本科生,反映了可視化比賽已經融入了本科教學。其次,趙穎老師介紹了ChinaVis挑戰賽的出題方式,包括真實場景題目(如2016年黑客郵件數據、2017年偽基站數據及黑網吧數據、2019年周杰倫演唱會附近的交通軌跡數據)、仿真場景題目(如2018年內部安全威脅數據、2019年會場人員的流動數據)及開放式題目(如2020年的疫情分析題目)。同時,ChinaVis挑戰賽數據依然被廣泛下載使用,且挑戰賽獲獎率逐年下降,表明ChinaVis挑戰賽的質量正逐年提升,最後歡迎大家多多參與ChinaVis挑戰賽。
文案 | 賈世超
原標題:《可視化發展年度報告 | ChinaVIS 2020特別專題》
閱讀原文
關鍵詞 >> 湃客
特別聲明
本文為澎湃號作者或機構在澎湃新聞上傳並發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。