《中國科學:信息科學》

2020-12-02 騰訊網

大數據分析專題

特約編輯:

近年來, 隨著信息化技術與網際網路的飛速發展, 各行各業積累的數據資源急劇增長, 大數據已成為國家層面的基礎性戰略資源, 引起各國政府高度重視. 例如, 國務院於2015年8月印發了《促進大數據發展行動綱要》, 美國政府於2016年5月發布了《聯邦大數據研究與開發戰略計劃》, 歐盟Horizon 2020計劃把大數據提高到國家安全戰略層面. 發展大數據分析理論與技術方法, 是實現我國從數據大國向數據強國轉變的重要基礎, 將對國計民生的諸多方面產生深遠影響.

大數據分析旨在從海量數據中提煉知識價值, 涉及機器學習、可視分析、數據挖掘、知識處理等多個研究領域, 而大數據的高維、多源、不確定、領域化等特性給現有分析體系帶來嚴峻挑戰. 為及時反映國內大數據分析方面的最新發展,《中國科學: 信息科學》特組織本期「大數據分析專題」, 邀請國家重點研發計劃項目「大數據分析的基礎理論和技術方法」團隊成員介紹相關研究進展, 並邀請國內同行專家評審, 最終有7篇論文入選本期專題.【點擊論文題目可閱讀全文】

在大數據分析方面,機器學習與可視分析是實現原始數據至知識信息有效提煉的基礎支撐, 本期專題中有3篇文章是關於這方面的內容:

元自步學習」(束俊, 孟德宇*, 徐宗本)針對現有自步學習算法存在的超參數選擇問題, 提出了一種基於元學習機理的自步學習算法. 該算法基於元數據的指導, 在同一優化框架中基於數據實現參數動態調節, 並將所提元學習策略嵌入三種典型的自步學習實現.

基於眾包學習的交互式特徵選擇方法」(陳長建, 姜流, 雷娜, 劉世霞*)針對現有集成特徵選擇算法未考慮不同特徵選擇方法性能差異性的問題, 提出了一種基於可視分析的交互式特徵選擇方法, 通過可視分析系統為基於眾包學習的集成特徵選擇算法提供豐富的排序方式, 從而交互迭代地改善現有特徵子集.

系統概覽: 特徵選擇算法模塊和可視化模塊

一種保持語義關係的詞向量復用方法」(李新春, 詹德川*)針對詞向量復用面臨的新詞出現問題, 提出了一種簡單有效的語義關係保持詞向量復用方法. 該方法利用當前語料庫構建詞語之間的語義關係映射, 並在預訓練詞向量基礎上施加該映射獲得新詞的詞向量.

SrpWer和傳統方法對比示意圖

數據挖掘與知識處理是實現領域知識至大數據核心價值有效轉化的核心途徑, 本期專題中有2篇文章是關於這方面的內容:

基於鄰域視角的關聯關係挖掘方法」(成紅紅, 錢宇華*, 胡治國, 梁吉業)對大數據背景下海量變量間的關聯關係挖掘進行研究, 嘗試給出了大數據關聯關係度量需滿足的性質. 在剖析兩類傳統的基於鄰域視角的關聯關係度量方法基礎上, 通過引入k-NN粒與多粒度融合提出了基於數據驅動的關聯關係度量方法.

一種高可讀低冗餘實體摘要的生成方法」(劉慶霞, 程龔*, 瞿裕忠)針對知識圖譜的實體摘要問題進行研究, 提出了一種具備高可讀性和低冗餘性的實體摘要生成方法. 該方法通過綜合考慮實體描述三元組的重要性, 可讀性以及摘要的冗餘性, 將實體摘要問題建模為二次背包問題進行求解.

數據驅動是大數據分析應用的基本特徵, 面向視頻、文本等大數據應用需求的研究具有重要意義, 本期專題中有2篇文章是關於這方面的內容:

基於視覺–文本關係對齊的跨模態視頻片段檢索」(陳卓, 杜昊, 吳雨菲, 徐童*, 陳恩紅)針對日益增長的視頻片段精細檢索需求, 對視覺-文本跨模態視頻片段檢索問題進行研究. 通過構建文本關係圖與視覺關係圖刻畫查詢文本與視頻片段的語義關係, 並通過跨模態對齊的圖卷積網絡評估文本關係與視覺關係的相似度.

CrossGraphAlign預測的可視化樣例

基於長短時預測一致性的大規模視頻語義識別算法」(王錚, 翁澤佳, 王銳, 陳靜靜, 姜育剛*)針對大規模視頻語義識別面臨的視頻數量巨大且缺乏網絡標籤的問題, 提出了一種基於長短時預測一致性的視頻語義識別算法. 在片段視頻語義識別任務上, 文中算法性能在第三屆YouTube-8M比賽中排名第二.

視頻語義識別模型

相關焦點

  • 領域大數據知識圖譜專題 《中國科學:信息科學》
    為推動領域大數據知識圖譜的研究,交流相關研究進展與成果,《中國科學: 信息科學》在2020年第50卷第7期組織出版「領域大數據知識圖譜專題」,經過嚴格的同行評議, 專題共收錄 7 篇文章, 主題涵蓋推薦系統、科技知識圖譜、事理認知圖譜、人物關係圖譜、地理知識圖譜、篇章事件連通圖、旅遊知識圖譜等方面的內容。
  • 《中國科學: 信息科學》(英文版) 2017年第9期概覽
    ↑點擊上方「中國科學信息科學」, 及時獲取期刊動態!
  • 《中國科學》《科學通報》70周年訪談
    2020年是《中國科學》和《科學通報》創刊70周年,我們特別策劃了「我與《中國科學》/《科學通報》」系列訪談,邀請曾經關心指導或親身參與「兩刊」編輯出版工作的管理者、科學家、作者和讀者等回顧期刊發展歷史,同時展望未來,提出期望和要求。
  • 《中國科學:信息科學》英文版
    是量子物理與傳統信息科學交叉結合而衍生的一門新興學科分支。它以快速飛行的光子作為信息傳輸的量子比特, 用物質粒子的量子特性作為信息操控的量子比特,展現了獨特而強大的信息處理功能, 在提高運算速度、確保信息安全、增大信息容量和提高測量精度等方面預示了可突破傳統經典信息系統極限的誘人前景.
  • 了解中國科學-科學計量學新視角|| QSS專輯徵稿啟事
    Quantitative Science Studies (QSS) 是國際科學計量與信息計量學學會
  • 王元先生專訪:與《中國科學》《科學通報》一個甲子的情緣
    2020年是《中國科學》和《科學通報》創刊70周年,我們特別策劃了「我與《中國科學》/《科學通報》」系列訪談,邀請曾經關心指導或親身參與「兩刊」編輯出版工作的管理者、科學家、作者和讀者等回顧期刊發展歷史,同時展望未來,提出期望和要求。
  • 科學界紀念《中國科學》《科學通報》創刊五十年
    本報北京6月13日電記錄了當代中國科學事業的輝煌歷程,在國內外科技界享有盛譽的《中國科學》、《科學通報》,今天隆重紀念創刊50周年。周光召、路甬祥、龔心瀚、葉篤正、嚴東生等出席紀念會。《中國科學》、《科學通報》是我國自然科學基礎理論研究領域裡兩個權威性學術刊物,在國內外有著長期而廣泛的影響,是我國科學家發表最重要研究成果的兩種首選刊物。創刊以來,兩刊的歷屆主編都是中國最著名的科學家,其中有錢學森、惲子強、張文裕、吳有訓、竺可楨、嚴濟慈、葉篤正、嚴東生、周光召等;培養了目前活躍在科研前沿的一大批中青年科學家。
  • 量子信息專題 |《中國科學:信息科學》英文版
    量子信息 是量子物理與傳統信息科學交叉結合而衍生的一門新興學科分支。
  • 「《中國科學》《科學通報》創刊」入選科技出版十件大事
    12月1日,中華人民共和國成立70周年科技出版十件大事暨2019年出版百種科技新書發布會在北京召開,「《中國科學》《科學通報》創刊,促進科學發展和學術交流」入選「科技出版十件大事」。
  • 《中國科學:生命科學》編委會會議在廣州舉行
    溫國輝會見出席會議的院士和專家學者  《中國科學:生命科學》2020年度編委會會議11月7日在廣州舉行。11月7日下午,廣州市市長溫國輝會見出席會議的院士和專家學者。  參加會見的嘉賓有:中國科學院院士朱作言、朱玉賢、曹曉風、宋爾衛、魏輔文、孟安明、陳曄光、劉耀光、謝道昕,《中國科學》編委會秘書長彭斌,南方醫科大學校長黎孟楓等。  溫國輝介紹了廣州經濟社會發展及醫療衛生事業、生物醫藥產業等情況。他說,廣州正按照中央決策部署,抓住建設粵港澳大灣區、加快形成新發展格局等重大機遇,推動廣州高質量發展。
  • 蘭州理工大學馬軍教授榮獲《中國科學》和《科學通報》年度突出...
    每日甘肅網訊  11月10日下午,《中國科學》和《科學通報》兩刊理事會在中國科學院召開。《中國科學》系列期刊主編和編輯部主任等參加會議。會議由科學院院長白春禮院士主持。  會議對《中國科學》和《科學通報》做出突出貢獻的作者、編委和編輯等作出表彰。朱日祥院士、江松院士、馬軍教授等10名研究人員被評為2016年度突出貢獻的優秀作者。
  • 《中國科學數據(中英文網絡版)》編輯委員會成立會議在京舉行
    (中英文網絡版)》(簡稱《中國科學數據》)編輯委員會成立會議暨編輯委員會一屆一次會議在中科院計算機網絡信息中心舉行,來自中科院遙感與數字地球研究所郭華東院士、中科院計算機網絡信息中心遲學斌副主任 、《中國科學數據》編輯委員會委員、相關媒體等50多位代表參加了此次會議。
  • 科學網—中國科學基金
    中國科學基金第26卷 第 6期 2012年11月  目 次 學科進展與展望
  • 科學網—饒毅:青年,中國科學的希望
    有理想的青年人是中國科學的希望。 一個重要原因是世界歷史上,做出傑出科學成就的多數都是45歲以下的年輕人。
  • 《中國科學:生命科學》編委會會議在廣州舉行 溫國輝會見出席會議...
    大洋網訊 《中國科學:生命科學》2020年度編委會會議昨天在廣州舉行。昨天下午,廣州市市長溫國輝會見出席會議的院士和專家學者。參加會見的嘉賓有:中國科學院院士朱作言、朱玉賢、曹曉風、宋爾衛、魏輔文、孟安明、陳曄光、劉耀光、謝道昕,《中國科學》編委會秘書長彭斌,南方醫科大學校長黎孟楓等。
  • 《中國歷史上的科學發明》:飽含父愛的一本中國科學發明史
    提起中國古代的科學發明,可能很多人一下子就會回答出造紙術、活字印刷、指南針以及火藥這樣的答案。可若是再問中國歷史上曾經出現過哪些科學家,怕是還真的是沒多少人能夠說出幾個的。自小我們就知道牛頓的蘋果、瓦特的蒸汽機、富蘭克林的風箏和愛迪生的燈泡。
  • 科技部發布2016年度中國科學十大進展!
    原標題:科技部發布2016年度中國科學十大進展! 2月20日,科技部基礎研究司與科技部高技術研究發展中心聯合召開解讀會,發布「2016年度中國科學十大進展」評選結果。
  • 中國科學做對了什麼?-虎嗅網
    在此處,本文所說的科學主要限於以學術發表為目的的基礎科研。技術應用為目標的研發進展,將是筆者另一姊妹篇文章「中國創新究竟做對了什麼?」討論的內容。中國科學做了什麼?要回答這個問題,則要看從那個著名的「春天」開始,40年來中國科學都做了什麼?
  • 祝賀 Advances in Polar Science 被 「 中國科學引文資料庫(2019-2020年度)」收錄
    >Advances in Polar Science (《極地科學進展》)被收錄其中。至此,Advances in Polar Science已被我國兩個主要的檢索資料庫收錄:中國科學技術信息研究所的「中國科技論文統計源期刊」(又稱「中國科技核心期刊」,CSTPCD)和中國科學院文獻情報中心的「中國科學引文資料庫(CSCD)」。
  • 2018年度中國科學十大進展正式發布
    2019年2月27日,科技部基礎研究管理中心在北京召開2018年度中國科學十大進展專家解讀會,發布十大進展遴選結果,並邀請相關領域專家對十大進展逐項解讀。—代謝平衡實現可持續農業發展、將人類生活在黃土高原的歷史推前至距今212萬年等10項重大科學進展入選。