數字新基建:用AI幫助人們整理海量的論文

2020-09-23 知社學術圈

有研究顯示,科學家經常需要花費佔四分之一甚至更多的工作時間來搜索和閱讀相關的科學文獻,以了解其中的研究方法和結果,從而對自己下一步的研究計劃進行有效的修正。在學術論文數量飛速增長的當下,尋找與研究領域相關的研究論文並提取相關信息是一個不小的挑戰。


卡內基梅隆大學軟體研究所的投資者,企業家、兼職教授Ganesh Mani和艾倫AI研究所的博士後研究員湯姆·霍普(Tom Hope)認為,科學界論文數量井噴,僅僅依靠研究者本身的精力很難完全跟上相關領域的發展,需要有新方法來幫助人們對這些信息進行篩選,潛在的解決方案包括將人類專業知識與AI相結合的一種方法,以與不斷擴大的知識庫保持同步。例如,人工智慧可以用來總結和收集關於某個主題的研究,而人類則可以用來整理研究結果。


病毒的大流行帶來的緊迫的研究壓力


一個現實的例證是有關新冠病毒的研究。他們的統計表明,與疾病傳播、治療方案、臨床試驗和經濟影響相關的同行評審出版物的預印本數量呈指數增長且評審周期縮短。到5月初,(醫學,生物,化學)arXivs中有4000多個預印本,到8月中旬已增長到8000多個,其中包含「 COVID-19」或「 SARS-CoV-2」字樣,而在14個病毒學期刊上,同行評審和發表期刊文章的平均時間從117天縮短至60天。有關病毒大流行帶來的附帶影響的研究,例如由於檢疫引起的抑鬱增加或來自減少排放的氣候變化數據,也增加了手稿的數量。


面對如此之多的研究成果,科學家想要從中找出與自己的研究領域相關的前沿信息或者是有啟發性的其他學科的成果,可能已經不是多花點時間能解決的了。


面對信息洪流,人類顯得渺小


科學家通常通過學術搜尋引擎中的文章列表來搜索文獻。搜尋引擎擅長快速查找與特定目標查詢相關的文檔。但是如果潛在的有效信息研究人員根本不知道呢?以前有關冠狀病毒的研究工作以及更廣泛的生物學和醫學研究工作可能包含有價值的知識,可以將過去的知識與新的研究聯繫起來。如此豐富的信息既代表著巨大的機遇,也帶來了新的挑戰。


艾倫人工智慧研究所和語言學者創建了一個有關COVID-19的開放研究數據集(CORD-19),這是一種有關新冠病毒的不斷增長的論文集(目前有13萬篇摘要以及供多個研究小組使用的全文論文)。


艾倫人工智慧研究所與華盛頓大學合作,使用這些數據發布了一個名為SciSight的工具,這是一種由AI驅動的圖形可視化工具,可實現快速直觀的探索生物醫學實體(例如蛋白質,基因,細胞,藥物,疾病和患者特徵)之間的關聯以及在該領域工作的不同研究小組之間的關聯。它有助於促進協作和發現,並減少冗餘。例如,在SciSight中,在圖1的左側顯示了與「氯喹」有關的疾病和化學物質的網絡。用戶還可以通過搜索主題,從屬關係或作者來找到新的組及其工作方向,如右圖1所示。


圖1. 在SciSight中的關聯探索


在這個數據集中,儘管某些概念(例如基因序列,化學結構,植物分類法)具有標準化的通用術語,但圍繞大量科學概念制定標準仍需進行大量工作,尤其是考慮到新材料,新工藝和新方法的不斷出現。同時,作者認為還應該鼓勵採用標準化的雙軌制手稿提交框架:1.便於人類理解的,語言活潑的一般介紹論文;2.使用標準化術語、概念的論文的機器可讀版本,以及結構,尤其是表格,圖形,方法和結果說明。這將大大提高人工智慧獲取有效信息的效率,並將其有機的與已有的論文數據進行連結。


同時作者認為需要對整個論文出版框架進行重構,在每個環節都進行一定的改進和革新,以幫助研究人員應對整個社會對於科學界的迫切期待。


階段

建議

出版前

根據標準化術語(和字典)提取元數據

鼓勵提交兩個版本的稿件:人類可讀和機器可讀(不僅限於代碼)

確定最佳同行評議者並提供現有技術搜索(由編輯完成)

出版物

在其他文獻的背景下將新論文連結化,以便與相關工作進行「比較和對比」

認定為新穎或支持現有工作(增強對可複製性的信心)

突出顯示負面結果(提示同行不要再進入盲區)

出版後

促進發布後同行評論

對注釋進行解釋,並連結到較新的(相關)論文


作者認為要實現上述願景,需要一整套經過精心設計的基礎制度安排,以及供人類科學家和人工智慧進行協作的軟體環境,建立這樣的基礎設施將有助於全世界應對下一個需要全人類共同面對的戰略機遇或重大挑戰。

參考文獻:

1.https://phys.org/news/2020-09-pandemic-spawns-infodemic-scientific-literature.html

2.doi:10.1016/j.patter.2020.100101

相關焦點

  • 什麼是中國「新基建」?發展「新基建」有什麼用?
    「新基建」包括三大領域:信息基礎設施、融合基礎設施、創新基礎設施。其中,信息基礎設施主要是指基於新一代信息技術演化生成的基礎設施,比如,以5G、物聯網、工業網際網路、衛星網際網路為代表的通信網絡基礎設施,以人工智慧、雲計算、區塊鏈等為代表的新技術基礎設施,以數據中心、智能計算中心為代表的算力基礎設施等。
  • 百度地圖構建新基建「數字底座」近一年,這些產業已變模樣
    假設中國物流業每個包裹在路上的時間節省一分鐘,合起來就是個天文數字。800億新紀錄背後,物流業從汗水物流到智慧物流的巨變,不容忽視。一張地圖如何成為AI新基建的數字底座幾乎每個中國人都用過紙上的地圖。幾乎每個中國駕車者都用過手機上的百度地圖導航。
  • 新基建產品手冊:八大領域64頁超詳細分類整理
    新基建產品手冊:八大領域64頁超詳細分類整理 2020-05-10 15:06 來源:澎湃新聞·澎湃號·湃客
  • 人工智慧助新基建數位化轉型
    人工智慧對5G基站建設、特高壓、城際高速鐵路和城市軌道交通、新能源汽車充電樁、大數據中心、工業網際網路各新基建科技端領域具有重大促進作用;人工智慧與5G、大數據等技術結合,將帶動諸多行業快速發展,為很多領域數位化智能化轉型奠定基礎。本期刊發中國人工智慧學會副理事長、中南大學信息科學與工程學院蔡自興教授的觀點。作為新基建主要支撐的人工智慧技術,對國民經濟發展和新基建都起到巨大作用。
  • 中國移動研究院院長:新基建中,5G是「基」,AI是「智」
    中國移動研究院院長:新基建中,5G是「基」,AI是「智」 澎湃新聞記者 吳雨欣 2020-07-10 16:55 來源:澎湃新聞
  • 數字新基建下雲基礎架構的創新和未來
    2020年是特殊的一年,席捲全球的新冠疫情改變了人們的生活、生產方式,也為全球經濟發展帶來了諸多的不確定性。線下經濟廣受波及,線上卻異常繁榮,尤其是在線娛樂、在線教育、直播電商、遠程辦公等的快速崛起,更讓人們看到了數字經濟的潛力。一時間,擁抱數字經濟已然成為企業轉型求生的新機遇。如何抓住數位化機遇?又如何應對數位化帶來的諸多挑戰?
  • 數字金融與新基建 相輔相成的驅動關係
    正如金融是現代經濟的核心,數字金融亦是數字經濟的重要組成,新基建為數字經濟發展賦能,也為數字金融進一步發展提供了廣闊的市場和空間。   我國數字經濟規模從「十三五」初期的11萬億元增長到2019年的35.8萬億元,佔GDP比重36.2%,已經成為全球最大的數字經濟綜合體。
  • 新基建,是什麼?
    2020年4月1日,習近平總書記在浙江考察時強調:「要抓住產業數位化、數字產業化賦予的機遇,加快5G網絡、數據中心等新型基礎設施建設,抓緊布局數字經濟、生命健康、新材料等戰略性新興產業、未來產業,大力推進科技創新,著力壯大新增長點、形成發展新動能。」黨中央密集部署之下,市場開始熱捧,新型基礎設施建設(以下簡稱新基建)迎來風口。
  • 盛世量子 | 護航數字經濟發展 夯實新基建根基建設
    網際網路徹底的改變了人們的生活方式,特別是隨著5G、雲計算、人工智慧等的發展,更多前沿科技走進人們的生活。2020年初,發改委明確新基建定義和主要內容,賦予其新高度、新內涵,將數位化、智能化帶入發展快車道。新基建將驅動城市發展模式進行轉變,推動智慧城市建設進入新階段,新基建是數字經濟的強力支撐,同時也更需要網絡安全保駕護航。
  • 先進位造業集群企業專訪:布局5G+AI 繼遠軟體繪就數字新基建藍圖
    本期《易道》邀請安徽繼遠軟體有限公司黨委書記、董事長陳超做客節目,與大家聊聊繼遠軟體如何用好「新基建」之策,築牢創新「數字基礎」,為「新基建」建設提供繼遠力量。「繼遠軟體和中國聲谷合作的電力聲紋識別系統,用聲紋技術解決變壓器故障診斷問題,目前已經在電力系統得到了應用,該系統在電力行業內為首個,填補了行業空白。」陳超介紹。
  • 樊綱:新基建決定城市發展競爭力,是數字經濟發展的關鍵
    在「新基建」的推動下,中國新型智慧城市建設正在掀起新一輪的熱潮,將會為政府和企業帶來全新的發展圖景,創造更加豐富多彩的應用場景,也將給市民帶來更多便捷的體驗。12月2日,「智數廣州·進而有為」華為廣州城市峰會2020上,北京大學滙豐商學院教授、中國經濟體制改革研究會副會長樊綱以《城市化、數位化和新基建》為題發表演講,為建設智數廣州出謀劃策。
  • BAT爭相布局新基建,CIM引擎能為智慧城市數字孿生帶來什麼?
    用數位化重構建造,橢圓方程能實現嗎?定位於「數字建造工業軟體供應商」的橢圓方程,發布智慧城市全新戰略品牌AECITY和數字建造產品CIM Engine 3.0是為了什麼?答案是用數位化重構建造。在此基礎上,將人工智慧與大數據結合,積極參與到以數位化基礎設施為代表的「新基建」建設中。新基建廣闊的發展空間不言而喻,BAT已於今年年初爭相布局。
  • 廣州市首批73個數字新基建重大項目籤約
    1800億元投資發力數字新基建  新基建新動力,老城市新活力。5月8日上午,廣州舉行首批數字新基建重大項目籤約及揭牌活動,籤約項目共73個,總投資規模約1800億元。  記者從活動後舉行的廣州市第102場疫情防控復工復產新聞發布會(數字基建 雲聚廣州專題)獲悉,下一步,廣州將實施推進數字新基建發展三年行動計劃,在5G、人工智慧、工業網際網路、充電基礎設施四大新基建領域實施專項行動。
  • 新基建時代產業創新突圍的殺手鐧是什麼?這四位CEO給出了答案
    聽雲總裁趙宇辰表示,雖然今年有很大的挑戰,但是在數字新基建場景下,對公司業務有很大的促進。雲擴科技創始人兼CEO劉春剛表示,新基建帶來最大的利好就是,越來越多的企業關注提高數字能效。對於創業機會趙宇辰表示,,以後所有的實體,不管是2G還是2B,都是運營在數字系統之上。企業、政府也會投入大量的資金來做新基建,包括各地的稅務都在走數位化與智能化。所以有海量的機會,可能以前實體做的東西現在都會在線上數位化之上重新做一遍,所以機遇是非常非常大的。
  • 2020年「新基建·新機遇·新活力」新一代信息技術助力數字經濟...
    央廣網廣州12月25日消息(記者鄭澍 通訊員張莉)12月24日,在廣州市工業和信息化局的指導下,由廣州信息協會、廣州市工程勘察設計行業協會主辦的以「新基建·新機遇·新活力」為主題的新一代信息技術助力數字經濟發展高峰論壇在廣州舉行。
  • 數字新基建激發新動能 成都錦江區新增投資152億元
    人民網成都12月2日電 (朱虹)12月2日,成都市錦江區都市工業暨數字新基建建設應用推進會在春熙路舉行。會上,10個重點項目籤約,6 項戰略合作協議籤訂,新增投資152億元目前,成都錦江區瞄準都市工業產業集群,搶抓數字新基建新風口,推進會上發布《錦江區關於加快都市工業高質量發展的實施方案》、《錦江區數字新基建行動計劃(2020-2022) 》、《機會清單》和產業地圖。
  • 從「中國天眼」到「大腦圖像」,這些科研新基建都有它的身影
    在新數據時代加速到來的今天,數位化正在改變科研模式,與其他行業相比,數據在科研領域的生產要素屬性更加快速顯現。發改委今年首次明確了新基建的範圍,將支撐科學研究等具有公益性質的重大科技、科教基礎設施劃分為創新基礎設施,屬於新基建未來重點投入方向。
  • 「新基建」應堅持科學思維
    總的來看,「新基建」投資潛力巨大,能帶動產業鏈上下遊,為車聯網、智慧城市、AR/VR、數字經濟等新經濟、新業態提供發展基礎。根據相關機構測算,到2030年,5G將直接貢獻總產出和經濟增加值6.3萬億元和2.9萬億元,間接貢獻是10.6萬億元和3.6萬億元。
  • 醫療新基建浪潮下,我們為何看好這些醫療 AI 公司?
    另一方面,進入2020年,「新基建」的建設步伐開始加快。此前,北京、福建、河南、雲南、廣東、江蘇等多地已經發布2020年重大項目投資計劃清單。據不完全統計,目前各地關於「新基建」的投資計劃規模合計已超40萬億元。醫療和人們生活健康息息相關,「醫療+新基建」自然也受到特別關注。
  • 從「小步快跑」到「穩步跨越」,華為雲與計算在新基建時代鋪了怎樣...
    其中,僅南京市公布的新基建行動計劃,將以100個市級項目為重點,總體推進市區兩級總投資5454億的346個新基建和關聯產業項目加快建設,投資規模可觀。從中央到地方圍繞「新基建」,加快推動智能化、信息化經濟做大做強,讓高質量發展的步伐更實、成色更濃。數字經濟新動能的加速崛起,顯現了中國經濟的韌性和潛力。面對「新基建」所指的數字未來,我們該如正確認知?如何更好推進「新基建」?