本文由機器翻譯,僅供參考,感興趣請查閱論文原文
核心速遞
圖同構對於圖神經網絡有多難?;
流行病期間異質性疾病行為信息動態建模;
帶社會疏遠的SIR模型的平均場博弈分析;
COVID-19大流行數據中湧現的多項式增長趨勢及其與基於隔室模型的調和;
幹預措施對於第二高峰的高度貢獻並不相等;
使用簡單的流行病學模型對COVID-19大流行進行全局分析;
分組測試作為COVID-19流行病學監測的策略;
受限於社交疏遠的公共場所人群控制;
關於COVID-19建模;
控制COVID-19大流行:在ICU可持續性下平衡檢測策略和鎖定幹預措施;
有日常循環的結構化社會中的傳染病傳播動態;
CrisisBERT:用於危機分類和上下文危機嵌入的魯棒Transformer;
使用數字跟蹤對人類動力學和生活方式建模;
中立可能會很重要:巴西和美國的Airbnb、Booking和Couchsurfing評論的情感分析;
了解和檢測社交媒體中的危險言論;
ImpactCite:基於XLNet的引文影響分析方法;
具有公平約束的網絡欺凌檢測;
通過特定領域的預處理和BERT集成檢測Twitter上的不良藥物反應;
單車道道路上的交通信號燈引起的相變;
印度社會分層結構內職業流動性的決定因素;
模擬社會身份識別驅動的共識形成的自適應網絡模型;
音樂流媒體平臺上跳過行為的普遍性;
共同發展的信息生態系統的恢復力和彈性;
評論「針對聚類,分類和社區檢測的改進的互信息度量」;
使用機器學習技術在Twitter上獲取有關自然災害響應的公眾意見;
圖同構對於圖神經網絡有多難?
原文標題:
How hard is graph isomorphism for graph neural networks?
地址:
http://arxiv.org/abs/2005.06649
作者:
Andreas Loukas
摘要:圖神經網絡的特點是它們能夠區分輸入的同構類。這項研究得出了消息傳遞模型(MPNN)中圖同構的第一個硬度結果。MPNN涵蓋了當今使用的大多數圖神經網絡,並且當節點具有獨特功能時,它在極限方面是通用的。該分析依賴於引入的通信容量度量。容量衡量網絡節點在前向傳遞期間可以交換多少信息,並取決於體系結構的深度,消息大小,全局狀態和寬度。結果表明,MPNN的容量需要隨著節點數量的增加而線性增長,以便網絡可以區分樹,而對於一般的連通圖則可以平方地區分樹。至關重要的是,導出的邊界不僅適用於最壞情況,而且適用於所有輸入的一部分。一項涉及12個不同難度任務和420個網絡的實證研究表明,實際性能與理論預測之間具有很強的一致性。
流行病期間異質性
疾病行為信息動態建模
原文標題:
Modeling the heterogeneous disease-behavior-information dynamics during epidemics
地址:
http://arxiv.org/abs/2005.07012
作者:
Yang Ye, Qingpeng Zhang, Zhongyuan Ruan, Zhidong Cao, Qi Xuan, Daniel Dajun Zeng
摘要:傳染病的傳播取決於人們之間的社會網絡以及人們在暴露於該疾病之前所採取的保護措施。大眾媒體在使公眾意識到這種疾病及其傳播性和嚴重性方面發揮著關鍵作用。出於對人群對傳染病暴發的反應中異質風險感知的重要性的啟發,我們提出了一種異質三層網絡模型,即易感暴露-傳染病-恢復未意識到-保護(SEIR-UAP)模型,其中人們對疾病的脆弱性受意識信息傳播,預防行為改變和傳染病傳播過程的影響。我們發現(a)對疾病的了解在預防疾病暴發中起著核心作用; (b)我們需要合理比例的「反應過度」以有效控制疾病暴發; (c)潛伏期更長,恢復率更高的疾病更容易控制,因為信息傳播和行為改變的過程可以幫助人們為即將暴露的疾病做好準備; (d)在無症狀的情況下控制疾病更加困難。結果提供了證據,表明大眾媒體不應淡化疾病的傳播性和嚴重性,以使公眾能夠儘快意識到這種疾病。
帶社會疏遠的
SIR模型的平均場博弈分析
原文標題:
Mean-Field Game Analysis of SIR Model with Social Distancing
地址:
http://arxiv.org/abs/2005.06758
作者:
Samuel Cho
摘要:正如當前的COVID-19疫情表明的那樣,疾病的流行是一個複雜的問題,必須通過正確的公共政策加以解決。決策者的主要工具之一是控制人群之間的接觸率,通常被稱為社會疏遠,以減少疾病的傳播。我們提出了一個均場博弈模型,該模型的每個人都選擇一種動態的聯繫策略,既要權衡聯繫的效用,又要考慮接觸帶來的感染風險。我們計算並比較平均場均衡(MFE)策略,該策略假設個人為了最大程度地發揮自己的效用而自私行事,並與社會最優策略(即使總體總效用最大化的策略)進行比較。我們證明,被感染者總是想與社會上最理想的接觸水平進行更多接觸,這增加了減少被感染者接觸的需求(例如,隔離,病假)。此外,考慮到激勵人們改變自私策略的成本,我們還計算了社會最優策略。我們發現,如果我們施加有限的資源,那麼在流行病的高峰期過去之後,遏制感染者的接觸就變得更加重要。最後,我們計算該系統的無政府狀態的價格,以了解在什麼條件下MFE和社會最優策略之間會出現較大差異,這是公共政策最有效的時候。
COVID-19大流行數據中
湧現的多項式增長趨勢
及其與基於隔室模型的調和
原文標題:
Emerging Polynomial Growth Trends in COVID-19 Pandemic Data and Their Reconciliation with Compartment Based Models
地址:
http://arxiv.org/abs/2005.06933
作者:
Katarina Bodova, Richard Kollar
摘要:我們研究了2020年1月-2020年5月在119個國家/地區爆發的COVID-19大流行的報導數據。我們觀察到,各個國家的活躍病例的時間序列(確診感染總數與報告的死亡人數和治癒病例總數的總和之差)與多項式增長有很強的一致性,在流行後期具有多項式增長和指數衰減的組合。我們的結果也根據流行病的隔間類型數學模型制定。在這些模型中,表徵晚期流行病態的普遍標度可以解釋為相對繁殖數 R_0 的代數衰減為 T_M / t ,其中 T_M 是常數, t 是流行病爆發的持續時間。我們展示了我們的發現如何可用於改善對已報告的大流行數據的預測並估計一些流行病參數。請注意,儘管該模型與報告的數據顯示出很好的一致性,但我們並未對大流行的實際規模做出任何聲明,因為所觀察到的報告數據與人群中感染總數之間的關係仍然未知。
幹預措施對於第二
高峰的高度貢獻並不相等
原文標題:
Not all interventions are equal for the height of the second peak
地址:
http://arxiv.org/abs/2005.06880
作者:
Tim Hulshof, Joost Jorritsma, Júlia Komjáthy
摘要:在本文中,我們對有限空間和非空間網絡模型上具有臨時免疫力的COVID-19等流行病的傳播進行了模擬研究。特別是,我們假設該流行病在無標度網絡上隨機傳播,並且該網絡中的每個受感染個體在其感染期結束後都將獲得臨時免疫。臨時免疫期結束後,該個體再次變得容易感染該病毒。當基本的聯繫網絡嵌入歐氏幾何時,我們對旨在控制流行病傳播的三種不同幹預策略進行建模:社交距離,旅行限制和每個節點的最大社交聯繫數量限制。我們的第一個發現是,在有限網絡上,足夠長的平均免疫周期會導致在第一個高峰期後大流行病的滅絕,類似於「群免疫」的概念。對於每個模型,都有一個臨界的平均抗擾長度 L_c ,在該長度以上會發生這種情況。我們的第二個發現是,所有三種幹預措施均能使第一個高峰(旅行限制最有效)變平,並降低臨界免疫力長度 L_c ,但會延長疫情。但是,當平均抗幹擾長度 L 短於 L_c 時,平坦的第一個峰的價格通常會高出第二個峰:為了限制最大接觸數,第二個峰可能高達1/3是第一個峰值的兩倍,是沒有幹預時的兩倍。第三,幹預將振蕩引入系統中,並且幾乎在所有情況下,達到平衡的時間都更長。我們得出結論,基於網絡的流行病模型可以顯示出連續隔間模型無法捕獲的各種行為。
使用簡單的流行病學模型對
COVID-19大流行進行全局分析
原文標題:
Global analysis of the COVID-19 pandemic using simple epidemiological models
地址:
http://arxiv.org/abs/2005.06742
作者:
J.E. Amaro, J. Dudouet, J.N. Orce
摘要:在這項工作中使用了幾種分析模型來描述冠狀病毒(COVID-19)引起的死亡病例的演變。死亡或「 D」模型是SIR(易感感染恢復)模型的簡化版本,該模型假定隨著時間的推移沒有恢復,並允許對傳輸動力學方程進行解析求解。可以擴展D模型來描述各種感染點,這可以解釋最初的大流行(D1),封鎖(D2)和其他影響(Dn)。在一些國家(中國,西班牙,義大利,法國,英國,伊朗,美國和德國),COVID-19大流行的演變顯示出與D模型趨勢相一致的行為,其特徵是死亡病例迅速增加緩慢下降,這受鎖定效果的早期性和效率影響。這些結果與使用帶參數化解決方案的擴展SIR模型和更複雜的蒙特卡洛網格模擬所得出的更準確的計算結果相一致,這些模擬預測了相似的趨勢,並表明了具有通用參數的大流行的共同演變。
分組測試作為COVID-19
流行病學監測的策略
原文標題:
Group testing as a strategy for the epidemiologic monitoring of COVID-19
地址:
http://arxiv.org/abs/2005.06776
作者:
Vincent Brault, Bastien Mallein, Jean-Francois Rupprecht
摘要:我們建議用於RT-qPCR診斷的樣本池在COVID-19流行病學研究中的應用。考慮到稀釋單個樣本所產生的假陰性,我們的論點表明,分組檢測可以準確估算出該疾病在人群中的流行程度,並能在相連社區中及早發現流行病,同時保留了用於進一步大規模檢測的檢測。人口。
受限於社交疏遠的公共場所人群控制
原文標題:
Crowd Control in Plazas Constrained to Social Distancing
地址:
http://arxiv.org/abs/2005.07038
作者:
Álvaro González García, James L. Martín R., Alessio Caciagli
摘要:我們根據WHO推薦的COVID-19大流行爆發後的措施,提出了一種簡單而通用的方法來計算受限於社交疏遠的公共場所的最大容量。該方法假定人與人之間的最小距離為兩米,並在四個實際場所中進行了測試。此外,如果發生公共事件(例如市場或音樂會),我們估計公共空間的容量。我們認為,我們的方法將直接為所謂的「新常態」中的人群控制提供指導,這是未來更準確發展的第一步。
關於COVID-19建模
原文標題:
On COVID-19 Modelling
地址:
http://arxiv.org/abs/2005.07004
作者:
Robert Schaback
摘要:這一貢獻通過相對簡單的數學和數值方法分析了COVID-19爆發。最終目標是使用可靠的技術預測每個國家的疫情暴發高峰。這是由標準SIR模型激發並與約翰·霍普金斯大學提供的標準數據保持一致的算法完成的。為了為未註冊的感染者重建數據,該算法使用感染死亡率的當前值以及特定形式的恢復率的數據驅動估計。其他所有要素也都是數據驅動的。提供了預測的各種示例以用於說明。
控制COVID-19大流行:
在ICU可持續性下平衡
檢測策略和鎖定幹預措施
原文標題:
COVID-19 pandemic control: balancing detection policy and lockdown intervention under ICU sustainability
地址:
http://arxiv.org/abs/2005.06526
作者:
Arthur Charpentier, Romuald Elie, Mathieu Laurière, Viet Chi Tran
摘要:在這裡,我們考慮一個擴展的SIR模型,其中包括最近發生的COVID-19暴發的幾個特徵:特別是可以檢測到(+)或未檢測到(-)的感染者和康復者,並且我們還整合了重症監護室的功能。我們的模型可以使用鎖定和檢測幹預槓桿對流行病控制的最佳策略進行易於量化的定量分析。通過基於COVID-19文獻的參數規範,我們考慮了大流行的衛生和經濟成本之間的微妙權衡以及ICU的有限容量水平,研究了各種數量對最佳策略的敏感性。我們將最佳鎖定策略確定為連續四個階段構成的幹預措施:首先是快速而強大的鎖定幹預措施,以阻止傳染病的指數增長;第二個短暫的過渡階段,以減少病毒的流行;第三,長期使用,具有足夠的ICU容量和穩定的病毒流行率;最終隨著病毒的消失恢復了正常的社交互動。我們還提供增加ICU能力的最佳幹預措施,並優化檢測感染性和免疫性個體的工作量。
有日常循環的結構化
社會中的傳染病傳播動態
原文標題:
Spreading dynamics of infectious diseases on structured society with daily cycles
地址:
http://arxiv.org/abs/2005.06658
作者:
Kenichi Nakazato, Masanori Takano
摘要:我們面臨著一個共同的嚴重問題,即傳染病,並試圖抑制感染的擴散。我們需要減少相互接觸以減少感染的機會,但這也意味著經濟活動的損失。在我們的社會中,這種折衷是不可避免的,因為到目前為止,我們仍然需要直接的溝通和通勤。本文的重點是我們直接接觸的社會結構。我們使用人工社會模型研究傳播過程,其中每個主體商每天都有一個周期,然後每天上班回家。同時,感染沿著SIR模型傳播。我們顯示,通過某些結構,可以同時實現慢速感染和短途通勤,反之亦然。實現這些特徵的最有效因素是社會的模塊化。在高度模塊化的社會中,特工住在指定的辦公室周圍,但在非模塊化的社會中,特工通勤到他們的辦公室很長一段距離,並且會很快被感染。第一個感染點是特徵的另一個因素。如果第一次感染發生在辦公室附近,則感染的傳播速度會變慢。相反,如果第一個發生在遠離辦公室的地方,感染可能會很快。我們展示了一種設計原則,高度模塊化和稀疏分布的辦公室,以實現良好社會,並討論了我們所居住的現實社會中可能的解決方案。
CrisisBERT:用於危機分類和
上下文危機嵌入的魯棒Transformer
原文標題:
CrisisBERT: Robust Transformer for Crisis Classification and Contextual Crisis Embedding
地址:
http://arxiv.org/abs/2005.06627
作者:
Junhua Liu, Trisha Singhal Lucienne T.M. Blessing, Kristin L. Wood, Kwan Hui Lim
摘要:對自然災害,恐怖襲擊和流行病等危機事件進行分類是至關重要的任務,它可以產生早期信號,並通知有關各方採取自發行動以減少總體損失。儘管專業機構可以預測自然災害等危機,但某些事件首先是平民發出的信號,例如最近發生的COVID-19大流行。諸如Twitter之類的社交媒體平臺經常通過大量信息交換來公開此類危機的第一手信號,每天發布的推文超過十億條。先前的工作提出了使用常規機器學習和神經網絡模型進行的各種危機嵌入和分類。但是,沒有作品使用基於注意力的最先進的深度神經網絡模型(例如,變形金剛和文檔級上下文嵌入)來執行危機嵌入和分類。這項工作提出了CrisisBERT,這是一個基於端到端基於變壓器的模型,用於兩個危機分類任務,即危機檢測和危機識別,該模型在準確性和f1分數上顯示出可喜的結果。所提出的模型還展示了優於基準的魯棒性,因為它顯示了邊際性能的折衷,同時從6個事件擴展到36個事件,僅增加了51.4%的數據點。我們還提出了Crisis2Vec,這是一種用於危機嵌入的基於注意力的文檔級上下文嵌入體系結構,與傳統的危機嵌入方法(如Word2Vec和GloVe)相比,其性能更高。據我們所知,我們的工作是首先提出在文獻中使用基於變壓器的危機分類和文檔級上下文危機嵌入技術。
使用數字跟蹤對人類
動力學和生活方式建模
原文標題:
Modeling Human Dynamics and Lifestyle Using Digital Traces
地址:
http://arxiv.org/abs/2005.06542
作者:
Sharon Xu, Steven Morse, Marta C. González
摘要:人類行為驅動著一系列複雜的社會,城市和經濟系統,但是在個人層面上了解其結構和動態仍然是一個懸而未決的問題。從信用卡交易到通信數據,人的行為似乎表現出由任務優先級和周期性驅動的活動爆發,但是,當前的研究並未提供捕獲這些機制的生成模型。我們提出了一個多元的周期性霍克斯過程(MPHP)模型,該模型在個人層面上捕獲了人類活動的時間集群,不同活動的相互依存結構和共同激勵以及每周節律的周期性影響。我們還為使用最大後驗期望最大化的模型提供了可擴展的參數估計技術,該技術還提供了潛在變量的估計,揭示了個人行為模式的分支結構。我們將該模型應用於信用卡交易的大型數據集,並證明了MPHP在非均質的Poisson模型和LDA方面在事件間時間分布和活動預測任務的統計擬合方面均勝過非均質模型。
中立可能會很重要:
巴西和美國的Airbnb、Booking
和Couchsurfing評論的情感分析
原文標題:
Neutrality May Matter: Sentiment Analysis in Reviews of Airbnb, Booking, and Couchsurfing in Brazil and USA
地址:
http://arxiv.org/abs/2005.06591
作者:
Gustavo Santos, Vinicius F. S. Mota, Fabricio Benevenuto, Thiago H. Silva
摘要:信息和通信技術推動了名為共享經濟的現象的興起,這種現象代表人們之間的活動,並通過在線平臺進行協調,以獲取,提供或共享對商品和服務的訪問。在共享經濟的託管服務中,主機和來賓之間通常會進行私人聯繫,這可能會影響用戶做出負面評論的決定,因為負面評論會損害所提供的服務。為了評估此問題,我們收集了來自兩個共享經濟平臺Airbnb和Couchsurfing的評論,以及一個針對巴西和美國一些城市的,主要與酒店(傳統經濟)合作的平臺Booking.com的評論。通過情感分析,我們發現共享經濟中的評論往往比傳統經濟中的評論更為積極。正如在這項研究中對志願者進行的實驗所暗示的那樣,這可能代表了那些系統中的問題。此外,我們討論了如何利用獲得的結果來幫助改善用戶的決策。
了解和檢測社交媒體中的危險言論
原文標題:
Understanding and Detecting Dangerous Speech in Social Media
地址:
http://arxiv.org/abs/2005.06608
作者:
Ali Alshehri, El Moatez Billah Nagoudi, Muhammad Abdul-Mageed
摘要:社交媒體傳播已成為現代社會日常活動的重要組成部分。因此,確保社交媒體平臺的安全性是必要的。在線環境中使用諸如物理威脅之類的危險語言雖然很少見,但仍然非常重要。儘管已在檢測攻擊性和仇恨性語言的相關問題上進行了幾項工作,但以前從未以任何重要方式處理過危險的言論。基於這些觀察,我們報告了我們為建立危險語音標記數據集所做的努力。我們還利用我們的數據集來開發高效模型來檢測危險內容。我們的最佳模型在宏觀F1上的表現為59.60%,明顯優於競爭基準。
ImpactCite:
基於XLNet的引文影響分析方法
原文標題:
ImpactCite: An XLNet-based method for Citation Impact Analysis
地址:
http://arxiv.org/abs/2005.06611
作者:
Dominique Mercier, Syed Tahseen Raza Rizvi, Vikas Rajashekar, Andreas Dengel, Sheraz Ahmed
摘要:引文在理解科學文獻的影響方面起著至關重要的作用。通常,對引文進行定量分析,而對引文進行定性分析可以揭示對科學人工製品在社區中產生的影響的更深刻見解。因此,引文影響分析(包括情感和意圖分類)使我們能夠量化引文的質量,最終可以幫助我們估算排名和影響。本文的貢獻是雙重的。首先,我們對諸如BERT和ALBERT之類的著名語言模型以及幾種流行的網絡進行基準測試,以完成情感和意圖分類任務。其次,我們提供ImpactCite,這是基於XLNet的引文影響分析方法。所有評估均在一組公開可用的引文分析數據集上進行。評估結果表明,ImpactCite在引用意圖和情感分類方面均達到了最新水平,在F1評分中的表現優於現有方法,分別為3.44%和1.33%。因此,對於這兩個任務,我們都強調ImpactCite(基於XLNet的解決方案),以更好地理解引用的影響。為了做出CSC-Clean語料庫,已經進行了更多的努力,CSC-Clean語料庫是一種用於引用情緒分類的乾淨可靠的數據集。
具有公平約束的網絡欺凌檢測
原文標題:
Cyberbullying Detection with Fairness Constraints
地址:
http://arxiv.org/abs/2005.06625
作者:
Oguzhan Gencoglu
摘要:網絡欺凌是當今數字社會中在線社交互動中普遍存在的不利現象。儘管許多計算研究都集中在增強機器學習算法的網絡欺凌檢測性能上,但提出的模型往往會承載並加強意想不到的社會偏見。在本研究中,我們嘗試回答「是否可以通過指導公平性約束下的模型訓練來減輕網絡欺凌檢測模型的意外偏見?」的研究問題。為此,我們提出了一種模型訓練方案,該方案可以採用公平約束,並使用不同的數據集來驗證我們的方法。我們證明,可以在不損害模型質量的情況下成功緩解各種類型的意外偏差。我們相信,我們的工作有助於為網絡社會健康尋求公正,透明和符合道德的機器學習解決方案。
通過特定領域的預處理和BERT
集成檢測Twitter上的不良藥物反應
原文標題:
Detecting Adverse Drug Reactions from Twitter through Domain-Specific Preprocessing and BERT Ensembling
地址:
http://arxiv.org/abs/2005.06634
作者:
Amy Breden, Lee Moore
摘要:社交媒體中不良藥物反應(ADR)檢測的自動化將徹底改變藥物警戒的做法,支持藥物監管者,製藥行業和公眾確保日常實踐中規定的藥物安全。繼2019年8月健康社交媒體挖掘(SMM4H)應用研討會和共享任務的已出版議事日程之後,我們旨在開發一種深度學習模型來對包含藥物提及的Twitter推文中的ADR進行分類。我們的方法涉及微調 BERT_ LARGE 和兩個特定於域的BERT實現,即 BioBERT 和 Bio + ClinicalBERT ,應用特定於域的預處理器,並開發最大預測集合方法。我們的最終模型在 F_1 得分(0.6681)和召回率(0.7700)上均表現出一流的性能,勝過了SMM4H 2019和迄今為止的評估後提交的所有模型。
單車道道路上的交通信號燈引起的相變
原文標題:
Phase transition induced by traffic lights on a single lane road
地址:
http://arxiv.org/abs/2005.06679
作者:
A. Chacoma, M. N. Kuperman, G. Abramson
摘要:在這項工作中,我們通過提出一個基於蜂窩自動機的交通模型來研究交通燈系統對單車道道路流量的影響,該模型還包括行為方面的考慮。通過研究車輛密度的變化和卡紙的發生,我們專注於系統的宏觀表徵。在這種情況下,我們觀察並描述了自由流動和阻塞狀態之間的相變。這種過渡是由停在交通信號燈處的車輛引起的不穩定性引起的。此外,我們分析了這些不穩定性對發生臨界轉變的車輛臨界密度的影響,該臨界密度取決於兩個參數:(i)車輛流入,(ii)駕駛員的行為。對於後者,我們觀察到關於駕駛員行為的交通燈擾動反饋可以將系統引導至不同的場景,對此也進行了分析。
印度社會分層結構內
職業流動性的決定因素
原文標題:
Determinants of occupational mobility within the social stratification structure in India
地址:
http://arxiv.org/abs/2005.06802
作者:
Vinay Reddy Venumuddala
摘要:在這項研究中,我們利用經驗觀察到的職業分層模式,以識別教育與個人的社會流動性之間的關係-後者通過個人職業與家庭傳統利基職業之間的社會距離來近似。我們的研究借鑑了Lambert等人(2018)提出的一種新穎的職業網絡建設,並進行了少許調整,以使用印度背景下的橫斷面家庭調查從經驗上確定社會分層模式。為了研究的目的,我們使用IHDS-2數據集。
模擬社會身份識別驅動的
共識形成的自適應網絡模型
原文標題:
An Adaptive Networks Model to Simulate Consensus Formation Driven by Social Identity Recognition
地址:
http://arxiv.org/abs/2005.06887
作者:
Kaiqi Zhang, Zinan Lv, Haifeng Du, Honghu Zou
摘要:社會系統中個體狀態的共識模型已經成為物理學文獻中最近研究的主題。我們在社會認同理論的框架下研究網絡結構如何與個體狀態協同發展。並且我們提出了一種自適應網絡模型,通過評估個體之間的同質性來實現個體的狀態共識或局部結構調整。具體來說,相似性閾值在不同初始條件下會顯著影響網絡的演化,因此會出現明顯的群落結構和兩極分化。更重要的是,存在著一個過渡階段的關鍵點,網絡可能會演變成一個重要的社區結構和狀態一致的群體。
音樂流媒體平臺上跳過行為的普遍性
原文標題:
The universality of skipping behaviours on music streaming platforms
地址:
http://arxiv.org/abs/2005.06987
作者:
Jonathan Donier
摘要:最近在音樂流媒體平臺上對跳躍行為的研究表明,給定歌曲的跳躍特徵(即,作為歌曲中時間的函數的跳躍率的度量)可以被視為歌曲的某些固有特徵。,就時間和地理區域而言,它既非常具體又非常穩定。在本文中,我們通過引入一個簡單的跳躍行為模型使這一分析更進一步,在該模型中,給定歌曲的跳躍特徵被視為對其中發生的少量事件的響應。特別是,它使我們能夠準確識別觸發跳過響應的事件的時間,以及跳過每個這些事件而跳過的用戶比例。引人注目的是,由單個事件觸發的響應似乎遵循在歌曲,體裁,設備和收聽上下文之間一致的時間特徵,這表明人們以普遍的方式對音樂驚喜做出反應。
共同發展的信息
生態系統的恢復力和彈性
原文標題:
Resilience and elasticity of co-evolving information ecosystems
地址:
http://arxiv.org/abs/2005.07005
作者:
María J. Palazzi, Albert Solé-Ribalta, Violeta Calleja-Solanas, S andro Meloni, Carlos A. Plata, Samir Suweis, Javier Borge-Holthoefer
摘要:人類的感知和認知能力是有限的資源。如今,在信息便宜的時代(廉價生產,操縱,傳播),這種認知瓶頸轉化為競爭者(個人,機構等)可見度的過度競爭。相同的社交交流動機(可見性)也促使演員與特定的模因相互互動,以尋求信息的病毒性。反過來,內容是由選擇性壓力驅動的,即持久和廣泛傳播的機會緊密地受到通信環境變化的影響。儘管存在所有這些複雜性,但我們在這裡顯示出,信息生態系統中用戶-模因交互的底層體系結構,顯然是混亂且嘈雜的,實際上是向新興模式演變的,讓人聯想到自然生態系統中的模式。具體而言,我們通過對大量數據流的經驗分析表明,通信網絡在結構上具有彈性,即響應於環境擾動(例如異常事件)而從模塊化架構變為嵌套式架構變化。然後,我們提出了一個以生態學為靈感的建模框架,揭示了引起觀察到的動態重組的精確機制。最後,通過數值模擬,該模型可以預測-並且數據證實-用戶為獲得可見性而進行的奮鬥促使網絡重新平衡為一個非常受限制的組織:自相似嵌套安排的出現。
評論「針對聚類,分類和
社區檢測的改進的互信息度量」
原文標題:
Comment on 「Improved mutual information measure for clustering, classification, and community detection」
地址:
http://arxiv.org/abs/2005.07007
作者:
Zhong-Yuan Zhang
摘要:最近的一篇文章提出減少相互信息,以評估聚類,分類和社區檢測。這樣做的動機是,在某些情況下,尤其是當所考慮的兩個部門之間的集群數量不同時,標準歸一化互信息(NMI)可能會給出與直覺相反的答案。動機是有道理的。但是,本文中給出的示例並不準確,此注釋討論了原因。此外,該評論還憑經驗表明減少的互信息無法解決NMI的困難,甚至帶來更多的困難。此評論還通過經驗證明了Kappa的必要性。
使用機器學習技術在Twitter上
獲取有關自然災害響應的公眾意見
原文標題:
Mining Public Opinion on Twitter about Natural Disaster Response Using Machine Learning Techniques
地址:
http://arxiv.org/abs/2005.07019
作者:
Lingyu Meng, Zhijie Sasha Dong, Lauren Christenson, Lawrence Fulton
摘要:隨著Internet的發展,社交媒體已成為發布災難相關信息的重要渠道。分析文本中隱藏的態度,即所謂的情感分析,對於政府或救濟機構提高災難響應效率至關重要,但尚未引起足夠的重視。本文旨在通過重點調查公眾對災難響應的態度並分析在救災過程中有針對性的救災物資來填補這一空白。研究包括四個步驟。首先,本文在抓取Twitter數據時實現了Python,然後,我們通過這些有意見的文本對公共感知器進行了定量評估,這些文本包含諸如對有向救災物資的需求,對災難響應的滿意度以及對公眾的恐懼之類的信息。創建了帶有情感標籤的自然災害數據集,其中包含有關美國自然災害的49,816個Twitter數據。其次,本文提出了用於情感預測的八個機器學習模型,這是用於分類問題的最受歡迎的模型。第三,通過各種指標對這些模型進行比較,本文還從模型參數和輸入數據結構的角度討論了這些模型的優化方法。最後,從分析不同自然災害期間的輿論變化以及理解相同災害與時間序列之間的關係的角度研究了一組現實世界的實例。本文的結果證明了所提出的研究方法的可行性和有效性,並為救濟機構提供了更好的災難響應見解。
來源:網絡科學研究速遞
編輯:張爽
聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網絡科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。
近期網絡科學論文速遞
居家令對SARS-CoV-2傳播影響的因果估計 | 網絡科學論文速遞24篇
人類行動網路中的空間超級傳播者和超級敏感性 | 網絡科學論文速遞32篇
圖上的機器學習:模型和綜合分類法 | 網絡科學論文速遞14篇
使用人類移動數據量化COVID-19在中國大陸的經濟影響 | 網絡科學論文速遞18篇
利用夜光和空氣數據測算COVID-19對中國人口活動的影響 | 網絡科學論文速遞16篇
加入集智,一起複雜!
點擊播放 GIF 0.2M
集智俱樂部QQ群|877391004
商務合作及投稿轉載|swarma@swarma.org
◆ ◆ ◆
搜索公眾號:集智俱樂部
加入「沒有圍牆的研究所」
讓蘋果砸得更猛烈些吧!