原文標題: Adaptive Community Search in Dynamic Networks
地址: http://arxiv.org/abs/2011.05353
作者: Ioanna Tsalouchidou, Francesco Bonchi, Ricardo Baeza-Yates
摘要: 社區搜索是一個經過充分研究的問題,給定一個靜態圖和一組頂點查詢,就需要找到一個包含查詢頂點的內聚(或密集)子圖。在本文中,我們研究了時間動態網絡中的社區搜索問題。我們適應時間設置 emph network inefficiency的概念,該概念基於解決方案中所有頂點之間的成對最短路徑距離。為此,我們定義 emph 最短路徑路徑距離:由用戶定義的參數控制的時空維度的線性組合。因此,我們定義了 textsc 最小時間效率子圖問題,並證明它是 NPhard。我們開發了一種算法,該算法利用了將時態網絡仔細轉換為靜態有向圖和加權圖的方法,以及一些最新的近似算法來查找最小有向Steiner樹。最後,我們將框架概括為流式設置,在該流式設置中,含時圖的新快照持續不斷到達,並且我們的目標是為含時圖的滑動時間窗口對應的社區提供搜索解決方案。
原文標題: Detecting Social Media Manipulation in Low-Resource Languages
地址: http://arxiv.org/abs/2011.05367
作者: Samar Haider, Luca Luceri, Ashok Deb, Adam Badawy, Nanyun Peng, Emilio Ferrara
摘要: 社交媒體被故意用於惡意目的,包括政治操縱和虛假信息。大多數研究都集中在高資源語言上。但是,惡意行為者會在各個國家和語言(包括資源匱乏的語言)之間共享內容。在這裡,我們調查在資源匱乏的語言環境中是否可以檢測到惡意行為者,以及在何種程度上可以檢測到惡意行為者。我們發現,在2016年美國總統大選後,Twitter鎮壓了幹擾行動,這是他在他加祿語中發布的大量帳戶被暫停的原因。通過結合文本嵌入和遷移學習,我們的框架可以以有希望的準確性檢測在Tagalog中發帖的惡意用戶,而無需事先理解或培訓使用該語言的惡意內容。我們首先分別學習每種語言的嵌入模型,即高資源語言(英語)和低資源語言(塔加洛語)。然後,我們學習兩個潛在空間之間的映射以轉移檢測模型。我們證明了所提出的方法大大優於包括BERT在內的最新模型,並且在訓練數據非常有限的環境中(在處理檢測在線平臺中的惡意行為時的規範)設置具有明顯的優勢。
原文標題: Large sudden change measured in European and US COVID-19 death rates
地址: http://arxiv.org/abs/2011.05368
作者: Frank Van Bussel
摘要: 通過將Covid-19傳播的隔室ODE模型擬合到美國各州和歐洲國家的累積病例和死亡數據,我們發現在美國大部分地區,病例死亡率似乎降低了至少80%,而至少90%在歐洲大部分地區。這些變化比實證研究中所報告的變化更大,更快,例如,從2020年3月至2020年8月,紐約市醫院系統的道德下降了18%[1]。令人驚訝的是,我們報告的下降與其他模型參數(例如接觸率)或其他標準州/國家指標(例如人口密度,GDP和年齡中位數)沒有強相關性。幾乎所有減少量都發生在4月中旬至6月中旬之間,這出乎意料地與釋放許多州和國家的禁區導致新病例激增的時間相對應。研究了造成這種下降的幾種可能原因,例如治療方法的改善,戴口罩,出現新的病毒株以及感染患者的人口統計可能發生變化,但鑑於目前可獲得的證據,沒有任何一種方法令人信服。
原文標題: Closed-Form Solutions of the Fundamental Equation That Describes User Dynamics in Online Social Networks
地址: http://arxiv.org/abs/2011.05391
作者: T. Ikeya, Masaki Aida
摘要: 基於網絡波動方程的振蕩模型可以描述在線社會網絡中的用戶動態。用戶動態的基本方程式可以引入到振蕩模型中,以明確描述某些特定網絡結構產生的用戶動態的因果關係。此外,考慮到在線社會網絡的稀疏性,設計了一種新的基本形式的基本方程。在本文中,我們導出了新的基本方程的閉式解。此外,我們發現新的基本方程的閉合形式解可以生成原始波動方程的一般解。
原文標題: Polarization Model of Online Social Networks Based on the Concept of Spontaneous Symmetry Breaking
地址: http://arxiv.org/abs/2011.05393
作者: Masaki Aida, Ayako Hashizume, Chisa Takano, Masayuki Murata
摘要: 信息網絡的普及不僅使人們更容易訪問各種信息源,而且大大增強了個人傳播信息的能力。但是,不幸的是,在線社會網絡中的誹謗問題表明,不斷發展的信息網絡環境不一定支持社會上的相互理解。由於帶有特定偏見的信息僅分發給喜歡它的社區,因此加強了將社會劃分為各個對立的群體的能力。這種現象稱為極化。有必要理解極化的機制,以建立可以對抗極化的技術。本文介紹了一種基於自發對稱破壞概念的理解極化的基本模型。我們的出發點是描述在線社會網絡中用戶動態的振蕩模型。
原文標題: A New Model of Flaming Phenomena in Online Social Networks that Considers Resonance Driven by External Stimuli
地址: http://arxiv.org/abs/2011.05404
作者: Tomoya Kinoshita, Masaki Aida
摘要: 在線社會網絡中以火焰狀現象為代表的爆炸性用戶動態有時可能會對現實生活產生負面影響。為了及時採取措施防止在線燃燒現象,有必要對其定義特徵進行建模。基於描述網絡上用戶動態的振蕩模型,先前的工作表明,當表示網絡結構的矩陣的某些特徵值是非實數時,就會出現在線燃燒。本文考慮了由周期性外部刺激驅動的網絡共振,並提出了一個燃燒模型,即使所有矩陣的本徵值都是實數,該模型也可以燃燒。此外,我們描述了一種觀察在線燃燒預兆以觸發預防措施的理論框架。
原文標題: Challenges and Opportunities in Rapid Epidemic Information Propagation with Live Knowledge Aggregation from Social Media
地址: http://arxiv.org/abs/2011.05416
作者: Calton Pu, Abhijit Suprem, Rodrigo Alves Lima
摘要: 由於AI / ML模型不可預測,因此迅速發展的形勢(例如COVID-19大流行)是AI / ML模型的重大挑戰。大流行蔓延的最可靠指標是測試呈陽性的病例數。但是,測試既不完整(由於未測試的無症狀病例),也很晚(由於與初始接觸事件之間的滯後,症狀惡化和測試結果)。社交媒體可以通過更快,更高的覆蓋率來補充物理測試數據,但它們卻面臨著另一個挑戰:大量的噪音,錯誤信息和虛假信息。我們相信,只要滿足兩個條件,社交媒體就可以成為大流行的良好指標。第一個(真正的新穎性)是從無法預測的情況中刻畫新的,以前未知的信息。第二個(事實與虛構)是可證實事實與錯誤信息和虛假信息的區別。滿足這兩個條件的社交媒體信息稱為實時知識。我們將基於證據的知識獲取(EBKA)方法用於通過社交媒體資源與權威資源的集成來收集,過濾和更新實時知識。儘管數量有限,但是來自權威來源的可靠培訓數據可以過濾錯誤信息並刻畫真正的新信息。我們描述了實現EBKA的EDNA / LITMUS工具,將Twitter和Facebook等社交媒體與WHO和CDC等權威資源集成在一起,創建和更新了有關COVID-19大流行的實時知識。
原文標題: Emergency Incident Detection from Crowdsourced Waze Data using Bayesian Information Fusion
地址: http://arxiv.org/abs/2011.05440
作者: Yasas Senarath, Saideep Nannapaneni, Hemant Purohit, Abhishek Dubey
摘要: 這些年來,隨著城市化進程的發展,緊急事件的數量有所增加。這種模式使有限的資源使緊急服務不堪重負,需要優化響應流程。這部分是由於傳統的應急服務的「反應式」方法來收集有關事件的數據,在這種情況下,源將呼叫緊急號碼(例如美國的911),從而延遲並限制了潛在的最佳響應。 Waze之類的眾包平臺為開發快速,「主動」的方法提供了機會,可通過眾包生成的觀察報告收集有關事件的數據。但是,報告來源的可靠性和所報告事件的時空不確定性對這種主動方法的設計提出了挑戰。因此,本文提出了一種使用嘈雜的眾包Waze數據進行緊急事件檢測的新方法。我們提出了一種基於貝葉斯理論的有原則的計算框架,用於對人群生成的報告的可靠性及其跨時空和時間事件檢測的集成的不確定性進行建模。使用從Waze收集的數據以及美國田納西州納什維爾的官方報導的事件進行的廣泛實驗表明,我們的方法可以勝過F1評分和AUC的強基準。這項工作的應用提供了一個可擴展的框架,可以合併不同的噪聲數據源以進行主動的事件檢測,從而改善和優化我們社區中的應急響應操作。
原文標題: Intentonomy: a Dataset and Study towards Human Intent Understanding
地址: http://arxiv.org/abs/2011.05558
作者: Menglin Jia, Zuxuan Wu, Austin Reiter, Claire Cardie, Serge Belongie, Ser-Nam Lim
摘要: 一幅圖像價值一千個單詞,傳達的信息超出了其中的視覺內容。在本文中,我們研究了社交媒體圖像背後的意圖,旨在分析視覺信息如何促進人們對意圖的識別。為了實現這一目標,我們引入了一個意圖數據集Intentonomy,該數據集包含涵蓋各種日常場景的14K圖像。這些圖像用28種意向類別手動注釋,這些意向類別來自社會心理學分類法。然後,我們系統地研究常用的視覺信息(即對象和上下文)是否以及在多大程度上有助於人類的動機理解。根據我們的發現,我們進行了進一步的研究,以量化在訓練意圖分類器時參加對象和上下文分類以及以標籤形式的文本信息的影響。我們的研究結果定量和定性地揭示了視覺和文本信息在預測意圖時如何產生可觀察的效果。
原文標題: UTLDR: an agent-based framework for modeling infectious diseases and public interventions
地址: http://arxiv.org/abs/2011.05606
作者: Giulio Rossetti, Letizia Milli, Salvatore Citraro, Virginia Morini
摘要: 如今,由於SARS-CoV-2大流行,流行病建模越來越受到來自不同研究領域的研究人員的關注。確實,關於計算流行病學的大量文獻為分析研究和針對預測性和描述性情景描述的新穎模型的定義提供了堅實的基礎。為了簡化對擴散建模的訪問,在過去的十年中,已經提出了幾種編程庫和工具:但是,就我們所知,沒有一個明確地設計為允許其用戶將公共幹預集成到他們的模型中。在這項工作中,我們介紹了UTLDR,該框架可以模擬幾種公共幹預措施(及其組合)對流行過程的發展的影響。 UTLDR支持逐步設計隔離模型並通過複雜的交互網絡拓撲對其進行仿真。此外,它允許整合有關分析人群的外部信息(例如年齡,性別,地理分配和流動性模式點),並使用它來對設計模型進行分層和完善。引入框架後,我們提供一些案例研究來強調其靈活性和表達能力。
原文標題: Toward Edge-Centric Network Embeddings
地址: http://arxiv.org/abs/2011.05650
作者: Giuseppe Pirrò
摘要: 現有的網絡嵌入方法解決了學習低維節點表示的問題。但是,還可以從邊互連節點對的邊看到網絡。本文的主要目標是介紹以邊為中心的網絡嵌入。我們提出了一種稱為ECNE的方法,該方法代替直接計算節點嵌入,而是通過依賴線圖的概念結合邊加權機制來計算邊嵌入,以保留線圖中原始圖的動態。我們還提出了一種稱為ECNE-LP的鏈路預測框架,該框架給出了目標連結(u,v),該連結首先收集節點u和v之間的路徑,然後將邊直接嵌入這些路徑中,最後將它們匯總以預測a的存在連結。我們證明,ECNE和ECNE-LP都能為最新技術帶來好處。
原文標題: Disentangling Community-level Changes in Crime Trends During the COVID-19 Pandemic in Chicago
地址: http://arxiv.org/abs/2011.05658
作者: Gian Maria Campedelli, Serena Favarin, Alberto Aziani, Alex R. Piquero
摘要: 利用城市級時間序列進行的最新研究表明,在世界各地實施COVID-19圍堵政策後,幾起犯罪案件有所減少。這項工作使用芝加哥社區一級的數據,旨在加深我們對公共幹預如何在更精細的空間範圍內影響犯罪活動的理解。該分析依賴於兩步法。首先,它估計了芝加哥通過結構貝葉斯時間序列對四種犯罪類別(即爆竊,毆打,與毒品有關的犯罪和搶劫)採用的社會疏遠和就地安置政策對社區的因果影響。一旦模型檢測到趨勢變化的方向,幅度和顯著性,就可以使用Firth的Logistic回歸來調查與分析第一步中發現的具有統計意義的犯罪率下降相關的因素。統計結果首先表明,犯罪趨勢的變化因社區和犯罪類型而異。這表明,除了匯總模型的結果之外,還存在著以發散模式為特徵的複雜畫面。其次,回歸模型在與重大犯罪減少相關的相關因素上提供了混合的發現:跨犯罪的幾種關係具有相反的方向,人口是與重大犯罪穩定和積極相關的唯一因素。
原文標題: Heavy-tailed distribution of the number of publications within scientific journals
地址: http://arxiv.org/abs/2011.05703
作者: Robin Delabays, Melvyn Tyloo
摘要: 科學家社區的特點是他們需要在同行評審的期刊上發表文章,以避開著名格言的「滅亡」一面。因此,幾乎所有研究人員都撰寫了一些科學文章。學術出版物至少代表了對作為社會團體的科學界進行研究的兩個好處。首先,他們證明了科學家之間某種形式的關係(合作,指導,遺產等等),對確定和分析社會群體很有幫助。其次,它們中的大多數記錄在大型資料庫中,易於訪問,並且包含許多相關信息,從而簡化了科學界的定量和定性研究。除了從社會科學的觀點出發,理解推動知識發展的基本動力,尤其是科學出版物的發展,可以通過識別科學的好壞做法,有助於保持高水平的研究。 。在本手稿中,我們試圖通過對同行評審期刊中出版物的統計分析來增進這種理解。即,我們表明作者在給定期刊上發表的文章數量分布是重尾的,但其尾部比冪定律輕。此外,我們在數據中觀察到一些異常現象,這些異常現象指出了學術出版過程的潛在動態。
原文標題: Characterising and Detecting Sponsored Influencer Posts on Instagram
地址: http://arxiv.org/abs/2011.05757
作者: Koosha Zarei, Damilola Ibosiola, Reza Farahbakhsh, Zafar Gilani, Kiran Garimella, Noel Crespi, Gareth Tyson
摘要: 近年來,出現了一種新的廣告活動形式:涉及所謂的社交媒體影響者的那些活動。這些有影響力的人會接受金錢,以換取通過他們的社交媒體提要來推廣產品。儘管這構成了一種新的有趣的營銷形式,但它也引發了許多問題,尤其是與透明度和監管有關的問題。例如,有時可能不清楚哪些帳戶是正式影響者,或者什至構成影響者/廣告。這對於建立影響者的完整性並確保遵守廣告法規非常重要。我們收集了涵蓋數以千計的帳戶廣告產品的大規模Instagram數據集,並根據他們所覆蓋的用戶數量創建了一個分類。然後,我們對這些帳戶宣傳的產品類型,其潛在影響力以及從其關注者那裡獲得的參與度進行詳細分析。根據我們的發現,我們訓練機器學習模型以區分贊助內容和非贊助內容,並確定人們產生贊助帖子而沒有正式標記它們的情況。我們的發現為理解未被充分研究的在線影響者空間邁出了第一步,這可能對研究人員,營銷人員和決策者有用。
原文標題: The Role of the Crowd in Countering Misinformation: A Case Study of the COVID-19 Infodemic
地址: http://arxiv.org/abs/2011.05773
作者: Nicholas Micallef, Bing He, Srijan Kumar, Mustaque Ahamad, Nasir Memon
摘要: 專業人士的事實檢查被視為抵制錯誤信息的重要防禦手段。雖然事實檢查很重要且影響很大,但事實檢查的可見度可能有限,可能無法到達目標受眾,例如深陷兩極分化社區的人。在出現錯誤信息的平臺上使用的相關公民(即人群)可以在傳播事實檢查信息和應對錯誤信息的傳播方面發揮關鍵作用。為了探討這種情況,我們在Twitter平臺上進行了數據驅動的錯誤信息研究,重點研究了與COVID-19大流行相關的推文,分析了錯誤信息的傳播,專業事實檢查以及人群對流行誤導的反應關於COVID-19的聲明。在這項工作中,我們整理了一組旨在挑戰或反駁它們的虛假聲明和陳述的數據集。我們訓練了一個分類器來創建155468個與COVID-19相關的推文的新數據集,其中包含33237個虛假聲明和33413個反駁論點。我們的發現表明,專業事實核查推文的數量和範圍有限。相反,我們觀察到錯誤信息推文的激增會導致快速響應,並相應地增加了反駁此類錯誤信息的推文。更重要的是,我們在人群反駁推文的方式上發現了截然不同的差異,有些推文似乎是觀點,而另一些則包含具體證據,例如與知名來源的連結。我們的工作提供了一些見解,以理解一些用戶如何在社交平臺中有機地對付錯誤信息,以及他們在擴大專業事實檢查中所扮演的角色,這些見解可能會導致開發工具和機制,從而可以使有關公民有能力打擊錯誤信息。可以在此http URL中找到代碼和數據
原文標題: Influencing dynamics on social networks without knowledge of network microstructure
地址: http://arxiv.org/abs/2011.05774
作者: Matthew Garrod, Nick S. Jones
摘要: 基於社會網絡的信息活動可用於促進有益的健康行為和緩解兩極分化(例如,有關氣候變化或疫苗的問題)。基於網絡的幹預策略通常依賴於對網絡結構的全面理解。由於可用性和隱私問題,在很大程度上不可能或不希望獲得人口級別的社會網絡數據。獲得有關個人屬性(例如年齡,收入)的信息更容易,這些信息共同提供了個人的觀點及其社會網絡位置。使用基於統計力學的觀點形成模型,我們表明可以在不完全理解網絡結構的情況下有效地影響網絡動態。特別是,使用粗粒度網絡數據,外部協變量和狀態的點估計的影響策略都可以勝過基線模型。我們的工作提供了一種可擴展的方法來影響大圖上的Ising系統,並在存在環境(社交)場的情況下首次探索Ising影響問題。通過利用強環境場可以簡化網絡動力學控制的觀察,我們的發現為利用社會網絡理論的見解進行公共宣傳活動提供了可能性,而無需進行昂貴或侵入性的數據收集。
原文標題: Balancing conservative and disruptive growth in the voter model
地址: http://arxiv.org/abs/2011.05780
作者: Robert J. H. Ross, Walter Fontana
摘要: 我們關注的是增長的實施方式如何決定不斷增長的自組織過程中預期的狀態變化數量。考慮到這個問題,我們在一個一維增長的格子上研究了投票者模型的兩個版本。我們的主要結果斷言,通過平衡增長的保守力和破壞力,無論增長率趨於零還是極限,在發現吸收狀態之前狀態變化的預期數量都是相同的。這些結果說明了增長如何控制自我組織的成本,因此與增長活性物質的物理學有關。
原文標題: Small Survey Event Detection
地址: http://arxiv.org/abs/2011.05801
作者: Debanjan Datta
摘要: 有關使用Twitter進行事件檢測的小型調查。這項工作首先定義問題陳述,然後總結和整理不同的研究工作以解決問題。
原文標題: Linking OpenStreetMap with Knowledge Graphs — Link Discovery for Schema-Agnostic Volunteered Geographic Information
地址: http://arxiv.org/abs/2011.05841
作者: Nicolas Tempelmeier, Elena Demidova
摘要: 在諸如Wikidata和DBpedia之類的流行知識圖中刻畫的地理實體的表示形式通常是不完整的。 OpenStreetMap(OSM)是公開提供的自願性地理信息的豐富來源,具有補充這些表示形式的巨大潛力。但是,知識圖實體和OSM節點之間的身份連結仍然很少。由於缺少嚴格的架構以及OSM中用戶定義的節點表示的異構性,因此在這些設置中的連結發現問題特別具有挑戰性。在本文中,我們提出OSM2KG-一種新穎的連結發現方法,用於預測知識圖中的OSM節點與地理實體之間的身份連結。 OSM2KG方法的核心是一種新穎的OSM節點潛在表示,它可以在嵌入中刻畫語義節點的相似性。 OSM2KG採用這種潛在表示來訓練監督模型進行鏈路預測,並利用OSM和知識圖之間的現有連結進行訓練。我們在多個OSM數據集以及Wikidata和DBpedia知識圖中進行的實驗表明,OSM2KG可以可靠地發現身份連結。 OSM2KG明顯優於現有的基準和最新的鏈路發現方法,與性能最佳的基準相比,F1得分提高了22.45%。
原文標題: A model for the Twitter sentiment curve
地址: http://arxiv.org/abs/2011.05933
作者: Giacomo Aletti, Irene Crimaldi, Fabio Saracco
摘要: 由於Twitter的消息簡潔(特別適合政治口號)和消息的快速傳播,因此它是最常用的政治通信在線平臺之一。特別是當爭論激起用戶的情感時,Twitter上的內容將以極快的速度共享,因此,如果最重要的是研究推文情緒,以預測討論的發展和相對敘述的記錄。在本文中,我們提供了一個模型,該模型能夠再現與特定主題和時期相關的推文情緒的動態,並根據觀察到的過去對未來帖子的情緒進行預測。該模型是P 『olya缸的最新變體,在arXiv:1906.10951和arXiv:2010.06373中引入和研究,其特徵在於「局部」增強,即主要基於最新觀察結果的增強機制,預測平均值的隨機持續波動。特別地,後一個特徵能夠刻畫情緒曲線中的趨勢波動。儘管建議的模型非常通用,並且也可以在其他情況下使用,但是它已在多個Twitter數據集上進行了測試,並且與標準的P』olya urn模型相比,具有更高的性能。此外,在不同數據集上的不同表現突出了對公共事件的不同情感敏感性。
聲明:Arxiv文章摘要版權歸論文原作者所有,機器翻譯後由本人進行校正整理,未經同意請勿隨意轉載。本系列在公眾號「網絡科學研究速遞」(netsci)和個人博客進行同步更新。