Nature:FB和推特的數據是如何革新社會科學,改變世界的?

2020-06-28 大數據文摘
Nature:FB和推特的數據是如何革新社會科學,改變世界的?

大數據文摘出品

來源:nature

編譯:張睿毅


2007年,一群有野心的科學家召集了一次會議,討論新興的社會科學數據處理的藝術。他們想運用自己的技能來改變世界。在演講中,麻薩諸塞州劍橋市哈佛大學的政治學家加裡·金(Gary King)說,數字信息的泛濫「將使人們有可能了解更多有關社會的知識,並最終開始解決(實際上是解決)影響人類富足的主要問題」。


那時,已經有少量的計算社會科學研究完成發表。2006年的一項研究通過創建一個由14,341人使用的人工在線音樂市場,研究了社會影響力對音樂流行的作用。參與者選擇了要下載的歌曲,有時帶有或不帶有有關這些歌曲在其他市場用戶中的流行程度的信息。


研究發現,歌曲的受歡迎程度越來越難以預測用戶受他人行為的影響,這提供了一種為什麼難以預測不可控的成功的解釋。


Nature:FB和推特的數據是如何革新社會科學,改變世界的?

來自盧安達150萬用戶的手機數據有助於推斷出部分財富和貧困(較黑暗的地區更加貧困)。


兩年後,一項研究分析了六個月內100,000名手機用戶的移動情況,研究發現人們出行模式簡單且高度重複。作者可以計算在任何特定位置找到個人的可能性,並建議確定社區中出行方式的相似性可以幫助進行城市規劃,了解疾病的傳播或為緊急情況做準備。


同年,科技雜誌《連線》(Wired)發表了一篇文章,認為大數據時代將標誌著整套科學理論的終結。儘管被廣泛批評為過於簡單化,但該文章還是觸動了研究者的神經:十多年後,社會科學家多次援引《連線》(Wired)文章,以表明社會科學理論的相關性正在受到攻擊


但是大數據的趨勢只增不減。對於費城賓夕法尼亞大學的社會學家鄧肯·瓦茨(Duncan Watts)而言,社會科學的變化讓人想起1990年代生物學的變化,當時高通量技術開始產生大量有關DNA序列和基因表達的數據。他說:「新數據中出現了雪崩式增長,需要以非常不同的方式來考慮數據。」


但是,許多傳統的社會科學家對這場革命的最初成果並沒有留下深刻的印象,並發現其中的一些方法值得懷疑。懷疑論者將對社交媒體的研究視為對數千名不知情和不同意的參與者進行的實驗。2018年,有消息傳出,英國諮詢公司Cambridge Analytica未經其所有者同意,已從數百萬個Facebook帳戶中收集了數據。醜聞的餘波繼續給社交媒體研究帶來更多的審查和猜測,隨著平臺制定新的隱私政策,一些科學家的項目受到了阻礙。


社交不適


大數據領域還因早期解決「玩具」問題的論文而被汙名化,這些問題可以從數據中得到回答,但並未解決社會科學中長期存在的基本問題,例如如何解決不平等問題或影響公眾輿論。


GESIS萊布尼茲社會科學研究所的計算社會科學家克勞迪亞·華格納(Claudia Wagner)表示:「一開始,很多Twitter研究讓社會科學家們並不興奮。」


一些人認為玩具問題的接納至少有一部分是逐漸找到根基的新興領域的產物。Strohmaier說,隨著分析因素變得越來越複雜,數據來源也越來越多樣化,該領域已經開始解決更重要的問題,例如歧視,不平等和激進化的根源。他說:「只有現在,我們才能獲得可以查看重大問題的數據。」


Nature:FB和推特的數據是如何革新社會科學,改變世界的?

手機數據表明人們堅持簡單,可預測的運動方式。


例如去年,來自公共衛生和行為經濟學的研究人員在美國衛生保健系統中使用了50,000多名患者的衛生保健記錄,分析了一種常用算法,該算法建議有複雜醫療需求的人進行額外的監督和健康幹預。該團隊使用建模方法表明,該算法系統地歧視了黑人,從而可能影響數以百萬計的人們的保障。


然後,研究人員利用美國醫療保健差距來追蹤這種偏見的根源,並提出消除偏見的方法。例如,算法不應假設個人醫療保障支出是他們需要多少醫療保障的重要因素:由於無法平等地獲得醫療保障,照料黑人美國人的花費通常比白人美國人少,甚至當他們有相同的醫療保障需求時。


但是獲取良好數據並不是唯一的挑戰:從物理學或計算機科學領域出身的科學家被指控未能檢查社會科學家為解釋人類行為而制定的理論。「他們傾向於尋找模式,」朱利亞·安德裡格託(Giulia Andrighetto)說,他接受過哲學教育,但現在是義大利國家研究理事會下屬的義大利認知科學與技術研究所的計算社會科學家。「但是通常他們不會尋找產生這些行為的機制」。


要進行這項工作,需要牢固地掌握社會科學理論。多哈哈馬德·本·哈利法大學(Hamad Bin Khalifa University)的計算社會科學家安吉孫(Jisun An)於2010年開始獲得計算機科學博士學位,在計算社會科學運動開始盛行之際,她研究社交媒體上的新聞共享模式。


最初,她只與其他計算機科學家合作,而他們努力處理不同的社會科學理論。現在,她與政治科學家合作研究媒體對公眾輿論的影響(反之亦然),以及如何鼓勵人們提高新聞來源的多樣性。安說:「隨著時間的流逝,雙方在語言和方法上都相互理解。」


現在有融合的端倪。計劃於2021年舉行首次會議,將上述兩種方法結合起來。大學還創建了一些研究所,將來自不同部門的人員聚集在一起,以彌合鴻溝。例如,維吉尼亞州費爾法克斯的喬治·梅森大學就有專門的系。計算社會科學的夏令營在全球30多個地方舉行,一群熱情的年輕學生以及增加的可用工作機會給人們帶來了一些希望,即權力鬥爭可以讓位給更多樣的合作。


社會聚集


兩種方法的結合可能很強大。西雅圖華盛頓大學的數據科學家約書亞·布魯門斯託克(Joshua Blumenstock)和他的同事使用盧安達數百萬人的手機數據來推斷他們的社會經濟狀況,然後將其結果與使用常規調查收集的數據進行比較,從而證實了他們的結果。例如,政策制定者可以使用這種方法將目標對準需要幹預的國家貧困地區,或者監測已頒布政策的效果


但是缺乏溝通的問題仍然存在。哈佛大學的社會科學家瓊·多諾萬(Joan Donovan)指出了去年發表的一項研究,研究人員在Facebook和VKontakte平臺上繪製了網絡仇恨團體網絡,並展示了網絡結構隨時間的變化。她說,進行這項研究的物理學家和計算機科學家未能在他們的工作中引用關鍵的社會科學研究,結果,他們對研究結果的解釋並不像可能的那樣豐富。


他們還調查了很少的社交媒體平臺,而過去的研究表明,仇恨團體會在許多領域跟隨有魅力的領導者。團隊得出了她認為危險的結論:社交媒體平臺可以嘗試引導仇恨團體中的討論,例如通過創建虛假帳目或在仇恨集群之間進行工程對抗。她說,這可能通過增加小組中的討論量並提高其在搜索算法上的排名來適得其反。她認為,更好的策略是通過讓搜尋引擎限制此類人群的知名度來檢查仇恨消息的傳播。


Nature:FB和推特的數據是如何革新社會科學,改變世界的?

美國的治療師會檢查患者的肺部。醫療保健決策通常是通過算法得知的,其中一項研究發現存在種族偏見。


華盛頓特區喬治華盛頓大學的物理學家尼爾·詹森(Neil Johnson)是仇恨研究的主要作者,習慣於接受社會科學家的批評。他說他引用了最相關的參考文獻。他說,對於搜索算法,社交媒體公司有權操縱它們,「就像他們現在正在壓制反疫苗和COVID-19錯誤信息頁面和群組的突出顯示一樣」。他研究過錯誤的信息,衝突和極端主義,並說每次發表高調論文都會遭到投訴。


但是他的工作引起了政策制定者的共鳴:組織經常要求他諮詢,這些組織喜歡他的工作的定量性質以及能夠對幹預措施可能產生的影響進行建模的能力。他說:「我們真的可以用我認為他們沒有與其他學者互動的經驗來看待具體問題。」對於詹森而言,他擔心太多的社會科學家會在沒有經過適當培訓的情況下衝向計算方法。


詹森並不是唯一對理論對他們的項目的重要性持懷疑態度的科學家。Giangiacomo Bravo受過社會經濟學家的培訓,現在是瑞典Växjö的Linnaeus大學的計算社會科學家,他說許多社會科學理論太含糊,無法使用大數據進行檢驗。例如,社會資本的概念有時被定義為社會中允許個人共同努力的共同理解和價值觀。他說:「這種社會資本概念的原始表述太模糊而無法檢驗。」 「我怎麼測量?」


但是,有些理論更為具體。研究社會規範(控制社會上可接受或不可接受的行為的共同規則)的安德裡格託(Andrighetto)說,研究人員花了十年的時間為該主題拼湊了清晰的定義和理論。例如,該理論建議,當社會規範發生變化時,應促使人們對特定情況的反應方式發生變化。人們還認為,社會規範只會在緩慢的社會互動過程中緩慢變化。諸如此類的可測試陳述使Andrighetto可以將計算工作與社會科學理論相結合:她使用在線實驗8來測試社會規範的模擬變化是否會影響行為。


她並不孤單地想要利用社會科學來改變世界。瓦茨說,他和其他學術研究人員常常是在追求出版物,而不是現實世界中的解決方案。他說:「當論文發表時,我覺得我的工作已經完成。」


「把這些想法付諸實踐是我的工作,而要想出如何將它們轉化為現實世界中有意義的幹預措施,則是別人的工作。」


瓦茨說,為了實現這種轉變,兩個陣營的研究人員必須保持合作的動力。有些人已經可以感覺到它的發生。華格納說:「傳統的社會科學和計算社會科學實際上隨著時間的流逝越來越緊密。」


「在20年內,將沒有鴻溝。」


相關報導:

https://www.nature.com/articles/d41586-020-01747-1

相關焦點

  • 喬曉春:規範科學的社會科學研究,如何用數據說話
    來源:中國婦女報8月14日,北京大學喬曉春教授在山東女子學院舉行題為「如何做規範、科學的社會科學研究——以性別研究為例」的網絡視頻講座。喬曉春教授認為:社會科學研究者要知道如何用數據說話,學會和用好研究方法。「用數據說話」有一定規矩,需要遵循一定的程序,包括發現問題、提出假設、收集數據、分析數據、檢驗假設和得出結論。
  • 大數據應用於社會科學研究的價值與悖論
    隨著雲計算、物聯網、移動網際網路的廣泛應用,人類社會真正進入了大數據時代。通過大數據的運用,我們對人類社會獲得了更為廣泛和深入的認知,進而通過更為客觀和精確的方法,對人類社會進行更加科學和有效的探索和研究。大數據對當前社會科學研究產生了深刻的影響,使社會科學研究的視野和領域發生了革命性的變化。
  • 推特上的中國形象,越來越壞了嗎?清華研究團隊揭曉內幕
    那麼,自然而來一個問題:如何用數據來理解國際社會中的「中國形象」? 正如個人形象影響個人前途,國家形象對一個國家的國際關係和經濟發展也有著十分重要的影響。 近些年來,隨著中國的快速發展及其在全球影響力的不斷提升,中國的國家形象不斷發生改變,而2020年的新型冠狀肺炎疫情爆發進一步在全球範圍內改變了中國形象。
  • Nature靈魂問:微生物組數據一大堆,如何能改變人類健康?
    希望該文能夠為相關的產業人士和諸位讀者帶來一些啟發。① 微生物組大數據微生物組研究正在改變著我們人類對自身的看法。我們體內的微生物細胞數量至少與人體細胞數量相當,而這些微生物所擁有的基因種類更是超過了 100 萬種。
  • Nature靈魂拷問:微生物組數據一大堆,如何能改變人類健康?
    微生物組大數據微生物組研究正在改變著我們人類對自身的看法。我們體內的微生物細胞數量至少與人體細胞數量相當,而這些微生物所擁有的基因種類更是超過了 100 萬種。「幾十年前,我們就已經知道人類特定的基因突變與某些疾病有關聯,但是想要改變這些基因突變,真的很困難,」她說,「然而,現在我們發現微生物群落的組成也與疾病相關,並且,我們已經有了可以改變它們的有趣的工具」。Bhatt 的研究主要集中在交流通訊方面,不僅是微生物和人類細胞之間的交流通訊,還包括微生物群落之間的交流通訊。
  • 社會科學的性質和意義
    社會的治理及其制度供給,有賴於以經濟學、社會學、政治學和地區研究等學科為代表的社會科學這樣一種公共知識體系和學術機制。社會科學的繁榮和發展,還將打破科學與人文的二分知識格局,成長為一種新的文化類型。社會科學的實踐性我們這裡所說的社會科學的實踐性是指社會科學對社會世界的理解、闡釋和構成性關係。
  • 推進大數據、人工智慧等信息技術與人文社會科學研究深度融合
    虛擬實境/增強現實(VR/AR)技術藉助3D模型、感知交互、渲染處理、網絡傳輸等技術,將仿真和現實物理空間融為一體,建造第二自然(也可以稱為擬象),實現對物理空間的原型事物的模擬和構建,以及對無原型事物的生成和創造。這類技術可以充分模擬現實世界可能發生的現象、發展的狀態,未來可能會成為人文社會科學研究的實驗室或者試驗場。
  • 大數據時代的社會科學研究新範式
    然而,社會科學領域的大數據應用更多停留在概念和模式複製階段。即便如此,學者們普遍認為,大數據的興起為社會科學學科體系的重構和研究範式的改變帶來新機遇。社會科學研究有望突破傳統社會調查方法以及數理模型、推論統計和計量建模等傳統量化技術的限制。然而,社會科學發展不應該也不會完全局限於當前大數據概念的界定和技術限定。
  • 感知、數據、互聯!改變世界的力量往往很「簡單」
    在人工智慧、大數據、雲、感知技術、機器學習等一系列前沿技術不斷發展並深入融合到各個傳統產業領域的當下,物聯網的革命也在產業界各個角落爆發。有時候,引發大規模革新的事物或創意,未必是繁雜或高不可攀的。有時候,改變世界的力量往往是簡單而且「便宜」的。
  • 量子計算機將如何革新人工智慧,機器學習和大數據
    每天都有32億全球網際網路用戶每天每分鐘通過Pinterest上的9,722個圖釘,347,222條推文,420萬個Facebook點讚以及我們通過拍照和錄像,保存文檔,開設帳戶等創建的所有其他數據,為資料庫提供數據。我們處於傳統計算機的數據處理能力的極限,並且數據一直在增長。
  • 託馬斯·弗裡德曼:揭示「三大力量」如何改變世界
    人民網北京6月6日電 (記者賈文婷)2005年一本《世界是平的》(The World is Flat)掀起了全球化研究浪潮。時隔12年,該書作者託馬斯·弗裡德曼(Thomas Friedman)從新的視角分析和預測全球化、科技創新給人們生活帶來的改變。
  • FB設置 pixel 跟蹤活動狀態和結果【詳細圖解】
    2014年開始接觸亞馬遜,沃爾瑪,等電商平臺,現率領30人的亞馬遜運營團隊,經營公司自主研發產品和協助國內上市公司出海項目。FB投放廣告的技巧時發現很多人還是不知道如何設置pixel,今天我在這裡教大家設置pixel 吧。
  • 主修社會科學後,可以有什麼出路?
    在美國的大學體系裡,很多學校亦會將經濟系納入社會科學的範疇,所以社會科學學院的範圍,其實非常廣闊。這些學科,除了要求學生學習一定的理論基礎,還會要求學生具備一定的數理能力。最重要的,是學生必須懂得基本的科學原理,例如收集數據的方法、設計實驗的準則、以至如何用電腦程式處理數據。
  • 計算社會科學的哲學透視
    2009年2月,一群社會科學家和計算機科學家聯名在《科學》上發表了《計算社會科學》一文,這幾乎已成為計算社會科學正式誕生的一個標誌[1](P721-723)。概括地說,計算社會科學是一門運用計算進路研究社會的交叉學科,關涉計算機科學、數據科學、人工智慧、複雜性科學和社會科學的主要領域。
  • 川普與推特的互相利用和愛恨史
    然而,川普的推特和他的內心如此融合,以至於很難分辨出川普在真實世界和虛擬網絡之間是否有明確的邊界。川普早期的推特都比較軟。像許多公眾人物一樣,他開推特帳戶的目的是為了營銷。他用它來宣傳他的電視節目《學徒》(The Apprentice)和著作《像冠軍一樣思考》(Think Like a Champion),以及其他各種業務等等。
  • 哲學和人文社會科學的定位
    科學愈是走向發展和應用,就愈是離不開人文導向,這一點正是當今時代的一大特徵。至於如何對待科學技術的問題(如實施科教興國戰略),則顯然屬於社會人文領域,而不是自然科學問題。「人文」這個概念,有「人的(人本的、人道的等)+文化、文明的」意思。其特點恰恰在於強調人的主體地位、人的需求和保障、人的情感和意志等價值性內容,即「人文精神」。
  • 越南革新三十年(下):成就、不足和展望
    新華網 資料圖一、越南革新的主要成就越共十二大報告總結了越南革新三十年的得失,認為越南革新三十年來,在建設社會主義和保衛社會主義祖國道路上取得了具有歷史性意義的重大成果。主要成就體現在:越南已經從經濟社會危機和最不發達狀態走出來,成為一個中等收入的發展中國家,並且正在大力推進工業化和現代化,積極融入世界。
  • 西安交大發布自然科學與社會科學重大問題
    西安交大發布自然科學與社會科學重大問題 恢復窄屏 發布時間:2016-04-10 08:34:49
  • 推特免費加速器app下載
    推特免費加速器app幫助用戶流暢瀏覽推特精彩內容,推特免費加速器app為廣大網遊用戶提供最為穩定的網絡加速服務,融合最新動態節點技術,二十四小時不斷改變優化各個加速節點,全新智能加速功能,24小時監控節點動態,保護您的流暢上網!
  • 社科評論|社會科學更需注重實踐
    雖然在理論上如此,但是社會科學在現實中很容易陷入一種主觀上的「自體循環」。也就是說,社會科學最初通過對實踐的認識形成了概念;為了更好地闡釋概念,形成了研究範疇和理論體系。而後續的研究者往往從概念、理論和方法(而不是概念、理論背後的實踐)出發去進一步探究,在概念表述和理論方法上追求新穎,從而形成了新的理論。