讓陌生人相愛的36個問題,為什麼在現實中卻不適用?

2020-12-05 虎嗅APP


語言有親密度嗎?如何量化並測量語言親密度?性別、社交距離和匿名性又是如何影響人際交流的?密西根大學的研究者希望使用自然語言處理和數據科學技術來回答這些問題。相關工作「Quantifying Intimacy in Language」已發表於自然語言處理旗艦會議EMNLP 2020。本文為科普性質,技術細節及已開源的數據、模型請見文末項目主頁。


讓陌生人相愛的36個問題


1997年,美國心理學家阿瑟·亞倫等人發表了一項研究,他們發現彼此詢問一些特別親密的問題,可以快速增強兩個陌生人之間的親密度。



這一研究在被紐約時報報導後,也在中文網際網路上被廣泛轉載,並被宣傳為快速讓心上人愛上你的良方。



然而當人們在現實生活中面對心上人的時候,卻會對這些問題大失所望,因為就像知乎上最高贊的評論所言,這些在實驗室中效果良好的問題,在真實的生活中卻很難找到合適的場景或契機。



這些問題究竟有什麼奧秘?他們同其他稀鬆平常的諸如「吃了沒」這樣的寒暄有什麼區別?又究竟有哪些因素最終影響著人們在日常生活中的語言表達呢,本文將通過作者在EMNLP 2020上的一項最新研究,試圖從語言親密度和社會約束的角度來回答這些問題。


我們的研究


就像是人和人之間的關係一樣,我們在人際交流中所使用的語言也具有親密度的屬性。語言親密度受到了廣泛的社會和個體因素的約束,而違反這樣的約束則往往會造成尷尬,或者帶來更嚴重的後果。中國有一句古話叫做「交淺而言深者,愚也」, 意思是說與交情淺的人深談,是人際交往之中的大忌,這反映了社會文化中關係遠近對於語言親密度的約束。


在這一研究中,作者提出了一套量化語言親密度的數據標註方法和一個用於測量語言親密度的NLP模型,並使用八千萬 Reddit, Twitter, 書籍和電影對話數據研究了性別、社交距離和匿名性對於人際交流中語言親密度的影響。


語言親密度 ( Intimacy in language )


親密度這一概念來源於社會心理學,主要被用來描述人和人之間關係或者互動的親密程度。在這裡作者將這一概念沿用到了語言中,用來描述人際交流中所使用語言的親密程度,比如「我今天心情真的好差」比「吃了嗎」一般來說具有更高的語言親密度,因為它涉及到了更個體化的情緒表達;而「你最糟糕的童年回憶是什麼」則比「你覺得新的蘋果手機怎麼樣」要更加親密,因為它過於私密和個人化。


那麼我們是否能夠量化語言親密度呢,答案是肯定的。作者主要使用Best-Worst-Scaling這一方法來標註人們在對話中所使用問題的親密度,並最終得到了2397條標註有親密度 的文本數據,具體細節請見論文。


測量語言親密度


使用NLP模型測量語言親密度是一個回歸任務,簡單來說就是對輸入的文本,本文的模型可以自動地得出一個介於-1和1之間的親密度分值。作者在標註好的親密度數據上微調了 RoBERTa模型,最終在基於Reddit上的測試集上得到了0.87的相關係數,說明我們可以使用微調過的語言模型來準確地測量語言中的親密度。使用這一模型,作者測量了來自Reddit, Twitter, 書籍和電影的八千萬條對話數據的親密度。



主題分析


有哪些話題更親密呢?如下圖所示,涉及到家庭、親密關係等個人化的內容往往會比生活常識性的話題更加親密,但同時值得注意的是,一個話題的親密度往往有很大的跨度,這也說明了僅僅使用主題是無法準確地測量語言的親密度的。



性別


作者對來自Reddit, Twitter, 書籍和電影中的對話數據進行了分析,如下圖所示,我們發現:在Twitter和Reddit這兩個非常有代表性的社交媒體上,男性同男性之間的語言親密度均低於其他性別之間的對話。這說明雖然社交媒體往往可以賦予人們更大的交流自由,關於男性氣質的規訓仍然普遍存在於線上的人際互動中。對於書籍和電影來說,其對話並不來源於真實的個體,而存在於作家的想像,本文的分析進一步證明了廣泛存在的對於性別和語言親密度的社會期待,即男性需要保持一種不露聲色的威嚴形象,而談論情感性和個人性的話題則往往被認為是不夠man的。




那麼是否這樣的規訓僅僅存在於男性之中呢?答案是否定的。作者進一步分析了作家性別同書籍中人物對話親密度之間的關係,如下圖所示,儘管女性作家同男性作家相比傾向於使用具有更高親密度的語言,其作品中男性同男性之間的對話始終具有最低的語言親密度,這說明對於男性氣質的社會規訓也同樣被女性所接受。



社交距離


語言親密度天然受到社交距離的影響,因為社會心理學中的親密度本身就是社交距離的一個反映,而一般來說,更接近的社交距離往往伴隨著更加親密的交流方式和內容。然而,就像電影《愛在黎明破曉前》所呈現的那樣,兩個在火車上的陌生人卻可能向彼此分享最為私密的一些信息,心理學家把這種現象叫做「火車上的陌生人」。



那麼這兩種截然不同的社會期待是否會存在於線上社交中呢?為了回答這一問題,我們使用了 Twitter 數據計算了用戶在社交網絡上的距離,並分析了其互動的語言親密度,結果正如我們所預料的那樣,最親密的互動發生在關係最近和關係最遠的用戶對之間。


當兩個用戶之間的距離從0變為1時,也就是從直接好友變成存在一個共同好友的時候,他們往往仍然處於同一個社交圈子中,因而其語言親密度隨著社交距離的增加而顯著下降,而對於社交距離大於3 的用戶來說,隨著他們之間的關係越來越陌生,他們受到了越來越少的社交關係對於語言的限制,這使得他們可以不受限制地討論更加私密的內容。我們的研究在線上環境中同時驗證了兩個經典的關於社交距離如何影響人際交流的假說。



匿名性


前面兩個實驗討論了性別和社交距離對於人際交流的規訓,那麼是否存在一種場景可以使得人們暫時擺脫這樣的規訓呢?答案是肯定的。在Reddit上,人們可以使用帶有throwaway或者anonymous的用戶名來給自己建立一個匿名的身份。而正如下圖所示,使用匿名身份的用戶會比其他類別的用戶提出更加私密的問題。我們同樣分析了那些不帶有任何個人身份信息的帳號 ,結果表明儘管這些帳號具有同樣的匿名性,用戶並不會使用他們來提出更加親密的問題,這再一次表明,對於人際交流的社會約束仍然存在於Reddit這樣一個相對匿名的社區,而想要去除這些約束的最好辦法是使用一個匿名的身份。



失效的陌生人36問


回到最開始的問題,為什麼在實驗室中效果良好的問題,在現實中卻不適用呢?因為人們的語言親密度受到社會關係的約束,而想要詢問這些超出關係親密度的問題則需要特定的場合或者契機。人們可以坦然的在實驗室,或者在特定的場合中使用這樣的問題,是因為這些特定的環境暫時去除了社會關係對於人們的語言親密度的約束。


結論


總而言之,同關係一樣,人際交流中所使用的語言同樣具有親密度這一屬性,並受到諸多社會因素的影響。我們的研究首次提出了語言親密度 這一概念,並驗證了使用NLP模型來測量語言親密度的可行性,繼而分析了性別、社交距離和匿名性對於人際交流的影響。作為自然語言處理和社會心理學的結合,我們的模型不但可以支撐社會科學的研究,同時還可以支持對話機器人等NLP任務,並且已經被應用於密西根大學今年Amazon Alexa Prize的參賽模型Audrey中。



相關焦點

  • 兩個陌生人相愛的概率有多大?
    咱倆加個微信唄。」就這樣,兩個人走到了一起。半個月後,在他們的婚禮上,司儀代表來賓問他倆:「茫茫猴海,你們是如何相識、相知、相戀的?」新郎黑猩猩無限感慨地說:「猿糞,都是猿糞吶!」世間所有的相遇,都是一種緣分。地球上有76億人,中國有近14億,人一生大概會遇到2920萬人,為什麼偏偏是你?
  • 為什麼曾經相愛的人,分開卻成了陌生人?這是我聽過最心痛的回答
    有網友說,愛過的人通常做不成朋友,最後成了最熟悉的陌生人。相濡以沫不如相忘於江湖,互不打擾是愛情終結後最好的方式。有網友說,人生裡總有一些人,能牽手走過一時,卻無法相守一世。愛過的那個,卻難成為朋友。有網友說,因為深愛過,靠近一點都想佔有,看不得他為別人遮風擋雨,因為傷害過,做朋友都覺得心痛,受不了假意的關心,怕自己總會誤會,怕傷得更深,所以只能做最熟悉的陌生人。我的一個男同學小成,和小米在高中時就在一起了,我一直以為兩個人可以一直走到最後的。直到某一次高中同學聚會,我發現小成和小米兩人跟陌生人一樣,誰也不理誰。
  • 《完美陌生人》:相愛沒那麼容易
    昨天下午看了義大利電影《完美陌生人》。前段聽過介紹,還挺有興趣的。很簡單的一個故事和場景,三對夫妻和一個單身漢聚餐,四個男人是髮小。電影中每個人的秘密也反映了一些社會現象:對同性戀的歧視(佩佩發現自己是同志,不敢告訴他的髮小;學校也因此而解僱了他)、家庭親子教育(女主人和17歲女兒的衝突;男主人對17歲女兒的初夜做的準備和忠告。
  • 扒一扒「謝耳朵」和「胖妮」做的愛情實驗|36 Questions for Intimacy
    4.疏離型(dismissing),特徵:對個人的看法相對積極(自己是有價值的):並不擔心拒絕,但卻不喜歡親密接觸。拒絕和他人相互依賴,因為他們相信自己能自力更生。2. 真的有人愛上了!Fall in Love with Perfect Strangers了解完這個實驗,你心裡一定有個疑問,這36個問題在現實生活中真的管用嗎?
  • 讓你瞬間豁然開朗的36個神回答
    如何反駁「現實點,這個社會就是這樣」? 你是怎樣,你的世界就是怎樣。 14. 你對自由的理解是什麼? 說「不」的能力。 15. 同樣是別人比自己強,為什麼有時會產生嫉妒,而有時會產生崇拜?
  • 真實愛情故事:現實再殘酷,也拆不散真正相愛的兩個人(中)
    真實愛情故事:現實再殘酷,也拆不散真正相愛的兩個人(上)我寫歌給他彈唱「你這麼小就一個人去旅行,危險知道不知道?」「我……不是一個人。」「你們三個還都是未成年人,不知道嗎?」哦,原來他們什麼都知道,原來不是巧遇他們回家撞見,原來……有人告密。
  • 《情深深雨濛濛》的陸心萍和現實中的陸尓豪,兩人相愛了18年之久
    提起王一楠,可能很多人都不熟悉,但是說到她的老公王鑫,在《情深深雨濛濛》裡飾演陸尓豪。而在劇中有一個經常被提到的陸心萍,她時傅文佩的大女兒,因為疾病所以死了,她的死也是後來導致了文佩就失寵了!這個心萍的扮演者就是王一楠,名字不知道,但是看到照片後都會說,哦,原來是她啊!
  • 陌生人社交「毀」於直播|陌生人社交|陌陌|秀場直播
    來源丨歪道道(ID:daotmt)數據顯示,2015年以來,我國陌生人社交用戶規模逐年增長,預計到2020年,這個數字將達到6.49億。陌生人社交的盤子一直很大,但你會發現這個賽道沒有一個競爭者能吃得下這塊蛋糕,即使是盤踞老大位置多年的陌陌,也總在與用戶進行拉鋸戰,而不像其他行業那樣,核心用戶緊緊吸附於頭部。時至今日,陌陌再度陷入危機。
  • 劉貴祥 | 民法典適用的幾個重大問題
    所分享內容為作者個人觀點,僅供讀者學習參考,不代表本號觀點民法典適用的幾個重大問題本文刊登於《人民司法》2021年第1期文/最高人民法院審委會專職委員、二級大法官 劉貴祥目次一、民法典的總體架構本文以習近平總書記關於切實實施民法典的重要講話精神為指導,就民法典適用中的幾個重大問題與大家交流學習體會。主要講四個方面的問題:一、民法典的總體架構;二、民法典的規範性質及識別;三、民法典的溯及力;四、民法典與其他法律規範的關係。
  • 周一圍為什麼喜歡朱丹 兩人怎麼認識有交集相愛的
    隨後,周一圍本人表示照片中的人正是自己,而朱丹方的工作人員也稱:「對的時間遇見對的人,希望大家祝福」。有記者問到兩人是什麼時間戀愛的,對方卻回答並不知情,不過從網上的消息可以得知,兩人應該是在劉儀偉主持的一檔節目中認識的。­  關於周一圍為何喜歡朱丹,我們很難用一段話說明白,畢竟感情到了就是到了,很難用理由來解釋。
  • 王者榮耀:遊戲怪圈之現實中彬彬有禮的人,進入遊戲後卻變得暴躁
    這種怪圈我們在現實中真的可以找到原型案例1:我有一個朋友,暫且將她叫做小美,她是一個普通的上班族,在現實中是一個脾氣非常好的妹子,不管是談吐,還是形象都是一個比較好的女孩子。那時候,我就在想,為什麼一個遊戲會讓人的脾氣變得暴躁無比?這還是一個形象比較好的人,居然都會這個樣子。那麼那些現實中就很暴躁的人,在遊戲中就更加的肆無忌憚了。案例2:這個人也是我的一位男性的朋友,同樣在現實中是一個脾氣非常好的,並且還是十分內向那種人。
  • 科學家發表「銀河系中或有36個外星文明」,意味著什麼?
    36個文明聽起來挺嚇人,但其背後的科學原理實在不值一提,甚至可以說是漏洞百出,這些漏洞透露著人類的對未知的無奈。下面聊聊銀河系36個可通訊文明怎麼來的。德雷克方程——在黑暗中對外星文明的統計1961年,天體物理學家弗蘭克·德雷克創建了一個方程,用來估算恆星中有多少文明。
  • 不滿足這3個條件,現實啪啪打臉……
    不得不說可憐天下父母心,出發點是好的,奈何現實並不如人願,若干年後,多少人發現理想敗給了現實:比如河北李先生家的情況大概有無數家庭的影子。李先生的父母生2個孩子,老大即李先生,還有個二兒子,前幾年政府拆遷,原來的老房在縣城裡換兩套房子,一套70平米,一套100平米,一旦有了財產就涉及到分家,老人想把大平米的給小兒子,因為小兒子離得近,生活條件也不如大兒子好。
  • 愛在各種各樣的「效應」中,原來那些相愛很久的人
    「罪魁禍首」事實上很多人不會長久相愛,「罪魁禍首」在價值觀上是不同的,在男孩的價值觀上,他們更注重自己的能力和成就,事業成功是實現自我價值的一種方式,因此當男孩遇到問題時,他們的態度是解決問題;女孩有不同的價值觀,實現自我價值的途徑是多交流、多交流,只有分享,他們才能與他們建立關係
  • 對「虛擬實境與數字孿生」三個問題的探討
    他介紹了在現實中如何用手機創建三維曲線、做三維建模,重點剖析了用手機實現三維建模技術目前面臨的挑戰以及操作方法等,深入討論了基於動畫自由度的兩項研究成果。傅紅波指出:「這兩年內,他們探索的就是用AR手機在現實場景當中做一些內容創作,未來將會把這些技術投入到應用開發的研究中」。
  • 為什麼現實世界中不可能出現巨人?
    它們的外形和人類長得差不多,只不過身高等比放大了不知道多少倍。它們雖然行動緩慢,但是力大無窮。比起其他科幻生物的形象,巨人似乎是最容易讓人接受的。但為什麼現實生活中,我們從來沒見過這樣高大的生物呢?接下來我們就請果殼網科普主筆瘦駝給我們講講,為什麼科幻作品裡的巨人永遠不可能在現實中出現。
  • 翻拍次數創金氏世界紀錄的影片——《完美陌生人》
    為什麼會怕,因為手機這個黑匣子,記錄了太多我們的秘密。 而今天我們要聊的這部義大利電影《完美陌生人》,片中的主人公們就經歷了這樣一場驚險刺激的大冒險。自然是由義大利美杜莎影業出品的《完美陌生人》。它不僅創下被翻拍次數最多的金氏世界紀錄,其版權更是賣至三十多個國家,翻拍出中國、西班牙、土耳其、法國等18個版本。 2016年電影一經上映便拿下了當年的本土票房冠軍,還榮獲義大利大衛獎最佳編劇獎和最佳影片獎,以及2016年紐約翠貝卡電影節最佳電影劇本獎,可謂是轟動一時。
  • 如果愛:耿墨池為考兒留了後路;米蘭不現實;4個情節有頭無尾!
    一輩子花男人錢,之前是祁樹傑的卡,現在祁樹禮的卡,尤其是後者,不愛人家還跟人家一起住吃他的喝他的花他的理直氣壯,還有,自己的事情幹嘛要受祁樹禮控制,還有各種虐,虐得毫無道理,為了虐而虐?《如果可以這樣愛》中就耿墨池和白考兒的愛情而言,的確讓人痛心。
  • 一條時間線,透視陌生人社交的死亡魔咒(上篇)
    立足於這些根本性問題,我將通過四個部分、一條時間線。來對陌生人社交賽道進行梳理與深挖,所提煉的一些值得警示與關注的要點與大家進行分享,或者說為大家提供一些不同的視角或方向參考。分享內容作為個人比較喜歡的賽道,不免有疏漏之處,歡迎大家溝通交流。
  • 物理學家與化學家相愛相殺丨量子閒話
    ,肖洛開場白先給「光譜」下了個冗長的定義,正準備轉入正題,臺下聽眾喊了一嗓子,該給「死」也下個定義吧。肖洛思忖片刻,說道:當化學家接手課題之時。正如在科學鄙視大神、數學家希爾伯特眼裡,化學只是「女校裡的烹調課程」,不僅煙火氣,簡直煙燻火燎。而物理學家米斯納最喜歡講的笑話:你跑去問化學家為什麼世上有92種元素?