心理學是研究心理現象及其規律的科學,是一門既古老又年輕的學科。在19世紀中葉以前,心理學的研究方法都是思辨式的,帶有經驗描述性質,因此尚不能稱之為科學。德國心理學家威廉·馮特把實驗法引進心理學,並於1879年在德國萊比錫大學創建了世界上第一個專門的心理學實驗室,由此開創了科學心理學。
善於駕馭文字的作家寥寥數筆就能生動地勾勒出筆下人物的特徵,好的文學作品對人物的描述絕不僅僅限於他的容貌和行為,更重要的(至少是同等重要的)在於對人物性格的描繪和刻畫。在心理學領域,這便是對人格(personality)的闡述和展示。
雖然「人格」這個術語在日常生活中很常見,但是給人格下一個準確清晰的定義卻並非易事,即使是心理學家在這個術語的定義上也很難達成共識。最早的對人格的定義可以追溯到公元前400年古希臘醫學家希波克拉底(Hippocrates)的體液說。他認為,人體是由四種體液構成的,即血液、黏液、黃膽汁和黑膽汁。而人格可以被定義為四種類型,並且與體內的這四種體液息息相關:黑色的膽汁產生了憂鬱型人格,紅色的血液產生了樂觀型人格,黃色的膽汁產生了易怒型人格,黏液產生了冷靜型人格。儘管希波克拉底的體液說已經被現代醫學所否定,但是他關於人格分類的探討,對於心理學中這一術語的定義仍然是有啟發意義的。
在現代心理學中,人格的定義其實和語言的使用有著緊密的關係。每當我們試圖對人格特徵做出描述時,我們總會去尋找一些心中自認為恰如其分的詞語。比如,描繪一個人物是否是冷靜的、客觀的、負責任的,還是相反。在日常生活中,我們似乎更傾向於使用高度概括而又簡潔的方式去描述人格(藉助已經發展成熟的語言系統,使用規範化的詞彙),而不是使用像「他在如此險惡的環境下仍然保持著好心情」這些間接的、仍然需要進行認知加工理解的語句。這些簡潔的詞彙描述了種種相同、相似或者相異的人格特質。基於這些觀察,人格理論的先驅奧爾波特(Allport)和奧德伯特(Odbert),在1936年對英語詞彙進行了艱難而又系統的調查研究,並按照個人特質、暫時的情緒或者行為,以及智力與才幹這四個類別,列出了大約1800個單詞,其中大約有5000個「可能存在的用於描繪個體特質的中性詞彙」。他們的研究得到了眾多心理學家的特別關注。
科學心理學的研究立足於反映心理活動的外部表現的客觀材料,建立在客觀數據的基礎之上。然而由於條件所限,長期以來,心理學研究的樣本規模都十分有限。研究多採用抽樣的方式,從總體中抽取樣本,再把樣本的研究結果推廣到總體上,這就使研究結論的有效性不可避免地受到樣本代表性的影響。目前,心理學研究對實驗條件的控制通常會營造出不同於真實生活中的行為情境,並在實驗過程中始終伴隨著實驗者效應、要求特徵等幹擾因素。對於大規模的問卷(questionnaire)和測驗研究,傳統方法一方面需要用戶自陳,數據收集過程比較緩慢,往往需要等待被試反饋足夠的信息;另一方面,在數據處理階段需要大量人工計算整理,效率受到很大限制。傳統心理學研究方法所收集的信息要麼是回溯性的,容易受到遺忘等因素影響而產生誤差;要麼是截取單個或有限的幾個時間節點,卻得出推廣到整個時空的研究結論。利用大數據信息採集與處理技術,可以實現對個體和群體外部表現數據的實時採集,彌補傳統研究方法時效性不足的缺點。
大數據理論與技術的出現,特別是當下數據採集技術的飛速發展和應用範圍的極大拓展,這就有可能針對極大規模的用戶開展研究了,進行全時全程的跟蹤記錄,並實現數據顆粒度的靈活變化,從而使得心理學研究的數據基礎更加全面和堅實。基於此,我們利用網絡大數據開展多個層面的研究。首先是利用情緒關鍵詞的詞頻變化,考察群體的情緒變化規律;進而利用機器學習模型,根據用戶網絡行為進行心理特徵的識別。利用預測模型,使得我們通過分析用戶生態化的行為數據開展心理學的相關研究成為可能,這種無侵擾的心理學研究使得結果更具有可推廣性。