人工智慧算命:使用自然語言處理預測人格類型

2021-01-10 騰訊網

你在網上發布了多少關於你自己的信息?好吧,在當今時代可能有很多。我們不斷地聯繫在一起,與很多人分享生活中的瞬間,無論這些人是否認識我們。這很好,只要你決定你想展示什麼。但是,如果我告訴你,通過寫文章,你所展示出的隱私超過你所意識到的內容呢?

我們可以想像,一個人的寫作風格可能與他或她的個性有某種聯繫。使用「哇」、「擁抱」、「聚會」等詞可能表明我們在閱讀性格外向的人寫的信息。另一方面,也有很直觀的內向詞彙的集合,例如:「孤獨」,「書籍」,「平靜」。很明顯,這有點誇大了。事實上通過詞彙判斷性格並不是那麼容易。人類要複雜得多,不能僅僅通過人格特徵典型的詞語來確定個人性格。或者以下圖片中的他們可以?

說一個人的個性可以通過寫篇文章來預測,就像上圖一樣

網際網路上充斥著各種各樣的人格測試。其中一些是用來讓你感覺更好並以此說服你付費的。這基本上和測星座一樣,沒有任何實際價值。但在這片騙子和偽心理學家的海洋中,有一些基於科學研究的有趣測試。在我看來,值得特別注意的是邁爾斯-布裡格斯類型指標(MBTI)。對我來說,這個結果非常準確,很多人似乎也有同樣的感覺。所以我決定在這個領域進行發掘。在研究過程中,我發現了一個Kaggle數據集,其中包含一篇來自8600多人的帖子,這些帖子根據作者的測試結果標註了作者的個性特徵。

什麼樣的數據是可用的?

上面提到的數據集非常簡單。它只有兩個專欄,其中一個包含來自Personality Cafe網絡論壇的臨時帖子,另一個是帶有作者MBTI測試結果的標籤。

基於此,我們可以就這些數據提出幾個有趣的問題:

1,每個人格特質在論壇用戶中的分布情況如何?

2,每個特質都有最重要的代表詞嗎?外向者的寫作方式和內向者不同嗎?或者是那些比較敏感的人在使用情感詞彙?

3,最後:能否根據某人的職位預測其性格類型?

讓我們開始這個數據遊戲

在我們繼續之前,我們應該先解釋一下這個神秘的縮寫詞到底是什麼意思。每一個字母代表一個個體的特徵。我們可以選擇8種不同的類型,四種類型的組合創造了個性類型。

所以讓我們試著回答第一個問題並檢查數據集中每個人的分布。

這個世界上似乎有更多的內向者而不是外向者…嗯,經過再三考慮,筆者認為分布似乎不正確。讓我們檢查一下測試作者的統計數據。

這真是太有趣了!上表中最受歡迎的特徵似乎是ISTJ和ISFJ,得分分別為11%、6%和13.8%。這些結果與我在計算Kaggle數據集中的分布時得到的結果完全不同,在Kaggle數據集中,這兩種類型的人大約佔2-2.5%。

我們發現這些差異幾乎適用於所有類型。看起來,擁有INFP、INFJ、INTP和INTJ類型的人最有可能在個性類型論壇上發帖。

此外,當我們在提供的圖像中重新創建左側的表時,我們可以看到它也完全不同。字母I、F和P在他們的首字母縮略詞中的人將佔過多的比例。在我們之後的分析中,我們必須記住這些數據是不平衡的。

結論

自然而然得出的結論是,更注重分析自己的性格的是內向者,而不是更善於交際的外向者。基於這個原因,我們可以預期,他們將更有可能進行人格測試,並在保證這種匿名性的論壇上談論自己。一點也不奇怪,情緒化程度更高的人(字母F)會更頻繁地寫自己。尤其是當它涉及到與內向的聯繫時,這往往會使這些人難以表達自己。

文本分析

正如我們之前看到的,數據有點混亂。它包含許多大小寫混合的字母、標點符號、連結等。在我們開始分析之前,我們應該把它清理乾淨。我所做的相對簡單,包括:

1,刪除連結。

2,刪除所有數字和標點符號。

3,所有字母小寫。

4,刪除休止符。

5,一開始我使用了單詞變體還原,但是它導致了準確度的顯著降低,所以在進一步的分析中我放棄了它。

6,用數字表示替換每個單詞。

相關焦點

  • 七夕提問:AI可以預測女朋友什麼時候生氣嗎?
    如果我們能通過人工智慧,洞察女朋友情緒的波動,提前預見未來幾天內她的情緒變化趨勢;同時能通過Al預設出女朋友的一些生氣場景和日期,通過數據挖掘、Al模型、量化技術等。是不是就可以幫助男生們更好地進行戀愛決策,規避「直面女朋友生氣」的危險呢?那麼,人工智慧真的可以預測女朋友什麼時候生氣嗎?從技術角度看,又該如何建立這個生氣預測AI呢?
  • 新基建助推,人工智慧應用邁入新階段|愛分析報告
    來也科技創辦於2015年,致力於做人機共生時代智慧機器人公司,核心技術涵蓋機器人流程自動化(RPA)、流程挖掘、自然語言處理(NLP)、智能對話交互、文字識別與圖像識別等。來也科技向該社區提供了一套RPA+外呼機器人的解決方案。這套解決方案於2月初上線,東壩鄉第一社區一直使用到5月份(北京宣布解除隔離要求),在社區疫情防控工作中發揮了極大作用。
  • 測試:你屬於什麼人格類型?
    A.再也看不到世界了,或者用全新的方法看到世界B.再也聽不到了,或者用全新的方式聆聽世界C.再也感受不到了,或者用全新的方式感觸世界一:選擇「A」較多的——視覺系類型人格視覺系的人們喜歡日光,極端易變,很容易在那些允許視覺表達的行業裡找到他們。沒有比娛樂行業更容易觀察到視覺系的人的地方了。
  • 圖靈測試已經過時,人工智慧需要建立一套全新指標
    圖靈預測,到2000年,普通人在模擬遊戲中將人工智慧與真人區分開的概率將不到70%,遊戲中的回應者可能是真人,也可能是人工智慧,而評估者對此毫不知情。 此外,圖靈測試沒有考慮到人工智慧使用傳感器聽、看和感受外部世界的能力越來越強大。相反,圖靈測試僅限於文字溝通。 其次,要想讓人工智慧在今天更實用,這些系統需要高效地完成我們的日常任務。當你讓人工智慧助手幫你關掉車庫的燈時,你並不想發起一場對話。
  • 用MBTI人格理論解讀《陳情令》中的16種人格類型(上)
    《陳情令》中的人物飽滿豐富,幾乎可以涵蓋大部分人格類型。這一篇將分析其中8種人格(黃綠)。想了解mbti可關注作者之前的文章,或百度搜索「mbti職業性格測試完整版心情香蕉」93題測試,測一測自己是哪一種人格類型。
  • 依戀類型 戀愛人格 你是哪一種
    現在研究星座對症下藥的已經越來越少人使用了,但是我們還是很需要知道自己和自己的另一半在戀愛中的人格到底是怎麼樣子的。對於戀愛人格類型的劃分你了解多少呢?依戀類型就是在戀愛中會有的表現,有些人喜歡誰就會很主動去追/憋S 都不說,有些人一談就談好幾年戀愛然後順利步入婚姻/只能維持兩個月好日子然後就開始天天吵架,有些人很有安全感/天天覺得另一半出軌,這些都可以在依戀類型當中找到答案。
  • 從《當人工智慧考上名校》裡,人類與AI的區別中,預測未來行業
    書中有一個假設,就是讓人工智慧去做律師,因為它們的數據裡儲存了所有的法律。但有自古以來就有一句話,叫「法理不外乎人情」。人工智慧確實可以把所有的法律都一字不差的講出來,但它們沒有情感,它們不可能是一個好律師。還有照顧孩子和老年人,我們是人,也曾經是孩子,對人類的喜怒哀樂和需要都勝過人工智慧,因為我們有感情。
  • 算命婚姻:露水姻緣八字組合
    算命婚姻:露水姻緣八字組合  感情最怕的就是「可惜不是你,陪我到最後」。我們都說愛情是偉大的,是神聖的,是經得起考驗的,但是事實上也有註定有緣無分的婚姻組合,這樣的組合即便在一起修成了夫妻緣分,也不見得能夠相守一生一世。算命婚姻網為您解答哪些是露水姻緣組合。
  • 2021年的數字存儲預測第二部分:磁記錄的預測
    2021年的數字存儲預測第二部分:磁記錄的預測 存儲社區 發表於 2021-01-12 09:27:04   這是2021年數字存儲和存儲器行業的最新狀態和預測的第二部分
  • 出版人工智慧: 概念內涵、價值指向與實踐路徑
    基於此,筆者認為,出版人工智慧是以知識作為生產要素,以基於人工智慧的知識挖掘作為核心技術,帶來新知識的自主形成和規模化使用,並實現人工智慧技術在出版領域應用的系統工程。出版人工智慧具有快速性、迭代性、自主性、定製化、交互性、系統性等特點,將帶來出版行業生產、交互、體驗和載體的革新。
  • 用MBTI人格理論解讀《陳情令》中的16種人格類型(下)
    《陳情令》中的人物飽滿豐富,幾乎可以涵蓋大部分人格類型。在上篇中已對其中8種(綠黃)做了解讀,這一篇將分析剩下的8種(紅藍)。想了解mbti可關注作者之前的文章,或百度搜索「mbti職業性格測試完整版心情香蕉」93題測試,測一測自己是哪一種人格類型。
  • 程式語言流行度總結,Java 很火,Python 潛力股
    而這些技術的核心部分就是程式語言。國外一位技術愛好者 Ben 整理了一份最流行和最具影響力的程式語言清單,可以幫助開發者更好的預測 2018 年的程式語言發展趨勢,同時,有針對性地選擇和加強程式語言學習。
  • 如何預測伴侶關係質量?
    這些可能部分地解釋了性滿意度對關係質量為什麼會有預測力。衝突對關係的影響就比較好理解,這在伴侶關係中幾乎是難以避免的,在表現形式上,可能是意見分歧,行為習慣存在差異,或者其他一些難以調和的連接點。現實生活中,因為日常相處方式問題、工作和家庭平衡問題、子女教育問題等類似原因發生衝突的情境相當多,如果處理不好,往往會對關係產生負面的影響。
  • .| 多人姿勢估計;對話框語義分析;無監督語義分析;自然語言處理...
    還有一種是將自然語言直接轉換為計算機可以理解並且執行的語言,本文就是解決這個問題創新點:面向任務的對話框系統的分層語義表示,它可以對組合查詢和嵌套查詢建模。提出了一個語義解析的層次化注釋方案,它允許組合查詢的表示,並且可以被標準的選區解析模型高效準確地解析。而且還發布了一個由44k個帶注釋的查詢1組成的數據集。
  • 了解人格是如何影響一個人的社會交往,就能預測他人的行為
    我們都知道,人格並非被動地存在於個體內部,人格會影響我們的社交環境和物理環境。 蘭迪·拉森、戴維·巴斯《人格心理學》 當發現了這個人格心理小知識了之後,我特意觀察了內外向特別分明的人,他們在約會的時候最愛去的地方。那些高外向的人特別喜歡去酒吧,或者遊樂園,這類型熱鬧的地方,在這個過程,外向的人全程興高採烈,嗨的不得了,並表示這是他們有史以來最好玩的約會。
  • 淺析人工智慧在交通領域的未來暢想
    雖然這只是科幻電影,但是對於觀眾來說,還是想要讚嘆一聲「酷斃了」,人工智慧無人駕駛帶給人們的震感無以言表,然而,在以後科技的發展進步中,這也只是人工智慧的冰山一角!隨著社會的發展,城鎮化水平的進步,城市交通問題愈發凸顯,而「如何使交通技術能夠登上一個新臺階」也一直成為國內外的熱點,智能交通上的研究趨於明顯。
  • 九型人格|看看你屬於哪種人格類型?
    九型人格心理學家把人格分為九大基本類型,然後在此基礎上討論各種人格的特徵、變化、成因等內容。這九種人格類型分別是:  1號——完美型(完美主義者)   1號人格者認為人必須用正確的方法做正確的事,具有強烈的是非觀念與道德觀念。
  • 淺析INFP人格類型特徵
    加上感知型的偏好,也就是樂於接受不確定型的信息的偏好,在面對用主觀感情色彩處理過的問題之後,他們不會拒絕這種突然的情緒,也不會給這個情緒做一個決定使其有一種歸屬於是就結束了,而是會感受這種痛苦。再加上內向的性格賦予給他們強烈的內心情感,就使得INFP類型的朋友情緒極其深刻。
  • 我第一次算命的經歷
    現在回想起來,我最早的一次的算命經歷是在我大約三歲左右的那個時候,那個時候我對算命根本就是沒有認知的。你想一想,一個三歲的小孩兒怎麼會對這個東西有什麼認知呢。當時大致情況是:我模糊記得我奶奶找人給我算了命,然後當時具體說什麼,我是我肯定是不知道的,就是聽了也聽不懂啊!