碩士論文研究「AI預測性取向」:化妝等因素並不影響判斷

2021-01-08 機器之心Pro

機器之心報導

機器之心編輯部

2017 年,史丹福大學的一篇《深度學習通過面部識別判斷性取向超越人類》曾引發了極大爭議,其通過 AI 算法僅需「看面相」即可判斷一個人是不是同性戀的方法讓眾人感到一絲恐慌,也讓技術研究者們對於算法的偏見提出了很多意見。最近,來自南非普利托利亞大學的 John Leuner 在自己的碩士論文中再次嘗試了 AI 識別同性戀的方法,並獲得了「更為嚴謹」的結果。

這項技術可以無視人類的服裝、化妝、拍攝角度等變量,實現男性 63%、女性 72% 的準確率。準確率比人類更好,並不再受到受試者種族、國籍的幹擾。現在,喬裝打扮也不會讓你變得更 Gay 了。

各種人工智慧對於面相的判斷,不知道圖靈若是知道了會怎麼想……(圖片來源 The Verge)

與此前史丹福大學的研究不同,在社交網絡上人們對於這篇新論文的看法也有不少正面評價:其在判斷性取向的時候考慮了人的年齡和種族等其他因素,從而排除了 AI 算法陷入錯誤認知的問題。

當然,對此研究本身,依然存在著質疑。

如 Reddit 用戶 PK_thundr 瀏覽完文章表示,「他們的『5 像素』分類器對高度模糊面部的判斷幾乎和實際面部一樣好。所以,我並不信服從面部圖像預測性取向的結論。」

「機器學習預測性取向」一直是一個較為「敏感」的話題。這篇論文的發布,如同 2017 年斯坦福的研究一樣也在 reddit 上引起了大家廣泛的討論,感興趣的同學可查看 Reddit 原帖:

帖子連結:https://www.reddit.com/r/MachineLearning/comments/b0nkeo/r_a_replication_study_machine_learning_models_are/

其實不只是根據面部圖像預測性取向的研究,近年來隨著人工智慧的火熱,我們看到了越來越多「匪夷所思」的應用,包括「AI 相面」、「基於面部圖像的犯罪概率判斷」等等……這引發了人們對隱私、研究可靠性的擔憂。對此話題感興趣的讀者,可在此文章下留言探討。

接下來,機器之心編譯介紹了這篇研究論文的相關技術內容,重點介紹了數據集與機器學習模型。

原理

這篇論文遵從前人的思路,試圖探索深度學習觀察人類面部判斷性取向的原理。

Ag¨uera y Arcas 等人對此前史丹福大學 Yilun Wang&Michal Kosinski 的研究做出了回應,並為他們的發現提供了其它解釋。他們沒有將根據人臉圖像檢測性取向的能力與生物起源聯繫起來,而是認為機器學習模型是根據隱藏在顯眼處的表面特徵來學習的。通過檢查 W&K 發布的同性戀和異性戀男女的合成圖像,他們注意到以下明顯差異:

合成的異性戀女性面部有眼影,而女同性戀沒有。男同女同臉部圖像上都有眼鏡,而異性戀者沒有。直男面部毛髮又多又黑。合成的男同臉部比直男更鮮亮,而直女的臉部比女同的更鮮亮。

髮型和化妝對於判斷一個人是否為同性戀雖然有一定的參考價值,但顯然背離了「看面相識別性取向」的原則。這種識別方法明顯存在一定偏見。

模型

為了實現更準確的判斷,研究人員改進了史丹福大學研究中的計算機視覺模型,以獲得更好的效果。他們提出的模型包含 VGG 和 Face++兩種方法。

其中的一部分使用 VGGFace(一個預訓練的深度學習神經網絡)來提取人臉照片的特徵,然後根據這些特徵訓練了一個 logistic 回歸模型來預測目標圖像的性取向。

VGGFace 是用來從人臉圖像中識別個體的卷積神經網絡。它是在一百萬張照片上訓練的,這些照片來自 2622 個不同的名人。雖然該神經網絡最初是為了從人臉圖像中識別個體而開發的,但去掉網絡的最後一層之後,我們就能獲得模型用於其最終分類層的面部特徵。

這些由深度神經網絡產生的特徵對人類來說通常是不可解釋的,但可被視為一張人臉的數字表示。該模型獲得的輸入信息是由 Face++模型提取的面部器官裁剪圖像,這些圖像會按比例縮小為 224×224 像素解析度。

模型的另一部分就是 Face++(可作為服務訪問的外部模型)來為每張人臉圖像提取面部「標記」。然後利用根據這些標記得出的距離來訓練 logistic 回歸模型,以預測目標圖像的性取向。

這些標記是描述面部特徵位置的面部度量。Face++為每張臉返回固定數量的標記點。標記分為幾部分:

圖 1.2:面部形態機器模型用作輸入的面部形態「標記」。

上圖展示了算法對於人類面部器官的識別點,每個器官由十個或更多點組成,整個面部總共有 83 個點。隨後,算法會為每個面部器官建立邏輯回歸分類器,並為整個面部的所有器官創建分類。為了預測每個圖像中個體的性取向,研究人員使用主成分作為自變量和性取向標記作為因變量訓練邏輯回歸模型。

下面重點來了,為了減少深度學習的「偏見」,此研究試圖探索膚色是否會影響計算機對性取向的判斷。為了實現目標,模型會將輸入的面部圖像簡化為 5×5 像素的模糊圖,進而進行邏輯回歸預測,男性和女性分別建模。

數據集

為訓練模型,研究人員總共檢索了 50 萬張照片並建立了數據集。表 4.1 列出了從每個數據源中下載的每種照片的數量。

表 4.1:從每個數據源檢索到的每種照片的數量

本文貢獻

本文對社會心理學領域的貢獻:

本文複製了先前利用機器學習技術根據人臉照片預測性取向的研究。研究表明,根據約會檔案中的照片進行訓練的深度學習分類器和面部形態分類器都能夠預測性取向,而且做得比人類更好。該模型利用了不受種族或國家限制的新數據集。本文引入了新的機器學習模型,用於測試能否對高度模糊的人臉照片進行性取向預測。結果表明,根據高度模糊的人臉照片中面部和背景的主要顏色信息能夠預測性取向。研究表明,故意改變一個人的外表以迎合同性戀和異性戀的刻板印象並不會改變由機器學習模型生成的性取向標籤。研究表明,頭部姿態與性取向無關。研究表明,不管添加或是去除面部毛髮和眼鏡,模型都能預測性取向。

論文:A Replication Study: Machine Learning Models Are Capable of Predicting Sexual Orientation From Facial Images

論文連結:https://arxiv.org/abs/1902.10739

摘要:最近的研究使用機器學習方法根據人臉照片來預測一個人的性取向。為了驗證這個結果,我們重新做了其中的兩個模型:一個基於深度神經網絡(DNN),一個是基於面部形態學(FM)。使用來自約會網站的 20910 張照片組成的全新數據集,確認了兩個模型預測性取向的能力:DNN 預測男性性取向的準確率為 68%,女性 77%;FM 預測男性性取向的準確率為 62%,女性 72%。為了調查亮度、主要顏色這樣的面部特徵是否會影響性取向的預測,我們創造了一種基於高度模糊面部圖像的全新模型。這個模型也能夠預測性取向(男性 63% 準確率,女性 72%)。當主體刻意化妝、戴眼鏡、面部毛髮遮擋、變換面部拍照角度時,測試發現模型對這些變化保持穩定。這說明,拍照角度與性取向判斷無關。同時證明,約會簡照包含豐富的性取向信息,這引起的一個問題是:預測結果有多少是由面部形態決定的,有多少是由衣飾、展示角度和生活方式決定的。新技術的出現讓我們能夠以這種方式檢測性取向,而這可能對同性戀者的隱私與安全產生極大影響。

本文為機器之心報導,轉載請聯繫本公眾號獲得授權。

相關焦點

  • 徐若瑄被曝光「碩士論文研究自己」引發廣大網友熱議
    不老女神「Vivian」徐若瑄去年才開心宣布已順利在碩士在職專班畢業,透露除了領取證書,還得到「傑出表現獎」,讓在場人士都為她稱讚。不過,近日有人在ptt爆料,表示徐若瑄的碩士論文竟是研究自己,引發熱議!
  • 「我要出軌了」!伯克利的這個AI,可以預測機器人何時將脫離
    很多人認為「脫離」次數越少,就能說明一個自動駕駛系統能力越強。因此,以往的研究都會把「脫離」當作是故障來排除掉。但最近,UC伯克利的研究人員卻「以毒攻毒」,直接用這樣的數據來訓練機器人,預測未來何時將發生脫離事件。
  • 2018 公開課盤點學術篇:連結優秀的年輕 AI 學者,「大講堂」讓新生...
    另一方面,關於 output 對模型性能的影響,關注度並不是很高。在本次分享中,將介紹一下關於 output embedding 對於 semantic parsing 的影響。回看網址:http://www.mooc.ai/open/course/5445.
  • 2分鐘論文 | 用 谷歌「AI可解釋性」 看懂機器學習
    還配上了《紐約時報》一篇名為《谷歌研究人正在搞懂機器學習》的文章。點進這篇文章發現,Jeff Dean意指論文《The Building Blocks of Interpretability》(譯名:可解釋性的基石)在神經網絡可視化方面的新進展。
  • AI預測大選結果驚人,民調可以「下課」了
    另一家公司總部位於加州的Unanimous.ai公司銷售所謂的「群體智能」軟體。它使用人工智慧模型來匯總群體的預測和決策。 美國民意研究協會的一份報告得出結論說,州級民調「低估了川普在中西部北部的支持率」。
  • 創新工場論文入選NeurIPS 2019,研發最強「AI蒙汗藥」
    這篇論文圍繞現階段人工智慧系統的安全性展開研究,具體而言,文章提出了一種高效生成對抗訓練樣本的方法 DeepConfuse,通過微弱擾動資料庫的方式,徹底破壞對應的學習系統的性能,達到「數據下毒」的目的。
  • ACL的「深度學習熱」:論文紛紛「入坑」,企業蜂擁「入局」|ACL 2017
    這個決定在深度學習開始廣泛應用的去年來看,隱約透露出組委會鼓勵多做創新性論文,避免在深度學習上越鑽越深的想法。而在今年衝擊 ACL 最佳論文的傑出論文(outstanding paper)宣講現場上,大多數論文並沒能跳出深度學習的「大坑」,「套路感」滿滿:我們怎麼處理數據、我們怎麼訓練、我們的方法比起之前提高了多少百分點......看起來不免讓人覺得有些審美疲勞。
  • 創新工場「數據下毒」論文入選NeurIPS 2019,AI安全問題需要引起...
    這一技術的研究並不單單是為了揭示類似的 AI 入侵或攻擊技術對系統安全的威脅,而是致力於在深入研究相關的入侵或攻擊技術的基礎上,有針對性地制定防範「AI 黑客」的完善方案,對 AI 安全攻防這一前沿研究方向的推動與發展具有積極指導作用。
  • 處女作就拿下 KDD 雙料最佳論文runner-up,「半路出家」的他用深度...
    或許大家也看到了他的局促不安,因此在問答環節的時候,只有一位觀眾非常「友善」地提了一個不痛不癢的問題;同一場次至少要讓觀眾提三四個問題的主持人也沒有「刁難」他,很快地邀請下一位講者上臺;在 Vandal 演講完畢下臺的時候,他抱著電腦快步離開,甚至忘記了把身上別著的麥克風摘下來遞給下一位講者;而當他回到後排座位上的時候,臉上終於流露出自然而放鬆的神色。
  • DeepMind,哈佛造出了 AI「小白鼠」:從覓食,擊球窺探神經網絡奧秘
    機器之心報導機器之心編輯部我們可以用研究小白鼠的方式來研究 AI 嗎?或許可以。在一篇 ICLR 2020 Spotlight 論文中,DeepMind 和哈佛大學的研究者構建了一個基於 AI 的虛擬小鼠,能夠執行跑、跳、覓食、擊球等多項複雜任務。他們還嘗試用神經科學技術來理解這個「人造大腦」如何控制其行為。
  • 創新工場「數據下毒」論文入選NeurIPS 2019,AI安全問題需要引起關注
    這一技術的研究並不單單是為了揭示類似的 AI 入侵或攻擊技術對系統安全的威脅,而是致力於在深入研究相關的入侵或攻擊技術的基礎上,有針對性地制定防範「AI 黑客」的完善方案,對 AI 安全攻防這一前沿研究方向的推動與發展具有積極指導作用。
  • 騰訊AI Lab 聯合研究登上Nature子刊,獨創方法提升蛋白質結構預測...
    該項聯合研究成果於近日登上了國際頂級期刊 Nature 子刊《 Nature Communications》。論文題為《人體類固醇II型5a還原酶與抗雄激素藥物非那雄胺的結構研究》,由南科大生物系魏志毅副教授課題組與匹茲堡大學張誠教授、新加坡 A*STAR 研究所範昊研究員、騰訊 AI Lab 黃俊洲博士帶領的研究小組合作完成。
  • 「都戴上口罩了,化妝給誰看?」,女生到底為了什麼一定要化妝
    我認為化妝是給自己看,想讓自己變得好看、希望能突出自己的認定的「美」,並不為呈現給任何人。但我「認為」與「實際」的想法是否相同?這備受「父權」理念質疑,簡易說,父權是以男性為中心的思想和體制。化妝是父權體制下的產物嗎?
  • 鵬城實驗室迎來兩大領域 AI 學術前沿研究報告,首期「AI 科學家...
    「AI 科學家」系列沙龍活動在深圳鵬城實驗室圓滿召開,本次活動主題為《人工智慧在學術領域的前沿研究》,邀請的嘉賓陣容包括上海交通大學高級金融學院金融學教授李祥林以及上海交通大學教授、「吳文俊人工智慧博士班」班主任盧策吾,來自於金融系和計算機系的兩位頂尖教授,在現場向與會者分享了 AI 在各自學術領域的前沿研究。
  • 研究「屁」的碩士論文又火了,網友吵翻...
    近日,一篇題為《關於屁的社會學研究》的碩士畢業論文在網上流傳,受到廣泛關注。專家表示,態度端正,怪題也能成經典。而網友看後卻吵翻了......研究「屁」的碩士論文又火昨晚,話題#碩士畢業論文研究屁#登上熱搜榜第四名,一時間引起不少網友的議論。
  • 你的論文能否中頂會?這篇分析同行評審結果的論文可幫助你
    在人工智慧領域,會議論文是證明研究人員學術水平的重要一環。是否存在一些「技巧」可以提高論文被大會接收的機率?人工智慧是否可以幫助我們?近日,來自卡耐基梅隆大學(CMU)研究者們收集了上萬篇 AI 頂級會議的接收/被拒論文,並使用機器學習工具進行分析,獲得了一些有趣的結果。
  • 預測未來?Google 用 AI 模型實現了「近乎實時」的天氣預報
    對人類來說,時間一直是最大的敵人,超越時間一直是人類的夢想,「預測未來」就是人類想要超越時間的一種方式。天氣預報就是生活中最常見的一種「預測未來」,但就像剛才說的,預測天氣同樣也是非常困難的一件事。▲ 圖片來自:British Council Learn EnglishGoogle 最近在官方的博客中分享了一項新的研究,該研究聲稱 Google 實現了「近乎實時」的天氣預報。
  • 結合視覺和聽覺進行情感預測|一周AI最火論文
    原文:https://arxiv.org/abs/1907.10420SMILY:一個以人為中心,相似圖像的病理搜索工具谷歌AI最近分享了兩篇研究論文,描述了在醫療保健領域類似圖像搜索的人機互動研究進展。在第一篇題為《SMILY: 組織病理學的相似圖像搜索》的論文中,他們描述了一個基於ML的工具,用於病理學中的反向圖像搜索。
  • 引用率過萬的論文出錯?從「詞類比」說起
    除了其詞向量的貢獻外,一個讓人印象深刻的貢獻便是指出NLP中「詞類比」的現象,最經典的例子莫過於「國王-男人+女人=皇后」。Mikolov在另外一篇引用率極高的文章《Linguistic regularities in continuous space word representations》中也著重強調了在連續空間詞表示的語言規律。
  • AI學會「搞」科研登Nature,知乎網友:不忍直視的水
    然而對於熟悉人工智慧的人來說,該研究有些奇怪的是:論文中模型使用的技術是「詞嵌入」——既不是卷積神經網絡,也不是循環神經網絡等更複雜的模型。這麼簡單的模型,真的可以幫助我們找到成百上千研究者多年來從未找到的新材料嗎?這篇文章發表之後引來了機器學習社區的大量反對意見,人們紛紛對這樣的「灌水」行徑表示不忍直視。