壁虎按:去年(2017)的這個時候,史丹福大學的兩位研究人員做了一個驚人的研究:「用人工智慧(AI)來判斷一個人是不是彎的」。他們社交網站上抓取了幾十萬張照片,來訓練一個面部識別系統,目的是為了確定某人是直的還是彎的。這個去年被媒體炒到風口浪尖的報導到底幾分屬實、幾分炒作,讓我們深入討論一下。
(courtersy: pinterest.com)
這項研究首先得到了《經濟學人》雜誌的報導,然後全世界媒體不分三七二十一蜂擁追隨報導。我們甚至看到國內媒體也開始瘋轉「新人工智慧可以憑照片判斷性取向」加上「準確率超過」多少多少等驚人標題。或者會有投機倒把的APP和小程序出現,宣稱可以通過你的照片判斷你是直是彎。
(《經濟學人》2017年9月的報導)
但是稍微用一點邏輯和批判思維去思考,我們就知道事情絕不會這麼簡單。認真閱讀原研究就知道結論很明顯:僅基於這項研究,AI無法直接從照片判斷某人是不是同性戀者。
讓我們先回顧一下去年的這一份語驚四座的研究吧。這份研究由Michal Kosinski和王一倫(音譯,Yilun Wang)撰寫。該論文指出:「鑑於單一的面部圖像,該軟體能夠在81%的案例中區分男性同性戀和異性戀,在71%的案例中可以正確地區分女性同性戀和異性戀。」
從表面看來,這聽起來像「通過觀察他人的照片,人工智慧可以判斷男人是男同性戀還是直男。」也因此這被推向頭條新聞。但是這並不是這個結論的正確意思。
事實上,AI識別同性戀的概率並不是81%。而是給AI兩張照片(一張同性戀照片、一張異性戀照片),然後詢問它哪一個更可能是同性戀。他猜測的結果的正確率是男性81%,女性71%。也就是說他猜測的基線是從50%開始的——因為即使隨機猜測,它也有50%的概率正確。雖然它的結果好於50%,但也不能說明它猜測某人是不是同性戀的正確概率是81%。
所以我們不必害怕私生活包括性取向會在你去機場或看球時被人工智慧掃描出來。因為目前沒有太多證據表明這項技術可以做到這一點。
(courtersy: pinterest.com)
於此同時,這份研究的結論確實比隨機瞎猜(即50%)的概率要高出很多。讓我們來探討一下Kosinski和Wang的研究中得出較高正確率的原因到底是什麼?兩位作者表示,這個軟體主要學習和識別「差異」:即男性面孔中的女性特徵以及女性面孔中的男性特徵,但是它也會被其他信息,例如表情和傷疤所迷惑。
然而,這份在概率上相當成功的研究所使用的樣本選擇是帶有選擇偏差的。正如奧柏林學院的社會學家Greggor Mattson在一篇文章中指出:當研究者所使用的圖片都來自交友網站時,這本身就是有問題的。因為人們在選擇放什麼照片上去的時候本身就帶有選擇性,而這些選擇性和社會對同性戀以及異性戀的審美和社會期待/規勸有著很大關係。
(courtersy: pinterest.com)
舉個例子,在Blued上,我們會觀察到更多男生使用美顏、瘦臉、或者放大眼睛等照片處理手段,而在陌陌上,會有更多男生會選擇更加符合男性氣質的照片。另外,無論中外,男同性戀對於肌肉的表現欲和皮膚的護理都有較為明顯的集體性特徵。並且原研究為了縮小適用性,所有受試者都是白人,並且沒有包括雙性戀和跨性別者。也即是說一個gay,在社交網站上放上瘦了臉和放大眼睛的照片,更多說明的是社會和集體期待這樣一個長相,而不是這個長相與他本身的性取向之間的關係。
(courtersy: pinterest.com)
另外,更加重要的是,在黃壁虎之前發布的一篇文章中我們就深度討論過「異性戀/同性戀到底是不是天生的」這個問題。諸多當下的研究都更傾向於表示「性取向由生物學決定」這個論斷是站不住腳的。倫敦國王學院的Qazi Rahman是一個傾向於支持性取向主要依賴於生物學的學者,但是就連他也表示:「面部形狀和性取向可能有一個共同的原因——子宮內荷爾蒙的平衡——但這並不意味著面部形狀可以可靠地預測性取向。」【還記得我們之前「異性戀是天生的嗎?」這篇文章裡提到的「同母兄弟的出生順序效應」嗎?】
[同母兄弟的出生順序效應, 簡單來說:弟弟比哥哥更容易彎。
至於為什麼,詳情點擊閱讀《異性戀是天生的嗎?》]
但是,Michal Kosinski和Wang的這份研究激起了我們對人工智慧整體發展的擔憂。
Kosinski甚至表示:「這份研究的目的是讓人們認識到人工智慧的危險,並發出警告。如果面部識別很快就能識別某人的性取向,那麼下一步會不會是他們的政治觀點、犯罪傾向、甚至是他們的智商。」
Kosinski的這種論述不禁讓人發憷,這簡直就是恢復了19世紀到20世紀的那一套以貌取人的偽科學和種族主義。還依稀記得電影裡納粹使用卡尺衡量不同人種的腦門的畫面嗎?還記得日本軍國主義的人體試驗嗎?還記得古代人通過外貌特徵來判斷某人是不是巫師嗎?就連Kosinski也表示:「這是一個有爭議和令人不安的主題,它也讓我感到不安。」
(courtersy: pinterest.com)
我們以前是如何判斷同性戀的?
將性取向簡單的歸咎於一個生理表現的解釋,曾經是有過悠久且不光彩的歷史的。19世紀的歐洲人通過對女同性戀的陰蒂的測量,以及男同性戀的臀部的測量來判斷雞姦犯,並加以刑罰。20世紀,西方又有好幾次偽科學地「宣布發現同性戀基因」「同性戀大腦結構」。到今天民科盛行的時代,我們又多出很多例如「同性戀無名指」「同性戀掌紋」等等令人啼笑皆非的流言。
這類想法經久不衰,從古希臘到19世紀科學興起的時代,哪裡都有相貌決定人性的支持者。在中國我們將這類操作稱作面相學或者相面。有些會通過測量某人的前額和鼻子來判斷一個人是誠實的還是有罪的。如今在大數據和人工智慧時代,這種想法又重新興起:大數據和人工智慧可以識別犯罪分子、高智商人士、弱智、同性戀等觀念和研究又層出不窮。面孔的偏見似乎永遠不會消失。
(Giambattista della Porta的 De humana physiognomonia libri IIII(1586))
其中通過人類和動物長相的相似點進行分析
Kosinski和Wang在論文中清楚地表明了「外貌決定論」或者「機器相面」的危險,並指出「這種做法實際上是科學、迷信和種族主義的混合物。」
更加恐怖的技術應用讓人脊背發涼。我們知道在很多國家同性戀仍然會被迫害甚至處以死刑,例如在沙烏地阿拉伯和車臣。如果在這些地方,有人決定製作一個人工智慧Gaydar,後果會是怎樣?
往期文章
往期【壁虎科學】