「微笑傳遞」背後的數據分析

2022-01-06 大數據文摘

點擊標題下「大數據文摘」可快捷關注

「微笑挑戰」最近火了:左邊放上點名者照片,右邊放上自己的微笑,再點十個人……這不就是趁機曬自拍嘛!

更有(洋蔥)新聞犀利指出:【女生都會選比自己丑的朋友——點你是因為你沒我好看哦……】還能不能好好做朋友啦!?

——別怕,科學青年來教你自拍了!

本文發布於Pansci,原標題What is the best pose for a selfie,發布時有改動。

(Jia-Bin Huang)為什麼有些人自拍出來的照片總是特別地好看?很明顯,自拍時相機與臉之間的相對角度佔了絕大部分的因素。打開網絡搜尋,很快地就可以搜尋到非常多與擺姿勢相關的技巧教程。然而,這些教程往往太過抽象而不容易簡單地運用在日常生活中。我們心中不免疑惑,究竟要怎麼樣擺姿勢才是最好看的呢?

不同於專家的意見,我們直接試著從數據中找出規律來。我們這裡選了3位網絡「正妹」來做分析:

從左到右依次為:Julie Chang(張齊郡)、張香香、Mika 黃杏蕙。

圖片來自Facebook.

選擇這3位有兩個主要的原因:第一、她們在Facebook上都擁有高人氣,表示大家都相當喜歡她們的狀態更新;第二、我們需要大量的數據進行分析以免得到不可靠的數據,3位正妹在Facebook公開的上千張自拍照片即成了有用的資料。

數據處理

要分析正妹們自拍時如何擺POSE,我們得先從影像中估算臉與相機間的相對角度。大致上可以分為3個步驟:

首先用現成的軟體批次下載正妹們在Facebook上公開的照片;

其次我們用Open CV中的人臉偵測軟體來自動地標示每張照片裡臉部的位置;

有了臉部的偵測,我們接著運用計算機視覺的技術來估算臉部3D的Pose。

在這裡我們使用空氣動力學中的俯仰(Pitch)、 扭轉(Yaw)和橫擺(Roll)來表示物體(正妹)與觀測者(相機)間的相對角度。簡單來說,在人臉的情況下,俯仰指的是鼻尖指向相機下方或是上方,扭轉則是表示左臉或是右臉,橫擺用來表示臉傾斜的角度。下圖我們借用飛機來解釋。

圖片來源: theboredengineers.com


俯仰、扭轉和橫擺一維邊際分布

有了照片中估算的角度,我們可以用Kernel Density Estimation 的方法來估計3位正妹各自的俯仰、扭轉和橫擺的一維機率分布為何。其中,Pitch、Yaw、Roll分別為俯仰、扭轉、橫擺的角度。結果請見下圖左側。

Julie Chang(張齊郡)

張香香

Mika黃杏蕙


從這些數據我們可以學到什麼東西呢?

首先,我們可以看到3位正妹在俯仰度(藍線)的選擇上相當一致,絕大部分的自拍照都選擇將臉朝下15°左右的姿勢。這和一般人對於自拍的認知相符合,臉朝下自拍往往可以有瘦臉的效果。經由影像分析我們得到15°左右也許是最佳的結果。

第二,我們觀察到扭轉度(綠線)的選擇上有蠻大的差異。例如說,Julie Chang(張齊郡)習慣性地會將她的右臉面向相機,而張香香則是較喜歡露出她的左臉。然而,不論是傾向左臉或右臉,橫擺的角度大小通常為20°左右。也許在這樣的角度底下,可以讓自拍照片臉部特徵更加立體。至於個人左右臉哪個比較具吸引力,可能需要自己看鏡子練習一下才能得知了。

第三,3位正妹照相時橫擺角度(紅線)似乎沒有太大的變化,絕大部分的照片都在0°左右。不過還是可以從比較中還是可以觀察出些許不同。比如說Julie Chang(張齊郡)較偏愛在自拍中選擇較大的橫擺角度。


俯仰扭轉聯合分布

雖然上面的一維機率分布較為簡單直覺,但是往往會過於簡化而忽略了數據中各維度相互的影響。我們在上圖右側畫出二維的分布。從中我們發現,Pitch-Yaw-Roll 角度之間並不是相互獨立(Independent)或是無關(Uncorrelated)的。這驅使我們去更進一步了解正妹們究竟是如何擺姿勢。 我們用了Mean-Shift 算法從一堆相片之中,找出機率分布中的模式。其中,Pitch、Yaw、Roll分別為俯仰、扭轉、橫擺的角度。以下是Mean-Shift做分類的結果。

Julie Chang(張齊郡)

張香香

Mika 黃杏蕙


從數據中找出代表性姿勢

有了從Mean-shift 得到的聚類分析(Clustering),我們可以利用影像「平均」來可視化我們找到具有代表性的自拍姿勢。下面我們對這3位正妹各選了12張代表性的自拍姿勢。

Julie Chang(張齊郡)

張香香

Mika 黃杏蕙

人臉姿勢的數據還可以做些甚麼呢?這裡有個簡單的應用。我們使用估計出來的角度做排序,就可以產生下面沿著不同POSE而改變的影像。

Julie Chang(張齊郡)

張香香

Mika 黃杏蕙

當然,從3位正妹的自拍照片我們很難去做明確的結論,希望同樣的技術可以運用在大量自拍高手的照片上,相信屆時我們將能從中發掘每種臉型最適合的自拍姿勢。

編輯:聞菲 摘自:果殼(guokr.com)

大數據文摘精彩文章:

回復算法 既漲知識又有趣的人和事

回復谷歌 看其在大數據領域的舉措

回復院士 看眾多院士如何講大數據

回複色情 這個,你懂的,可是你真的懂嗎?

回復隱私 看看在大數據時代還有多少隱私

回復醫療 查看醫療領域文章6篇

回復徵信 大數據徵信專題四篇

回復大國 "大數據國家檔案"之美國等12國

回復體育 大數據在網球、NBA等應用案例

回復平安 中國平安相關大數據案例、新聞

回復志願者 了解大數據文摘及如何加入

相關焦點

  • 詳解ERP系統與MES系統的數據傳遞
    MES系統是一個以排產為核心的、功能上很完整的生產管理系統,它所需要的所有基礎數據都可以在MES系統內部生成和維護。但是,MES用戶一般要把MES系統與ERP系統同時使用,這兩個軟體在數據上和功能上的連通將會給用戶帶來最大的效益。本文將按照數據的傳遞方向「從ERP到MES」和「MES到ERP」分別介紹MES系統如何與其他軟體連接,才能讓用戶得到最大限度的收益。
  • EXCEL數據分析功能詳解
    1、 首先,在EXCEL的選項中通過加載項打開數據分析功能;2、 啟動加載項後,在菜單裡的數據選項卡中可以找到數據分析功能;因此,採用一種概率的陳述方法,也就是數理統計中的區間估計法,即估計值與總體參數在一定允許的誤差範圍以內,其相應的概率有多大,這個相應的概率稱作置信度。
  • 北鬥時間頻率傳遞裝置
    TAI合作旨在產生國際標準時間——UTC,CCTF- K001.UTC是國際時間頻率領域唯一的關鍵比對,其中應用最廣泛的比對鏈路即是GPS時間傳遞鏈路,北鬥時間頻率傳遞加入到UTC計算中將加強中國的話語權,是北鬥系統的重要國際應用;同時通過北鬥時間監測數據使得北鬥時間與UTC保持直接關聯,促進北鬥系統自身國際化。
  • R數據分析:列線圖的做法及解釋
    Nomogram,中文常稱為諾莫圖:Nomograms are visual and intuitive, which helps the general population and health managers to undersand the risk of diseases more easily簡單來說這個東西就是來幫助病人或者醫生來預測某種結局的風險的工具,其核心是背後的預測模型
  • 數據分析入門系列教程-SVM實戰
    特徵選擇我們做特徵選擇的目的就是為了降維,用少量的特徵代表數據的特性,從而提高分類器的泛化能力,避免模型過擬合。因為 mean,se 和 worst 分別是每個特徵的三個不同度量方式,所以可以只取 mean 一類作為代表。又因為上面的相關性分析,可以把相關性高的特徵中選出一個作為代表即可。
  • 矢量大數據空間分析、大數據可視化...GIS結合大數據大千世界深度洞察
    MapGIS 10.3將GIS與大數據技術結合,基於Hadoop、Spark等分布式計算框架,實現地理大數據的高效存儲、分析與可視化表達,全面提升地理大數據能力。數據存儲一直是大數據需攻克的難題之一。Hbase管理MapGIS 10.3重點提供四大類數據計算分析服務,分別是:矢量大數據,實時大數據,影像大數據,文本大數據計算分析服務。
  • 《關鍵對話》:高效溝通與數據分析的意義不言而喻
    對於從事數據分析相關的夥伴而言,因為在日常工作中需要能夠協調各個部門資源以及收集反饋意見等事項, 因此,在分享之前,來看看幾個常見的工作場景:▶會和業務對接,需要溝通分析的需求,明確分析目的····▶對於數據產品來講,要會和開發對接,明確產品需求····▶在做完分析後,發現問題或者機會、執行的計劃的時候,要做細緻分析以及測試
  • Python數據分析用到的幾個重要的庫
    它提供了以下功能(不限於此):除了為Python提供快速的數組處理能力,NumPy在數據分析方面還有另外一個主要作用,即作為在算法和庫之間傳遞數據的容器。對於數值型數據,NumPy數組在存儲和處理數據時要比內置的Python數據結構高效得多。此外,由低級語言(比如C和Fortran)編寫的庫可以直接操作NumPy數組中的數據,無需進行任何數據複製工作。
  • 2016美國大選川普獲勝下任總統,探究美國大選背後的個人隱私與大數據.
    所以在今年的美國總統大選中,兩黨對數據收集、分析、整理和使用的高度重視,也就不算是難以理解的舉措了。在進入新世紀之前,美國總統競選採用的還是延續多年的方式:電視廣告、電子郵件、上門拜訪、社區活動和巡迴演講。
  • 美國東海岸六航母同時趴窩,背後傳遞一個兇兆,海軍進入緊急狀態
    因為在美國東海岸上,停留著對美國海軍意義可謂重大的6艘超級航母,這6艘超級航母都布局於美國東海岸地區,如果有一艘出了閃失,那麼對於美國來說,首都華盛頓將面臨著重大危機,那麼為什麼深知背後的危害,美軍還要這六艘超級航母停留在東海岸?這是在幹什麼?
  • Neo4j 數據分析—附薅羊毛教程
    很多關於圖資料庫的介紹都側重在其作為資料庫的性能和操作層面,今天我們就從數據科學家和商業分析師的視角來看一看 Neo4j 在數據分析上的應用。在開始之前先來看一下普通用戶如何獲得 Neo4j。Neo4j分為社區版和企業版,普通用戶想使用或體驗的話可以下載 Neo4j Desktop 或者使用 Online Sandbox版本。
  • 阿薩德的微笑-俄羅斯撤軍背後!
    儘管我們知道這些海盜的背後是某個國家,但也不能隨便用快遞啊。還有,最近,我知道我們和俄羅斯在北極弄了一個天然氣項目,並隨之要開拓北冰洋航線。未來我們在葡萄牙的大西洋海面上還有基地。所有這些,都需要我們加大海軍建設,你怎麼能說這就夠了呢?我們不但要小餃子,還要擺一場豪華的餃子宴。」大師雖然是個程式設計師,但對於這個世界邊邊角角的事情了如指掌,顯然,他的主要業餘興趣都放在這裡了。
  • RFM模型數據分析
    在分析人群的時候,我們可以分析到我們店鋪的買家對我們店鋪的忠誠度,對於忠誠度比較高的客戶,我們是一定要想辦法留住他們的,而根據不同的等級給與不同的優惠和營銷活動對於留住老顧客的幫助也是很大的。 在客戶關係管理(CRM)的分析模式中,有一個模式是很經典的,那就是RFM模型,RFM模型的具體內容大家可以百度百科一下,那樣會有詳細的講解,簡單的來說,RFM模型是會員管理中對會員消費行為分析和總結的一種模型,每一個字母代表一種會員的行為要素:R:最近一次消費(Recency)。F:消費頻率(Frequency) 。
  • Python人臉微笑識別2-----Ubuntu16.04基於Tensorflow卷積神經網絡模型訓練
    本次博客,我們將通過Tensorflow進行神經網絡進行微笑數據集的模型訓練,然後通過Opencv實現對微笑人臉的檢測Tensorflow版本:Tensorflow-2.2.0Python版本:Python-3.6
  • 利用maltab的system identification獲取系統的傳遞函數加速你的環路設計
    實現方法:利用仿真軟體獲得系統從控制到輸出的bode圖數據,然後將數據導入到system identification,使用波形分析功能來獲得傳遞函數,一般能達到90%以上的吻合度,這就說明是識別出來的傳遞函數已經足夠精確,完全可考慮拿來使用了。有了準確的傳遞函數就可以利用昨天發的那篇文章來實現設計。
  • 數據分析常用的四大戰略分析工具
    戰略一詞就被認為是一種長遠的規劃,遠大的目標,需要全局規劃,其制定自然就離不開戰略分析。戰略分析通過收集和分析各類因素,從多個角度考慮制定戰略。本文主要介紹4大戰略分析工具,對於數據分析師而言,這4大戰略分析工具,頻繁會被用到。一 SWOT模型所謂SWOT分析,S (strengths)是優勢、W (weaknesses)是劣勢,O (opportunities)是機會、T (threats)是威脅。
  • 大數據,怎樣讓「計劃經濟」重生
    她做出這樣的消費決策,就是因為商品價格的波動變化,至於價格波動背後的原因,是天氣惡劣導致運輸不暢,還是汽油價格上調導致運輸成本上漲,她統統不需要了解。每一個價格就是市場經濟運行的一面顯示器,用來輸出計算結果;每一次價格變化的背後,也有一套十分複雜的運算機制在運行。
  • Nat Biotech | 單細胞Hi-C數據分析識別多尺度3D基因組特徵
    收錄於話題 #前沿生物大數據分析 這項工作發表在《Nature Biotechnology》雜誌上的一篇題為「Multiscale and integrative single-cell Hi-C analysis with Higashi」的論文中。
  • 運營必備:數據分析的五大步驟
    、全行為路徑分析模型、用戶分群模型)(註:文末有連結可以再次閱讀),做為數據運營的從業者,這些數據分析模型是日常工作中必備的。在一個完整的數據分析落地過程中,按照先後順序,可以分為以下五步:確定目標、搜集數據、整理數據,分析數據、可視化呈現。
  • 【遊記】印象柬埔寨:高棉的微笑
    一進門就是一組和信仰相關的陳設:坦胸露乳肩扛靈蛇的佛像、眯眼微笑的佛頭、新採的蓮花、香案等等。說實在的,對於住過很多家酒店的我來說,這種檔次的酒店很常見,說不上很好,也說不上很差,有大堂、商品部、遊泳池、自助餐廳、露天餐位、區域網等等。總之無論硬體設施、軟體服務,如果不是吹毛求疵故意刁難的話,挑不出什麼毛病。