奧特曼、小豬佩奇、海賊王...AI人臉識別終於對他們下手了!

2021-02-15 AI科技評論
編輯 | 陳大鑫

挑戰1:請問上圖中的奧特曼從左往右分別是?

這還不簡單?——艾斯、傑克、奧特曼(初代)、賽文、泰羅。

不錯不錯,再來一次~

挑戰2:請問下圖中的奧特曼分別是?

如果這些奧特曼全部都看過一遍,識別起來好像也不是很難?AI人臉識別這件事,大家早已司空見慣,而豬臉識別似乎也不會令人增加保護欲。
下面的佩奇和路飛在不同的視角、光照、遮擋等環境下能不能被AI識別出來?
為了回答這件事情,作為小豬佩奇和海賊王的播放平臺愛奇藝下定決心:這裡的會員指的是iCartoonFace:一個卡通人臉識別的基準數據集,愛奇藝與此同時設計了卡通和真人多任務域自適應策略來提高卡通人臉識別的性能。這些數據集的相關成果已經發表成論文並被ACM MM2020接收。

論文連結:https://arxiv.org/pdf/1907.13394.pdf

論文背景

近年來,伴隨著卡通產業的迅猛發展,卡通視頻呈現出爆炸性增長。而實現對這些卡通視頻智能理解的第一步就是需要識別出這些視頻裡面的卡通人物身份信息。同時伴隨著人臉識別技術的發展,人物識別精度大幅提升,在Labeled Faces in the Wild(LFW)等圖片數據集上,人臉識別精度甚至超過了人類的識別能力。然而,對卡通人物身份的識別,卻鮮有研究,相關的數據集也比較少,如下表1。對於深度學習來說,這些已有的卡通識別數據集存在著數據量較小、噪聲比例較大的問題。因此構建一個大規模、高質量的卡通識別數據集,並對卡通人物身份信息進行識別,則至關重要。

iCartoonFace數據集:

為了減輕標註人工的工作量,我們設計了一種半自動數據集構建框架來得到iCartoonFace數據集,如下圖1。分層數據收集:從卡通專輯到卡通人物名稱,再到卡通人物圖片依次獲取。數據過濾過程:利用卡通人臉檢測、特徵提取器、特徵聚類等進行噪聲數據過濾,其中特徵提取器隨著標註數據的增多而性能不斷增強。Q/A問答:標註人員根據特徵聚類的結果,回答鳴人和超人的不同。圖1 半自動數據集構建框架iCartoonFace識別數據集是一個大規模、高質量的卡通人物身份識別數據集,如圖2所示,iCartoonFace識別數據集的統計特性如下:大規模:iCartoonFace識別數據集包含5013個卡通人物、389,678張圖片,來源於1,302卡通專輯,是已知目前最大的手工標註卡通人物身份識別數據集。高質量:數據集手工標註完成之後,我們採用交叉驗證的方式保證數據集標註錯誤率在5%以內。所有圖片的解析度高於100x100,超過65%的圖片解析度高於200x200。多樣性和挑戰性:從圖3可以看到,不同的卡通人物具有非常相近的外形特徵,同一個的卡通人物由於的表情、遮擋、角度等影響導致外形具有非常大的差異性。圖2 iCartoonFace識別數據集統計信息給定一張Probe集中的照片和至少包含一張相同卡通人物身份圖片的Gallery集,算法需要根據與給定圖片中卡通人物身份相似度對Gallery集中所有圖片進行排序。具體來說,Probe集中包含N個卡通人物、每個卡通人物有M張照片。對於每個卡通人物的M張照片,每次選取一張圖片作為probe照片,然後把剩餘的M-1張,再單獨每一張和distractors一起組成Gallery集,然後進行比對,然後計算rank1精度。經過N*M*(M-1)次比對後,得到的平均rank1精度作為本次任務的評價指標。在iCartoonFace卡通識別數據集中,有四類代表性的挑戰,如圖3所示:a)類間相似度高:來自不同人物ID的兩張圖片外觀看起來非常相似;c) 遮擋問題:人物面部會受到場景中其他對象的遮擋;d) 光線變化:所有的這些識別問題中遇到的問題,都需要我們的識別算法具有足夠的魯棒性。圖圖3  iCartoonFace卡通識別數據集代表性的挑戰

方法

我們提出了卡通和真人多人物訓練框架如下圖4所示,主要分為分類損失函數、未知身份拒絕損失函數和域遷移損失函數。圖4 卡通和真人多任務訓練框架分類損失函數:主要用來對卡通臉和真人臉進行分類,典型的表達式如下:未知身份拒絕損失函數:在不同域之間進行無監督正則化投影,表達式如下:域遷移損失函數:用來減低卡通和真人域之間的差異性,對他們的相關性進行約束,表達式如下:

實驗

我們比較了SoftMax、SphereFace、CosFace、ArcFace、ArcFace+FL幾種算法的性能如下圖5所示。結果表明,ArcFace+FL的性能相比其他算法無論是在低Rank還是高Rank下都更優。圖5 五種算法的CMC曲線圖我們測試了對於卡通檢測和卡通識別兩個任務,人臉信息是否對卡通的檢測識別有幫助。從表2可以發現,與F-ArcFace(即ArcFace+FL)相比,本文提出的方法的人臉識別性能將略有提高,圖6同樣驗證了加入人臉識別的數據後卡通檢測的性能也能得到提高。圖6 卡通檢測兩種算法的PR曲線

表2 算法的性能對照表

卡通臉是識別一個卡通人物身份的最主要區別部分。然而,在某些情況下僅僅依靠卡通人臉不足以區分不同的卡通人物。我們測試了算法在卡通人臉基礎上擴充不同比例下的性能如圖7所示,圖中表示了在包含更多的上下文信息下會獲得更高的識別性能。圖7 在不同擴充比例下的CMC曲線

總結展望

愛奇藝開放了目前全球最大的手工標註卡通人物檢測數據集與識別數據集iCartoonFace,包含超過5000個卡通人物、40萬張以上高質量實景圖片,這使得對卡通人臉識別技術的研究擁有了強有力的數據土壤。針對卡通人物的特性進行更加深入的模型優化研究,設計卡通真人多任務學習框架,可以有效地提高卡通人物識別性能。未來,加深對卡通人物識別能力的研究,設計更加魯棒性的算法,從而可以處理遮擋、側臉、模糊、變身等多種情況,使得識別的人數更多、可識別的樣式更豐富,是一個非常有挑戰性的問題。對卡通人物進行識別具有廣泛的應用場景,不僅可以用於視頻理解對視頻進行結構化分析,還可以在智能剪輯創作、圖片搜索、人物審核、廣告等場景中得到廣泛應用。例如圖片搜索中加入卡通人物身份特徵,使得搜索更加準確,通過分析視頻中卡通人物的身份點位,可以提供給創作者進行智能剪輯,也可以用來對惡搞的諷刺漫畫或者卡通風格人物進行審核辨識。通過人臉識別技術對視頻中的人物信息進行結構化分析,目前已在愛奇藝公司的多個產品中應用,例如「奇觀」、「只看他」等,給用戶帶來了良好的交互體驗。最後,不知道大家還記不記得兩個月之前的一則新聞:「奧特曼粉絲臥底5年,終於從海賊王粉絲手裡奪回了貼吧」,具體事件不再展開,但是這個事件裡面所涉及到的動漫人物,一個是海賊王的艾斯,一個是奧特曼裡面的艾斯:如果交給AI去視覺識別這兩個動漫人物,那真是太簡單了,但是這背後的真假粉絲以及臥底五年的犧牲,就不是AI可以簡簡單單識別出來的了,加上NLP或許也不夠。[1] Zheng, Yi, et al. "Cartoon Face Recognition: A Benchmark Dataset." arXiv (2019): arXiv-1907.[2] Liu, Yuanliu, et al. "iQIYI Celebrity Video Identification Challenge." Proceedings of the 27th ACM International Conference on Multimedia. 2019.[3] Liu, Yuanliu, et al. "iqiyi-vid: A large dataset for multi-modal person identification." arXiv preprint arXiv:1811.07548 (2018).[4] Brendan F Klare, Serhat S Bucak, Anil K Jain, and Tayfun Akgul. 2012. Towards automated caricature recognition. In 2012 5th IAPR International Conference on Biometrics (ICB). 139–146.[5] Bahri Abaci and Tayfun Akgul. 2015. Matching caricatures to photographs. Signal, Image and Video Processing 9, 1 (2015), 295–303.[6] Jing Huo, Wenbin Li, Yinghuan Shi, Yang Gao, and Hujun Yin. 2017. WebCaricature: a benchmark for caricature face recognition. arXiv preprint arXiv:1703.03230 (2017).[7] Ashutosh Mishra, Shyam Nandan Rai, Anand Mishra, and CV Jawahar. 2016. IIITCFW: a benchmark database of cartoon faces in the wild. In European Conference on Computer Vision (ECCV). Springer, 35–47.[8] Azuma Fujimoto, Toru Ogawa, Kazuyoshi Yamamoto, Yusuke Matsui, Toshihiko Yamasaki, and Kiyoharu Aizawa. 2016. Manga109 dataset and creation of metadata. In Proceedings of the 1st International Workshop on coMics ANalysis, Processing and Understanding. ACM, 2.[9] Weiyang Liu, YandongWen, Zhiding Yu, Ming Li, Bhiksha Raj, and Le Song. 2017. Sphereface: Deep hypersphere embedding for face recognition. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 212–220.[10] Hao Wang, Yitong Wang, Zheng Zhou, Xing Ji, Dihong Gong, Jingchao Zhou, Zhifeng Li, and Wei Liu. 2018. Cosface: Large margin cosine loss for deep face recognition. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 5265–5274.[11] Jiankang Deng, Jia Guo, Niannan Xue, and Stefanos Zafeiriou. 2019. Arcface: Additive angular margin loss for deep face recognition. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 4690–4699.[12] Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, and Piotr Dollár. 2017. Focal loss for dense object detection. In Proceedings of the IEEE International Conference on Computer Vision (ICCV). 2980–2988.[13] Haiming Yu, Yin Fan, Keyu Chen, He Yan, Xiangju Lu, Junhui Liu, and Danming Xie. 2019. Unknown Identity Rejection Loss: Utilizing Unlabeled Data for Face Recognition. In Proceedings of the IEEE International Conference on Computer Vision Workshop (ICCVW). 0–0.

點擊閱讀原文,直達「CCF-NLP走進高校之鄭州大學」直播頁面!

相關焦點

  • 審視人臉識別:一種AI技術的全球性濫用
    顯然,一場比以往更大範圍的對 AI 技術合理使用(尤其是人臉識別)的批判正在展開。人臉識別問世所走過的 60 年人臉識別技術的起源可以追溯到 1960 年代。到了 2017 年,iPhone X 成為全球最暢銷的帶有人臉識別功能的手機。當人臉識別大規模鋪開使用摁下了加速鍵之後,越來越多人意識到,人臉識別的方向和速度產生了偏差。
  • 開源推薦 | 可實現門禁、AI測溫敏捷開發的人臉識別應用套件
    隨著人臉識別技術的不斷發展,尤其是在部分算法平臺對外開放算法之後,人臉識別的應用門檻得到了極大降低。但是從算法到一款真正可落地的人臉識別產品,在完整的應用開發中,不僅需要考慮底層算法的運行邏輯,也需要上層業務邏輯完整自洽。而這個從0到1的過程,往往會讓大部分中下企業及開發者,在項目商用化落地過程中無從下手。
  • 人臉識別再爆爭議
    Clearview 已經很大程度上讓這個想法成為了可能,這家公司設計了一款人臉識別程序,比如說你給某個人拍張照片,把照片傳到程序上面,就可以查看這個人的所有公開照片,包括這些照片的地址連結。更進一步來說,該程序還能用來做很多事情:比如識別抗議活動中激進分子的身份,不僅能搜出他們的名字,甚至還能知道他的住所、工作單位和社交關係網絡;如果在地鐵上遇到一個感興趣的人,也可以這樣做。
  • AI人臉識別「抓」錯了人,他在監獄呆了10天!
    目前,一名高級法院的法官已經開始向檢察官辦公室施壓,要求他們在案件中拿出更多的證據,而不僅是面部識別軟體。總之,看起來事情還沒結束。抓罪犯,人臉識別說了算不算?無獨有偶,這不是美國第一次出現人臉識別抓錯人。帕克斯被抓還不是類似事件中最嚴重的一起。
  • 人臉識別,禁!
    尤其是在執法中,這類技術的使用可能會由於錯誤的人臉識別而造成不可挽回的損害。」事實上,微軟公司已經宣布將會暫停對警察機構提供人臉識別技術服務。而備受爭議的亞馬遜也曾發布聲明,將會暫時禁止警方使用該公司的人臉識別技術,這份禁令將會實施一年。不過,該公司不會完全放棄人臉識別,將繼續允許其人臉識別技術應用於失蹤兒童尋找等方面。
  • 人臉識別方便了誰?這樣做或許能躲過「被識別」
    而這些故事最後都不約而同地指向了「售樓處人臉識別系統」。據報導,有地產中介表示:房企安裝人臉識別系統,與其「分銷模式」有關。人臉識別可以讓房企迅速識別某個購房者是中介拉來的,還是看了宣傳的「自然到訪客戶」,關係到客戶能不能享受中介渠道的優惠。
  • 人臉識別登上Nature封面!看臉的世界,AI卻心懷偏見
    畫面中的人與威廉士唯一相同的點就是:他們是身材相似的黑人。「這不是我!你以為所有黑人都長一樣嗎?」威廉士憤怒地質問道。「電腦說是你。」警察說。根據人臉識別算法,系統給威廉士定了罪。系統在人臉周圍畫出矩形,並在直播中識別出人臉。然後提取出關鍵特徵,並將其與觀察名單中的嫌疑人進行比較。如果有匹配,它就會從直播中提取圖像,同時從觀察列表中提取圖像。圖源:《編碼偏見》在查看對比結果後,警方會決定是否衝出去阻止這名「嫌疑人」,或者逮捕他們。
  • 和平精英人臉識別怎麼跳過 和平精英人臉識別跳過驗證方法
    和平精英人臉識別怎麼跳過?和平精英最近上線了人臉識別系統,這次的系統也是為了更好的保護未成年人遊戲。不過對於成年人來講這次的系統就比較麻煩了,尤其是遊戲內行為特徵比較特別的人,人臉識別確實不是他們想要的。那麼如何跳過人臉識別呢,下面就為大家帶來詳細做法。
  • 和平精英人臉識別怎麼跳過 和平精英跳過人臉識別驗證方法
    和平精英人臉識別怎麼跳過?和平精英最近上線了人臉識別系統,這次的系統也是為了更好的保護未成年人遊戲。不過對於成年人來講這次的系統就比較麻煩了,尤其是遊戲內行為特徵比較特別的人,人臉識別確實不是他們想要的。那麼如何跳過人臉識別呢,下面就為大家帶來詳細做法。
  • 王者榮耀怎麼跳過人臉識別 防沉迷人臉識別跳過方法
    王者榮耀怎麼跳過人臉識別?王者榮耀反覆要求人臉識別如何解決?相信很多玩家都有遇到過「防沉迷人臉識別」的情況。那麼這到底要怎麼解決呢?話不多說,下面,就隨18183小編來了解一下吧! 王者榮耀怎麼跳過人臉識別?王者榮耀反覆要求人臉識別如何解決?相信很多玩家都有遇到過「防沉迷人臉識別」的情況。
  • 規制人臉識別之路仍任重道遠 ——從「中國人臉識別第一案」談起
    後該動物園引進人臉識別技術,並將之用於年卡用戶的入園檢票。郭某隨後收到動物園發來的一則簡訊,告知未經啟用人臉識別將無法入園。郭某不同意被採集人臉信息,要求退卡、退費,但遭到拒絕。於是原告郭某對被告杭州野生動物世界有限公司(下稱野生動物公司)提起訴訟。
  • 多家遊戲公司又對「熊孩子」下手了!騰訊遊戲人臉識別系統再升級!
    每當遊戲頁面彈出人臉識別驗證框框,他們就想辦法坑騙家長,"這是網課要拍照",讓家長幫助"掃臉"通過檢測。 在防沉迷系統的深入下,許多父母已經不再那麼被騙了,小孩子就把目光轉向了更為寵溺自己的爺爺奶奶。爺爺奶奶們不知道自己的小孫子是在充值玩遊戲,還以為真的是在上網課,還心甘情願幫忙「付錢」。 騰訊很快發現了這個問題。
  • 表情包AI生成器:識別人臉情緒,自動配文字
    表情包AI生成器:識別人臉情緒,自動配文字 2020-10-08 07:26 來源:澎湃新聞·澎湃號·湃客
  • Google最新的AR化妝功能曝光,微美全息AR+AI人臉識別精確
    作為視覺領域的企業微美全息(WIMI.US),其開發的全息雲系統作為微美全息獨家的研發突破,其領銜的微美AI人臉技術應用,已得到業內多方的稱讚。搭載人臉識別技術的手機能夠刷臉解鎖;搭載語音識別、語音識別技術的音響能夠實現語音交互。
  • 人臉識別60年︱校園、課堂、售樓處,人臉識別應該有禁區嗎
    2019年,瑞典數據保護局對一所高中開出罰單,認為校方使用人臉識別技術進行考勤違背了「必要性」原則,人臉信息的敏感性更高,校方完全有其他低風險的選擇。這也是歐盟通用數據保護條例GDPR通過後的首張罰單。
  • 聽說售樓部有人臉識別,精準識別可賣高價!無奈之下,他們帶著頭盔來...
    這時候,售樓處的人臉識別這時候就派上了用場,它可以讓房企迅速識別某個購房者是中介拉來的,還是看了宣傳的「自然到訪客戶」,關係到客戶能不能享受中介渠道的優惠。以「買房」加「人臉識別」為關鍵詞在網上檢索,可以發現,有關售樓處用人臉識別判斷客戶類型的消息比比皆是。
  • 上萬人臉識別廁紙機進駐上海?政協委員多年提案拒用人臉識別
    多地開始禁用人臉,政協委員多年提案,拒用人臉識別等唯一的生物特徵信息作身份認證。不戴頭盔看房我可能損失30萬,為了60公分的廁紙我出賣了自己的臉……是的,我知道我的臉正在被濫用,但是我有什麼辦法?很多人臉識別是強制使用的,如果拒絕刷臉,我可能上不了班、回不了家,因為門禁系統都升級為人臉識別,且沒有門禁卡等替代方案。
  • 以通用產品驅動AI普惠,澎思智能人臉識別門禁獲行業認可
    澎思智能人臉識別門禁一體機PesGuard就是脫穎而出的產品之一。 作為智慧城市人居場所出入管控和通行管理的核心載體,門禁設備在人工智慧、大數據、物聯網等技術的催化下,正經歷著新一輪的智能化變革。洶湧而至的新冠疫情,也讓人臉識別門禁這種具有非接觸識別特性的門禁產品,成為社會剛需。
  • 還沒踏入售樓處,你的身份就已被識別 面對越來越泛濫的人臉識別...
    剛走出青山湖科技城地鐵站,便看到地鐵口有六七位中介圍聚在一起,拿著幾份項目資料,準備隨時截客,只要你稍作停留,他們便會迎上來詢問:「來看房子嗎?我們可以免費帶看,有優惠的,自己去看談不到底價的。」記者表示自己已經去過某項目售樓處,可能已經被人臉識別後,中介表示:「你配合我們的話,也是可以操作的,換一個號碼,籤約的時候戴口罩就行。」
  • 小區安裝人臉識別系統應有法可依
    近日,有用戶反映,他們所在小區正在安裝人臉識別,且和住址、身份信息綁定在一起。小區給出的理由是智能化管理可以精準識別出入小區人員,讓小區管理更安全、更高效。但有居民擔心人臉信息被洩露:我什麼時候不在家,別人都知道。