貓奴的自我修養,教你用機器學習識別貓的品種

2021-02-14 數據派THU

來源:CDA數據分析師

作者:Elisha Terada

編譯:Mika

本文長度為1361字,建議閱讀3分鐘

本文為你介紹如何用機器學習技術Custom Vision判斷貓的品種。

之前我進行過一個簡單的機器學習實驗,來判斷圖像是否為墨西哥卷餅。

使用相同的基於雲的認知機器學習技術 Custom Vision,我想處理一個更複雜的場景。

如何用機器學習算法判斷貓的品種?

按照慣例,我需要為機器學習算法輸入一些圖像,讓其了解要學習的內容。

首先,我找到了貓的品種列表,包括圖像和名稱信息,然後以此為基礎在網上找圖片。

然後,我在Flickr上分別搜索每個貓的品種,並使用Chrome的擴展插件從第一頁開始下載圖像。

在找圖片時,之所以使用Flickr而不是谷歌圖片,是為了用Chrome擴展插件下載高解析度的圖像。

Flickr上的蘇格蘭折耳貓

我花了一個小時左右下載了圖片,然後對圖片進行處理。刪除了當中不是貓的圖片,避免影響訓練集。

然後,我刪除了同一個場景中相同貓的圖像。這是為了避免對算法進行過度訓練,從而避免它尋找精確匹配的圖像,而不側重預測。

記住,機器學習的目的是為了讓算法識別以前未見過的新信息,而不是尋找精確的匹配。

最後,我確保每個品種至少收集5張圖像,因為這是在Custom Vision上創建的標籤所需的圖像數量。

但是,有些常見的貓品種有超過20張圖像,而一些不常見的品種只有6張左右的可用圖像。

每個品種有不同數量的訓練圖像

這可能會導致識別結果產生偏差,但至少我們意識到算法中的潛在偏差。

最後,我收集了超過900張貓的圖像,包含50個不同品種。

完成數據收集後,我將所有圖像上傳到Custom Vision,並將每張圖像標記為相應品種。

之後,只需點擊一個按鈕來訓練算法,它就可以在幾秒鐘內進行貓的品種預測。

有趣的部分開始了,讓我們先來看看算法的性能。

性能還不錯

基於900張圖像和50個品種標籤,算法的性能還不錯。

這比我預想的要好,鑑於它不僅僅是識別該圖像是否為貓。

對於沒有受過訓練的人來說,判斷貓品種間的細微差異也是很困難的。

以半信半疑的態度,我打算用之前從未見過的圖像對算法進行測試。

首先是Sola,我家耳朵並沒有折起來的蘇格蘭折耳貓。

首先,在已知我家貓是純種蘇格蘭折耳的前提下,我用算法對它進行了測試。

Sola為蘇格蘭折耳的機率為53.9%

測試我家貓很有意思,因為訓練集中的所有蘇格蘭折耳貓圖像中,貓都是折耳的。

我並不覺得這有什麼影響,接著測試了幾張Sola的照片。

Sola為蘇格蘭折耳的機率僅為34.1%

突然間,我的貓被判定為很可能是威爾斯貓。

接著我檢查了訓練集中所有標有威爾斯貓的圖像,竟然發現一隻看起來和Sola完全一樣的貓的圖像。

儘管每個貓的品種均有其獨特的外觀,但兩隻完成不同品種的貓也可能在面部形態上很相似。

也許有更多不同的威爾斯貓圖像可以避免這樣的問題。

讓我們看看一些不同品種的測試成功例子。

96.9%為暹羅貓

99.8%為阿比西尼亞貓

99.9%為薩凡納貓

我必須說,當算法準確預測出給定的隨機品種圖像時,真的很神奇。

但是這個算法並不是沒有缺陷的,下面讓我們來看一些預測失敗的例子。

之前暹羅貓算法測試的效果很出色,讓我們再來看看。

首先,測試從背面拍攝的暹羅貓圖像會怎麼樣?

不可能是暹羅貓

老實說,這並不令人驚訝。

所有訓練圖像集的暹羅貓都是面朝相機,而不是看向旁邊的。

再來一張暹羅貓臉部特寫會怎麼樣?

11.1% 為暹羅貓

這個結果似乎與以前我家Sola臉部特寫的測試結果類似。

或許不僅僅通過貓的臉部來判斷時,該算法的效果會更好。

老實說,如果暹羅貓訓練集有相似圖像的情況下,結果可能會比11.1%要好。

下面,讓我們測試一些不是貓的圖像。

你可能已經注意到,上面每個結果都有「貓」的標籤。

使用Custom Vision,你至少需要兩個標籤來標記每個圖像。

讓我們來測試一下其他毛茸茸的動物圖像。

這貨絕對不是喵星人

有可能是貓

測試出來是貓

測試出來是貓

測試出來是貓

不可能是貓

顯然,如果看起來足夠相似,該算法很難區分什麼是貓,什麼不是貓。

經過訓練的算法很可能是基於顏色,圖案和整體形狀來進行模糊匹配。

給定粗略的訓練集,經過訓練的算法在特定的條件下能夠很好的判斷貓的品種。

然而,對於沒有訓練過的項目,該算法表現的不太好,例如如何區分貓和非貓的動物。

所以在投入時間訓練任何機器算法之前,對其能夠處理的範圍進行明確的定義是明智之舉。

編輯:文婧

公眾號底部菜單有驚喜哦!

企業,個人加入組織請查看「聯盟」

往期精彩內容請查看「號內搜」

加入志願者或聯繫我們請查看「關於我們」

相關焦點

  • 什麼叫貓奴?貓奴是什麼意思?
    最近,「貓奴」成為了最流行的網絡熱詞之一,按字面意思理解的話,「貓奴」就是「貓咪的奴僕」。很多人看到這裡可能就納悶了,貓咪不是寵物嗎?怎麼「反客為主」了?面對這個玄學的問題,元元只能回答您,可能是因為貓咪太可愛了吧,讓鏟屎官們忍不住地去溺愛它們。
  • 養田園貓好,還是品種貓好?無需糾結,看完你就知道了
    價格之間的區別受供求關係的影響,田園貓咪的身價特別的低,而且大部分是無助的流浪貓,如果你運氣好的話,在路邊你都撿到屬於自己的愛貓。而品種貓的就不用說了,特別地昂貴,即使最常見的英短藍貓價格都得上千,而其他稀有的品種貓咪價錢就更加昂貴了!
  • 寵物貓咪這些品種掉毛貓,家裡貓毛滿天飛,懶得打理就別選擇了!
    貓奴是一種神奇且自卑的生物,他們常常出現在可愛的貓咪身旁,並尊稱貓咪為「貓主子」。如今貓奴幾乎十個人裡面就有八個,不過他們都有一個煩惱。那就是主子掉毛,去貓奴的家裡,可以看到滿天飛的貓毛,如同天女散花。
  • 貓咪種類大幅增加,新版本貓奴福利,你還在等些什麼?
    那麼接下來就說一說,貓咪種類大幅增加,新版本貓奴福利,你還在等些什麼?所謂的貓奴就是一些十分喜愛貓主子的人,可以說從古至今都未曾斷絕過。我個人是很喜歡貓的,只可惜我並沒有貓,只能每日雲吸貓了。而在MC新版本中更新的內容,對於我們來說是一個很好的消息。大家都知道,遊戲中是可以養寵物的,它們都是由野生的動物馴化而來。
  • 為什麼你的橘貓沒有大圓臉?問題可能出在品種上
    作為貓咪界的「肥胖擔當」,橘貓向來不會讓人失望,而它們也因為自己姣好的身材,收穫了「十個橘貓九個胖,還有一個賽大象」的美譽。但是有些貓奴,在自己養了橘貓之後,卻發現好像哪裡看起來不太對。為什麼網上看到的橘貓都有圓圓的大臉盤子,自己家的卻不管身子怎麼胖,就是不胖臉?是不是發腮沒有發好?甚至有小部分貓奴會因為自家橘貓的尖下巴而覺得它顏值不夠,產生失望、自卑的情緒,認為是自己沒有照顧好貓咪。
  • 超準的貓奴自測題,測測你中貓毒有多深?!
    7   看養貓知識看得比念書、工作還認真,媲美半個獸醫。8   朋友圈經常曬貓或聊它們的趣事。9   常常和朋友聊自家主子。10 看到主子相關的東西就忍不住想買。10   化身正確養貓觀的傳教士,四處宣揚領養代替購買、不要買折耳貓、孕期可以養貓等知識。
  • 貓奴必備免費翻譯神器!App讓你聽懂喵星語
    貓奴注意了!未來你的主子有任何命令,不論是肚子餓了、心情不好、拒絕被打擾,你將無法以聽不懂喵星語為藉口,必須奉命遵從,而這一切都要多虧進步的AI科技。主人越常使用這款App,隨著資料庫內存資料增加,App內建的機器學習軟體對個別貓咪的翻譯準確度越高。由軟體公司Akvelon所研發的App目前內建詞彙只有13種,包括像是「餵我!」、「我很不爽!」、「讓我一個人靜靜!」等。事實上,研究指出,貓咪世界裡並沒有一種全球通用的喵星語,通常貓咪只會對人類喵喵叫,而不會對同伴。
  • 品種貓有什麼脾氣?為新鏟屎官揭秘主子們的脾氣
    如今貓奴日益增多,身邊開始養貓或是有養貓計劃的朋友也越來越多,其實養貓還是挺考驗耐心的,並不是想的那麼簡單,希望鏟屎官在養貓之前可以對貓有一些了解,而且每個品種貓脾氣可不一樣,有的品種比較安靜,有的品種比較調皮,這要看鏟屎官自己的喜歡哪種類型的。
  • 深度學習 vs 機器學習 vs 模式識別(附:機器學習經典教材PRML《模式識別與機器學習》官方開放免費下載了
    以下為正文:本文我們來關注下三個非常相關的概念(深度學習、機器學習和模式識別),以及他們與機器人和人工智慧的聯繫。圖1 人工智慧並非將人放入一臺計算機中(圖片來源於 WorkFusion 的博客)環繞四周,你會發現不缺乏一些初創的高科技公司招聘機器學習專家的崗位。
  • 「愛貓人生」必入品種,一旦花開神似貓尾,俏皮可愛讓人心化
    貓奴必入品種,一旦花開神似貓尾,俏皮可愛讓人心化熱愛生活的人都有什麼表現呢?那就是將生活過得多姿多彩,什麼種樹養寵物之類的。你身邊有多少個貓奴呢?它的名字叫貓尾草,可以說是一款與貓咪有些掛鈎的品種,其名字的由來也是因為花朵,葉子倒看不出有什麼特別,但到花期你就知道它的可愛之處了。其花量並不算多,每一株能夠盛開的花絮不多,但其花朵盛開時聚集型的,紫紅色的小花在花序上盛開,從底部不斷往上變小,然後變成貓尾一般的絨毛狀。
  • 每日英語口語 | 你是「貓奴」嗎?
    【貓奴的幾種表達】√cat lover這個表達就很字面,不過要注意的是,lover這個詞在人身上不好亂用哦,容易會誤解成「情人」「小三」。√cat person...person,指的是「喜歡...的人」,cat person,喜歡貓的人,用來形容「貓奴」也是很恰當的。
  • 人為什麼會變成貓奴?吸貓成癮原來是因為這個原因?
    世上可愛的生物千千萬,為什麼我們唯獨就會栽在貓的身上呢?我們為什麼會變成一個貓奴呢?一、貓用顏值徵服了人。大家總說貓有可愛有多可愛,那你有想過為什麼人會覺得貓可愛嘛?拎著貓的後背頸,貓就不會動啊!猝不及防的反應讓我們覺得迷惑又獨特,所以吸貓成癮。另一方面呢?我們在生活當中做一些特立獨行的行為,可能會感到壓力。所以我們內心深處也會更羨慕貓,獨立自由做自己的個性。更現實的是,大部分的上班族更適合養貓。畢竟加班的你和我沒有時間遛狗嗎,尤其是適合,就算有時間也愛宅在家裡面的獨居青年。
  • 第一次養貓要準備什麼? 貓奴入坑小知識科普
    第一次養貓要準備什麼? 貓奴入坑小知識科普時間:2020-07-22 17:11   來源:育兒小寶典   責任編輯:沫朵 川北在線核心提示:原標題:第一次養貓要準備什麼?貓奴入坑小知識科普 隨著現在養貓的人越來越多,一些新手養貓的問題也隨著爆發出來不少,比如不知道要給貓咪準備什麼,不知道怎麼應對貓咪的應激反應,不知道要常備些什麼物品應對貓咪出現的突發情況等,面對這些問題,讓小編好好給新   原標題:第一次養貓要準備什麼?
  • 清華大學張長水教授:機器學習和圖像識別(附視頻、PPT下載)
    機器學習界遇到了這樣的問題,就是小樣本的數據學習。當樣本不多的時候能不能達到和大數據量類似的識別效果?例如上圖中只有幾張狗的圖片的時候,要識別狗,還能從哪裡得到狗的信息?思路是從其他的圖片中來,比如上邊有有鳥,有貓,有鹿,它們的皮毛很像狗等等。換句話說,他從其他的豐富的圖像中獲取一些信息,把那些信息遷移到這個少量的數據上,從而能夠實現對狗的識別。
  • 2.22日本「貓之日」推出貓奴「福貓便當」
    人民網東京2月22日電(吳穎) 據《大家的經濟新聞》網站報導,2月22日是日本的「貓之日」(222日語發音很像是貓的叫聲)。所以自1987年開始,日本寵物團體就把2月22日定為「貓之日」!日本具有獨樹一幟的貓文化,日本貓奴的信條是「一切以貓為先」。
  • 品種貓繁育的核心秘密
    你對你所繁育的品種,生活習性,性格特徵,品種歷史以及品種標準是否非常清楚,爛熟於心呢?2. 你所繁育的品種國內和國際上有哪些家知名貓舍?他們的貓都是什麼品相?往年各協會的冠軍貓長什麼樣?3. 你了解血統到底是怎麼一回事兒嗎?真的是「玄學」嗎?如何評估一隻貓的血統呢?如何組合血統?4. 最基本的毛髮顏色、斑紋遺傳規律有哪些?如何做以色係為導向的繁育計劃?
  • 誰還不是個貓奴呢!牛頓千慮,終有一失之大貓小貓兩個貓洞
    牛頓在錯過和表妹的緣分(當時近親結婚並不少見,甚至發現進化論的達爾文也是和自己的表妹結婚,而且由於子嗣早夭,達爾文開始研究近親結婚的危害,但是其第4個兒子依然娶了表妹)之後,開始放飛自我,而且因為性格怪異,以及沉迷科學,並沒有找到一個適合的伴侶。最終,未來不讓自己孤單,牛頓養了兩隻貓。
  • 機器學習零基礎?手把手教你用TensorFlow搭建圖像識別系統(一)|...
    這只是一篇詳細描述如何開始搭建一個機器學習系統,並讓它可以識別所看到圖像的文章。作者Wolfgang Beyer目前現在正在學習人工智慧和機器學習的內容。他認為最好的學習方式不是僅僅閱讀各類材料,而是要真正地去動手搭建一個系統。這就是雷鋒網翻譯本文的目的,也是作者要向你介紹的。
  • 【演講】清華大學張長水:圖像識別背後的機器學習
    另外一個課題就是手寫數字識別。手寫數字看起來是很簡單的事,但是對手寫數字識別的研究引發出相當多的研究方法,給我們帶來很多的成果,是一個很有意思的課題。此外的課題還有汽車的檢測。我這裡只是列了這幾個。其實同時期還有指紋識別、文字識別OCR等等。當時有的研究工作已經發展到了產品化的程度,包括OCR和指紋識別。
  • 十日談|貓奴掃屋
    一位有志向掃天下的貓奴一定要相信:天正降大任於你了。當你有了貓之後,你考慮的將不再僅僅是一屋之下的人類命運,還要考慮貓主子們的身家。因此,有三個問題不得不想清楚。首先,貓,天生有毛,毛,乃粉塵製造之主要原材料,因此,在保護主子顏面的同時,要考慮,是每天刷毛主動脫毛,還是等毛自然飄滿小屋空間呢?