用數據品咖啡,407杯咖啡數據教你如何區分咖啡等級和風味

2020-12-12 澎湃新聞

大數據文摘出品

來源:Medium

編譯:睡不著的Iris

嘗遍世界各地不同的咖啡,我好奇風味差異如何影響咖啡評級。儘管知道咖啡等級會影響口感,但我依舊喜歡一些等級較低的咖啡。

看了下兩個咖啡評級資料庫,撇去地區差異,我始終搞不明白風味能起到什麼樣的作用。

因此,我選取Sweet Maria's資料庫進行分析。雖然資料庫裡有每杯咖啡的風味評級,但我首先提取了咖啡的Q級分。接著,我提取了所有豆子的風味評級數據,最終得到一個比原先稍大的資料庫,其中有407杯咖啡的數據。

杯測評分(修正Q分)

如表格所示,Sweet Maria’s與SCA的杯測標準略有出入。奇怪的是,相比其他指標,甜度、一致性、乾淨度3個指標在SCA標準中,一開始分數看似挺好,但隨後遞減。反觀Sweet Maria’s評分指標,發現它對咖啡有更深入的洞察。

數據

構建任何資料庫,我們都需要花費時間做數據清洗和數據檢查。此處,我用Q級分畫了一張雷達圖,我用原先代碼生成了一張擴展的輔助指標評分圖。對於咖啡風味數據,為了便於提數,我做了一定的修正。

經過Sweet Maria's授權使用,其他圖均出自本文作者

我將數據整合在一張包含生產地、加工類型類型等元數據的大表中。我對數據做了多次梳理、審核,並抽樣驗證算法是否運行良好。

數據準備完畢,我開始分析。

分析:風味分布

12種風味指標加總後求平均,發現堅果和花香味比較少有,最常見的是糖果、可可和醇厚風味。

分析:相關性

相關性用於描述兩個變量之間的相似程度。相關性高不代表一個變量對另一個變量有什麼影響,當發生變化時,兩個變量變化趨勢相同。我認為一些評級變量最開始具有很高的相關性,因為它們是從不同角度表示咖啡口感。相關性可以是正向(趨勢相同)的或負向(趨勢相反)。0則表示兩個變量沒有相關性。

顯然,杯測分數(Q分、評級,不管怎樣稱呼)的各項指標之間的相關性比風味指標更高。有趣的是,焦糖、可可、堅果和鄉村風味與杯測分數成反比。這幾種風味與其他風味的相關性不高,表現為微弱的負相關。莓果與水果具有很高的相關性,看起來是合理的。

我們通過一張更大的表直觀展示各屬性之間最高的相關性。負數表示為最高相關性的絕對值,但為負相關值或逆相關值(成反比)

顯而易見,杯測分數與花香味指標最相關,許多風味指標都與明亮度杯測指標具有較高的相關性。但奇怪的是僅有27%的咖啡有花香味(要麼一點都沒有)。

對相關性矩陣按地區進行分解,看看每個指標與總得分(杯測分)的關係。不同地區的咖啡,水果、柑橘和莓果風味差異最大。令人詫異的是,我一直以為非洲咖啡豆果香味會更濃,但水果對非洲咖啡豆的貢獻分並不大。

咖啡豆的風味部分也依賴於採用不同的工藝處理咖啡果實。我喜歡幹法加工的咖啡豆,富有果香味,這從風味得分也可以看出來。但焦糖味卻相反。我本以為焦糖與糖果味會相似,最後發現兩者之間沒有多少關聯性。

另外,北美洲、混合拼配地區以外的地區,堅果/可可風味之間沒有多少關係,但它們與總體得分呈現很強的負相關性。

堅果、可可都與幹法加工逆相關,但受蜜處理、溼法加工的負向影響較弱。總體而言,非洲咖啡豆味道越豐富,整體杯測得分越高。杯測糾正與幹法、其他加工方法負相關。這表明幹法、其他加工方法總體得分低,但是實際上豆子很棒,因為杯測標準裡沒有代表加工工藝的量化指標。

分析:主成分分析(PCA)

主成分分析法(PCA)是將一組變量映射至新的維度空間,原始變量在新空間用新維度表示。簡單數據集在不失真的情況下實現了降維,這樣,每個Q級分(Sweet Maria’s評分)不需要使用所有的評分項,僅用11個維度表示即可。或許你只需要用到三個或主要成分。

讓我們看看所有變量,不出所料,杯測總分是第一主成分,是最主要的影響變量。然而,在鑑別咖啡豆時,風味成分最主要的變量。

在沒有杯測總分的情況下進行同樣的分析,杯測師就在產生了一定的影響,但是,風味仍舊是最具影響力的獨立成分。

進一步研究杯測、風味會對咖啡產生何種影響,我們計算了每個主成分的累積百分比值。

單獨比較風味和杯測評級,風味指標依賴更多的主成分變量,使用到13個成分中的8個成分可達到90%的變化性,杯測評級只需4個指標。這表明風味指標更適合單獨鑑別咖啡豆。

我們可以計算每個指標對各主成分影響的累積絕對值及其對數據的貢獻度。杯測師糾正影響最大,風味和複雜度影響相對小。所有的風味指標,莓果、柑橘、水果和可可對鑑別咖啡豆最有影響,糖果累積影響最小。

使用包含大部分數據變量的2 個主成分繪製成散點圖。杯測評級圖數據分布比較集中,風味圖數據分布比較分散。

評級數據相對集中,風味數據的分布比較有趣。觀察幹法加工、溼法加工、非洲地區咖啡豆數據最分散。

此項工作,仔細對比咖啡評級(杯測評級)和風味評級的差異。我發現,評測咖啡產區或加工工藝時,風味等級比咖啡評級更具代表性。咖啡評級應該與風味指標相互獨立,而且Sweet Maria’s杯測方法對特定風味不會出現嚴重偏差。風味偏差最大的是花香味,但它沒有其他杯測參數那麼強的相關性。

相關報導:

https://towardsdatascience.com/a-review-of-coffee-data-grades-and-flavors-5ccb6fc51941

志願者介紹

原標題:《用數據品鑑咖啡,407杯咖啡數據教你如何區分咖啡等級和風味》

閱讀原文

相關焦點

  • 用數據品鑑咖啡,407杯咖啡數據教你如何區分咖啡等級和風味
    來源:大數據文摘 本文約2000字,建議閱讀5分鐘 我提取了所有豆子的風味評級數據,最終得到一個比原先稍大的資料庫,其中有407杯咖啡的數據。
  • 教你如何區分咖啡種類,選擇適合自己的咖啡
    今天教您:「區分咖啡種類」,助你找到一款適合自己的咖啡,話不多說,開始!濃縮咖啡(Espresso)或意式濃縮咖啡,是一種口感強烈的咖啡類型,方法是以90.5攝氏度的熱水,藉由130PSI高壓衝過研磨成很細的咖啡粉末來衝出咖啡。濃縮咖啡是其他種類咖啡的基礎,用小杯品嘗,最好在三口之內喝完,飲用時,無須加糖加奶,淨品其中之味。
  • 咖啡好壞如何區分,比如貓屎咖啡,和藍山咖啡那個更好,星巴克們咖啡...
    X 咖啡好壞如何區分,比如貓屎咖啡,和藍山咖啡那個更好,星巴克們咖啡有多好?
  • 國際咖啡品質鑑定師教你如何給咖啡評分
    2015-1-26 09:34:05來源:重慶晚報選稿:方翔原標題: 國際咖啡品質鑑定師教你如何給咖啡評分國際咖啡品質鑑定師教你如何給咖啡評分東方網1月14日到25日,他們將嚴格按照SCAA(美國精品咖啡協會)杯品體系的標準,對雲南各地選送參賽62支精品咖啡豆進行杯測評級。重慶南岸區原品咖啡館的咖啡品質鑑定師老何成為唯一獲邀參加擔任評審的重慶人。去年9月,他順利通過了SCAA的CQI(咖啡品質研究所)國際咖啡品質鑑定師(Q-Grader)的資格考試。咖啡品鑑師到底有什麼特殊才能?一杯單品咖啡如何量化成標準?
  • 如何學會品咖啡?懂咖啡?
    麥隆咖啡,只為一杯好咖啡。如今很多人喝咖啡,只是為了提神的目的,可誰曾想,咖啡原本可是一種水果啊。咖啡其實還有一個很甜美的名字叫做「咖啡櫻桃」,它的果實實在不像烘焙過後的黑黑的樣子,而是晶瑩剔透的淡黃色。
  • 你喝的是杯「好咖啡」還是「壞咖啡」?如何區分?
    什麼咖啡是"好咖啡"?什麼咖啡是"壞咖啡"?我們如何去論斷?一杯咖啡是"好喝"還是"難喝",這純屬是個人的喜好問題,然而一杯咖啡的"好"與"壞"就能夠明確論斷了。咖啡高手評斷咖啡時應先論的是咖啡的"好""壞",然後再評論"好喝"與"難喝"。
  • 詳解SCAA咖啡風味輪味譜使用方式 如何辨別咖啡風味香氣的不同
    風味一詞在日常生活中更多的用味道,滋味來使用,也就是英文的flavor,在咖啡品鑑中,通常用調性來描述。打個通俗的比方,川菜中,我們有很多調性,比如魚香味,糖醋味。咖啡中,我們也會用,花香調性,水果調性,焦糖調性來描述味道,但咖啡的風味問題困擾著好多同學。「什麼是咖啡的風味?」
  • 咖啡愛好者的衝煮指南,如何改善你每日杯中的美好風味?
    《手工咖啡:咖啡愛好者的完美衝煮指南》內容簡介本書是一本講解咖啡知識的實用指南,從基礎知識、衝煮器具、原產地、購買咖啡、品鑑風味及衝煮方法六個方面,系統地講解了關於咖啡的實用知識——如何根據預算和喜好選擇一款適合你生活方式的器具?如何品鑑出咖啡中酸、甜、苦、鹹、鮮五種基本風味?
  • 咖啡大數據 歡迎來到咖啡的世界!
    如果你不知道,那麼請繼續閱讀以下文章。通過大數據,我們將帶領你進入咖啡的世界! 1.世界上哪個國家的人最愛喝咖啡?咖啡飲用量分布圖(單位:杯/每人每天)讓我們把目光聚焦在歐洲,那裡的人每天都要喝掉成噸的咖啡!
  • SOE拿鐵咖啡 單品拿鐵咖啡風味 單一產區咖啡豆拿鐵咖啡
    前街咖啡萃取soe咖啡決定一杯咖啡是否好喝的因素有很多,比如咖啡豆的品種、烘焙的程度、萃取的咖啡機、製作過程、個人口感喜好等,而SOE只是指用單品咖啡豆做的意式濃縮咖啡,當單品咖啡豆製作成濃縮咖啡後,咖啡豆的風味就會被放大,換個說法就是同一款咖啡豆,手衝出來的咖啡風味是柑橘,莓果,甜感明顯,整體乾淨清爽,而製作成濃縮咖啡後可能會變得尖酸,澀感,難以下咽。
  • 認識咖啡,品評咖啡
    怎樣才是一杯好喝的咖啡?眾所周知,咖啡的口味很豐富,能給予人不同的感覺。每個人都有自己的口味特點和評判標準,那麼,如何讓這種口味的描述,得到大家的理解和認同呢?咖啡行家的品評方法:品味咖啡,不只要喝,還要用聞。雖然咖啡並沒有絕對好壞的判別公式,但是掌握行家慣用的品評方法,仍然有助於你了解咖啡,進而懂得品味咖啡。
  • 曼特寧與意式咖啡哪一個更苦?咖啡不同衝煮方式對咖啡風味的影響
    【意式濃縮咖啡與單品咖啡概念】|意式濃縮咖啡如果要用數據來進行概括的解釋的話,水粉比例一般在1:2-1:3,舉例:20g粉在9 bar±2氣壓下被90.5~96°C的水萃取20~30秒時間得到40g咖啡(雙份濃縮分量)這所得到的40g咖啡就叫做Espresso
  • 咖啡師說咖啡中有很多風味,但我感受不到!如何辨識咖啡的風味?
    如果你喝了足夠多不同種類的咖啡,在不知不覺中,你就會開始知道它們之間的差異了。人類的味覺和嗅覺非常敏銳,數百萬年的進化使人類具備區分各種味道和質地的能力。品嘗的味道越多,你的味覺自然就變得越細膩,越能分辨出自己喜歡什麼和不喜歡什麼。
  • 咖啡包裝上寫的那些風味,我就是感受不到!如何辨識咖啡的風味?
    如果你喝了足夠多不同種類的咖啡,在不知不覺中,你就會開始知道它們之間的差異了。人類的味覺和嗅覺非常敏銳,數百萬年的進化使人類具備區分各種味道和質地的能力。
  • 咖啡品鑑師是如何品咖啡的?
    品嘗一杯咖啡,需要你的嗅覺、味覺、口腔內的觸覺去感受。品嘗咖啡就是對多種咖啡進行比較和品味。當您只品嘗一種咖啡,你就無法做出比較。,咖啡師會拿著一杯剛磨好的粉給你聞一聞,從幹香開始品鑑咖啡的第一步。每一種咖啡豆子因為品種、產地、種植區、處理方式、存儲的不同,就會展現出不同的風味。嘗試著對照咖啡風味輪記錄下自己對咖啡豆的感覺,嘗多了就會明確地知道自己的喜好和風格啦!
  • 第一次喝咖啡該如何品鑑一杯單品咖啡呢?
    不知道有沒有朋友和小編一樣曾經有過第一次喝咖啡的經歷,卻不知道這個喝著有點苦的咖啡該怎么喝?品咖啡的方法其實和品酒是很相似的,充分動用你的嗅覺、味覺、口腔內的觸覺去從各個角度品鑑一杯咖啡。但這並不代表品鑑一杯咖啡是非常困難的事情,你只要遵循下面的六步即可:
  • 瑰夏村莊園金標和紅標區別 瑰夏咖啡品種與風味瑰夏咖啡手衝方法
    導讀前街最近上新了一支瑰夏村莊園金標批次的日曬瑰夏,有不少小夥伴會提問關於金標和紅標有什麼不一樣?這支金標的日曬瑰夏又有什麼風味呢?金標和紅標是如何區分的?金標金標批次的咖啡僅佔瑰夏村莊園全年產量的10%,也是比賽選手通常選擇的批次,對品質有高要求的烘焙師也會進行採購,金標批次的咖啡具有完整的可追溯性,各批次風味突出、複雜度高,是瑰夏村莊園僅次於競標的最優秀標次。
  • 意式咖啡與美式咖啡怎麼區分?
    咖啡文化源遠流長,很多時候都會有人問美式和意式怎麼區分?今天來說說它們之間有啥區別吧~ 意式美式咖啡口味有何不同? 傳統的意式咖啡其實是濃縮咖啡,意式咖啡用濃縮咖啡機手衝時所需的水量比較少,煮法繁瑣,咖啡味苦,口味比較純正、香醇。
  • 如何科學的萃取一杯美味咖啡
    ——博爾赫斯 今天要聊一聊咖啡濃度和萃取率。 其實這兩個概念,一直是我不太想聊的。 其一,在我看來一杯咖啡好不好喝,主要還是要依賴嗅覺和味覺的官能鑑定。
  • 衣索比亞的瑰夏村瑰夏咖啡和巴拿馬的瑰夏咖啡風味有什麼不同?
    瑰夏村莊園分級衣索比亞地區原本沒有莊園和莊園等級制度,Willem Boot和Adam發現瑰夏森林後,決定把巴拿馬咖啡莊園的經營模式搬到此地,因此瑰夏村莊園成為了衣索比亞唯一一個咖啡莊園。在瑰夏村,種植和加工的每一個步驟中都力求不妥協質量。他們在在阿迪斯阿貝巴的咖啡實驗室,以及SCA的官方標準,通過嚴格的杯測過程,精心挑選每一個批次,並進行嚴格分級,確保向買家提供最優品質的咖啡豆。最後,從極其高端和美味的珍品到精緻的混合查卡,一共分四級,提供給全世界咖啡市場。