用數據品咖啡,407杯咖啡數據教你如何區分咖啡等級和風味

2020-12-12 澎湃新聞

大數據文摘出品

來源:Medium

編譯:睡不著的Iris

嘗遍世界各地不同的咖啡,我好奇風味差異如何影響咖啡評級。儘管知道咖啡等級會影響口感,但我依舊喜歡一些等級較低的咖啡。

看了下兩個咖啡評級資料庫,撇去地區差異,我始終搞不明白風味能起到什麼樣的作用。

因此,我選取Sweet Maria's資料庫進行分析。雖然資料庫裡有每杯咖啡的風味評級,但我首先提取了咖啡的Q級分。接著,我提取了所有豆子的風味評級數據,最終得到一個比原先稍大的資料庫,其中有407杯咖啡的數據。

杯測評分(修正Q分)

如表格所示,Sweet Maria’s與SCA的杯測標準略有出入。奇怪的是,相比其他指標,甜度、一致性、乾淨度3個指標在SCA標準中,一開始分數看似挺好,但隨後遞減。反觀Sweet Maria’s評分指標,發現它對咖啡有更深入的洞察。

數據

構建任何資料庫,我們都需要花費時間做數據清洗和數據檢查。此處,我用Q級分畫了一張雷達圖,我用原先代碼生成了一張擴展的輔助指標評分圖。對於咖啡風味數據,為了便於提數,我做了一定的修正。

經過Sweet Maria's授權使用,其他圖均出自本文作者

我將數據整合在一張包含生產地、加工類型類型等元數據的大表中。我對數據做了多次梳理、審核,並抽樣驗證算法是否運行良好。

數據準備完畢,我開始分析。

分析:風味分布

12種風味指標加總後求平均,發現堅果和花香味比較少有,最常見的是糖果、可可和醇厚風味。

分析:相關性

相關性用於描述兩個變量之間的相似程度。相關性高不代表一個變量對另一個變量有什麼影響,當發生變化時,兩個變量變化趨勢相同。我認為一些評級變量最開始具有很高的相關性,因為它們是從不同角度表示咖啡口感。相關性可以是正向(趨勢相同)的或負向(趨勢相反)。0則表示兩個變量沒有相關性。

顯然,杯測分數(Q分、評級,不管怎樣稱呼)的各項指標之間的相關性比風味指標更高。有趣的是,焦糖、可可、堅果和鄉村風味與杯測分數成反比。這幾種風味與其他風味的相關性不高,表現為微弱的負相關。莓果與水果具有很高的相關性,看起來是合理的。

我們通過一張更大的表直觀展示各屬性之間最高的相關性。負數表示為最高相關性的絕對值,但為負相關值或逆相關值(成反比)

顯而易見,杯測分數與花香味指標最相關,許多風味指標都與明亮度杯測指標具有較高的相關性。但奇怪的是僅有27%的咖啡有花香味(要麼一點都沒有)。

對相關性矩陣按地區進行分解,看看每個指標與總得分(杯測分)的關係。不同地區的咖啡,水果、柑橘和莓果風味差異最大。令人詫異的是,我一直以為非洲咖啡豆果香味會更濃,但水果對非洲咖啡豆的貢獻分並不大。

咖啡豆的風味部分也依賴於採用不同的工藝處理咖啡果實。我喜歡幹法加工的咖啡豆,富有果香味,這從風味得分也可以看出來。但焦糖味卻相反。我本以為焦糖與糖果味會相似,最後發現兩者之間沒有多少關聯性。

另外,北美洲、混合拼配地區以外的地區,堅果/可可風味之間沒有多少關係,但它們與總體得分呈現很強的負相關性。

堅果、可可都與幹法加工逆相關,但受蜜處理、溼法加工的負向影響較弱。總體而言,非洲咖啡豆味道越豐富,整體杯測得分越高。杯測糾正與幹法、其他加工方法負相關。這表明幹法、其他加工方法總體得分低,但是實際上豆子很棒,因為杯測標準裡沒有代表加工工藝的量化指標。

分析:主成分分析(PCA)

主成分分析法(PCA)是將一組變量映射至新的維度空間,原始變量在新空間用新維度表示。簡單數據集在不失真的情況下實現了降維,這樣,每個Q級分(Sweet Maria’s評分)不需要使用所有的評分項,僅用11個維度表示即可。或許你只需要用到三個或主要成分。

讓我們看看所有變量,不出所料,杯測總分是第一主成分,是最主要的影響變量。然而,在鑑別咖啡豆時,風味成分最主要的變量。

在沒有杯測總分的情況下進行同樣的分析,杯測師就在產生了一定的影響,但是,風味仍舊是最具影響力的獨立成分。

進一步研究杯測、風味會對咖啡產生何種影響,我們計算了每個主成分的累積百分比值。

單獨比較風味和杯測評級,風味指標依賴更多的主成分變量,使用到13個成分中的8個成分可達到90%的變化性,杯測評級只需4個指標。這表明風味指標更適合單獨鑑別咖啡豆。

我們可以計算每個指標對各主成分影響的累積絕對值及其對數據的貢獻度。杯測師糾正影響最大,風味和複雜度影響相對小。所有的風味指標,莓果、柑橘、水果和可可對鑑別咖啡豆最有影響,糖果累積影響最小。

使用包含大部分數據變量的2 個主成分繪製成散點圖。杯測評級圖數據分布比較集中,風味圖數據分布比較分散。

評級數據相對集中,風味數據的分布比較有趣。觀察幹法加工、溼法加工、非洲地區咖啡豆數據最分散。

此項工作,仔細對比咖啡評級(杯測評級)和風味評級的差異。我發現,評測咖啡產區或加工工藝時,風味等級比咖啡評級更具代表性。咖啡評級應該與風味指標相互獨立,而且Sweet Maria’s杯測方法對特定風味不會出現嚴重偏差。風味偏差最大的是花香味,但它沒有其他杯測參數那麼強的相關性。

相關報導:

https://towardsdatascience.com/a-review-of-coffee-data-grades-and-flavors-5ccb6fc51941

志願者介紹

原標題:《用數據品鑑咖啡,407杯咖啡數據教你如何區分咖啡等級和風味》

閱讀原文

相關焦點

  • 用數據品鑑咖啡,407杯咖啡數據教你如何區分咖啡等級和風味
    來源:大數據文摘 本文約2000字,建議閱讀5分鐘 我提取了所有豆子的風味評級數據,最終得到一個比原先稍大的資料庫,其中有407杯咖啡的數據。
  • 雲南咖啡風味地圖 | 數據公布
    其間有無數夥伴們付出了各自的力量:他們是在山間雲海留下足跡的收樣師,是披星戴月一刻不停的烘焙師,是千裡迢迢參加杯測的品鑑師,是默默在幕後工作統計風味數據的眾人……是所有熱愛咖啡,關注云南咖啡的人將這一切努力匯聚在一起,風味地圖項目才有了如今的成果。本項目搜集了超過300支樣品,統一烘焙,邀請來自全國各地超過90位品鑑師進行杯測,最終獲得了合計11,803份數據樣本。
  • 喝一杯「大數據」的咖啡
    資本青睞的,不是一杯一杯咖啡的利潤,而是中國大城市27萬年輕中產的大數據。瑞幸的估值,來自背後27萬年輕人的消費能量。這一杯杯咖啡,不是味蕾的依賴,而是數據的勝利!從淘寶、美團,再到肯德基、瑞幸,各類消費APP都在搜集客戶數據。那麼數據如何產生利潤?就目前而言,只有兩大模式,一是廣告,二是信貸。
  • 教你如何區分咖啡種類,選擇適合自己的咖啡
    今天教您:「區分咖啡種類」,助你找到一款適合自己的咖啡,話不多說,開始!濃縮咖啡(Espresso)或意式濃縮咖啡,是一種口感強烈的咖啡類型,方法是以90.5攝氏度的熱水,藉由130PSI高壓衝過研磨成很細的咖啡粉末來衝出咖啡。濃縮咖啡是其他種類咖啡的基礎,用小杯品嘗,最好在三口之內喝完,飲用時,無須加糖加奶,淨品其中之味。
  • 杯測是什麼?如何杯測?學習客觀品評咖啡風味
    杯測可以說是藉由科學的方法鑑定不同種咖啡的風味與特質。我們時常會說杯測和品酒非常相似,品嘗時需要讓空氣與唇部的接觸來帶出風味層次感與香氣,透過味蕾感受味道再由鼻腔後的嗅覺系統來聞香。飲用時使用杯測匙撈起再大口啜吸,這樣的方式可以讓咖啡的風味與香氣更直接的進入口腔進而散布到鼻腔。
  • 咖啡知識 | 咖啡風味輪有什麼風味?咖啡風味類型詳解
    ,那就要經過多次的風味糾正和訓練,前街咖啡在以我們日常進行的訓練為例,給大家介紹下,咖啡風味具體有哪些表現。一旦黑咖啡喝出鹹味,表示酸味與甜味的有機物已氧化殆盡,致使無機物的鹹味被凸顯,可視為咖啡走味或不新鮮的警訊。如何去看咖啡風味輪?首先,我們來看看一張完整的咖啡風味輪圖片。
  • 用數據袋泡咖啡-「宅」咖啡之Fisher coffee 番外洗杯子
    這家店有點不一樣的地方在於:他們的產品很強調數據,在商品介紹和官方使用指南中,都很強調數據。用數據做咖啡是有可行性的。上海的王力咖啡就是這樣的存在。① 「將咖啡包放入杯中,開始計時並倒入140ml……」注水是不是有時間要求?如果是囊括在總計時裡面,那隨後的提拉一系列應該都有時間和速度影響,會影響浸泡時長吧。第二次的提拉如果速度慢,到三分鐘止的話,浸泡時間長短和速度快慢有很大的影響。
  • 咖啡風味:新手如何描述咖啡的風味?
    ,想跟別人分享的時候,該如何表達你喝到什麼風味,這杯咖啡帶給你什麼感覺呢?這次前街咖啡就教大家如何描述一杯咖啡風味。咖啡的香氣非常繁多複雜,為了方便人們辨別咖啡的香味,法國Jean Lenoir根據咖啡存在的香味製作出36味聞香瓶(Le Nez du Cafe)。36種香氣,分別屬於泥土、蔬菜、幹植物、木質、香料、花、果、動物、烘烤、化學十大類別和酶素反應群組、焦糖化反應群組、乾餾反應群組、瑕疵群組四大群組。
  • 咖啡 | 如何調製一杯冷咖啡?
    想找口感豐富的冷咖啡?舊金山便是你的答案,這裡的烘焙師和咖啡公司已經破解了新鮮冷萃的奧秘。在製作一杯冰咖啡的初始階段,如何使其保有和熱咖啡同樣的濃鬱風味便是一項挑戰。這要求咖啡和水(也可能是冰)的比例達到微妙的平衡;準備過程中,如果加入過多的咖啡,味道會過濃;如加入太多的水,則會削弱咖啡的原有風味。低溫衝泡的冷萃咖啡同樣要求咖啡要在冰的狀態下上桌,要達到冷卻效果,咖啡在空氣中暴露的時間會相對較長,空氣的氧化作用會導致咖啡味道「 失調」,缺少熱咖啡曾有的一些芳香和風味。
  • 詳解SCAA咖啡風味輪味譜使用方式 如何辨別咖啡風味香氣的不同
    風味一詞在日常生活中更多的用味道,滋味來使用,也就是英文的flavor,在咖啡品鑑中,通常用調性來描述。打個通俗的比方,川菜中,我們有很多調性,比如魚香味,糖醋味。咖啡中,我們也會用,花香調性,水果調性,焦糖調性來描述味道,但咖啡的風味問題困擾著好多同學。「什麼是咖啡的風味?」
  • 這杯咖啡令人著迷的秘密
    我一直堅持親自挑選上等咖啡豆,精心調配出恰到好處的香濃,也因此讓自己的咖啡館變得小有名氣,除了很多慕名而來的咖啡愛好者,每月也會和朋友一起坐下來品咖啡,聊咖啡,探討生活與咖啡之間的奧秘。但我常會想,自己如此鑽研咖啡,這研磨的手法和調配的技巧,只有到店裡才能體會,如何隨時隨地的享用呢?所以我一直在尋找那杯口感醇正又能徵服研磨控的速溶咖啡!
  • 品咖啡 | 如何像行家一樣品鑑一杯瑰夏,如何衝好瑰夏?
    ,花香、果香、柑橘香酸、厚實多汁的口感⇒ 精選最適完熟咖啡果實造就濃甜、明亮果酸、美味的風味⇒ 此等級瑰夏豆一樣有水洗或日曬處理生豆可供選擇品咖啡如何正確品一杯藍標瑰夏?       今天以【藍標瑰夏】為例,如何正確品一杯瑰夏      品鑑單品耶加雪菲一共分為七步:        水洗的瑰夏有些許著桂花和茉莉的花香,具備蜜柚以及柑橘的氣息,淺烘焙時更透出tea rose茶香香氣。
  • 獵奇 | 透明咖啡、大數據咖啡都是什麼鬼?
    最簡單粗暴的是Swift,因為它由蘋果開發,所對應的咖啡就是蘋果風味…… /大數據咖啡/ 它能讓你喝出對應的文學作品的情緒。 這可不是烘培師們的一廂情願,而是有大數據作為支撐的。於是,氮氣冷萃咖啡橫空出世。用冷泡的方式萃取咖啡,將萃取的咖啡裝在鋼桶裡,喝的時候,再利用氮氣將咖啡從酒柱推出,產生綿密的泡沫層。
  • Tableau 咖啡計算器,教你從營養層面選咖啡
    但不同於奶茶這種明確的「致肥飲料」,咖啡與體重的關係一直有些爭議,有的說法是咖啡可以加速燃脂,也有人認為咖啡中的糖和奶油會一視同仁地令人發胖。那麼究竟怎麼判斷呢?還是要看不同種類咖啡的實際營養成分才知道哦。今天就一起跟隨 Kinsey 的 Viz 作品來找答案吧~
  • 咖啡風味是如何「整」出來的?
    前陣子去打卡咖啡館,喝了一杯咖啡,巧的是,和吧檯隔壁的客人點的是同一杯,大概因為都對咖啡感興趣,兩人倒是不謀而合討論起了如何喝一杯咖啡
  • 數據雞湯:雞湯裡的咖啡
    咖啡常識101咖啡的種類,就算撇開豆子的品種不說,也有至少幾十種的配方供你選擇。但每當你走進咖啡廳時,真的分的清楚拿鐵和卡布奇諾的差異嗎?快來看看下面這23種常見咖啡的實際比例是如何吧!美國有位專欄作家Jamie Condliffe根據科學家的實驗,建議我們應該要避免腦部釋放皮質醇的期間(因為皮質醇一部分的效用會提高人的警覺性),這些時間段在一天中,大約發生在早上的8:00-9:00、中午的12:00-13:00和下午的5:30-6:30(如下圖)。在這些期間攝取咖啡可能沒有太多顯著的效果,因為你的身體可能本身就已經很亢奮!
  • 咖啡愛好者的衝煮指南,如何改善你每日杯中的美好風味?
    《手工咖啡:咖啡愛好者的完美衝煮指南》內容簡介本書是一本講解咖啡知識的實用指南,從基礎知識、衝煮器具、原產地、購買咖啡、品鑑風味及衝煮方法六個方面,系統地講解了關於咖啡的實用知識——如何根據預算和喜好選擇一款適合你生活方式的器具?如何品鑑出咖啡中酸、甜、苦、鹹、鮮五種基本風味?如果你的咖啡太苦或太酸,可以控制哪些因素進行調整?
  • SOE拿鐵咖啡 單品拿鐵咖啡風味 單一產區咖啡豆拿鐵咖啡
    前街咖啡萃取soe咖啡決定一杯咖啡是否好喝的因素有很多,比如咖啡豆的品種、烘焙的程度、萃取的咖啡機、製作過程、個人口感喜好等,而SOE只是指用單品咖啡豆做的意式濃縮咖啡,當單品咖啡豆製作成濃縮咖啡後,咖啡豆的風味就會被放大,換個說法就是同一款咖啡豆,手衝出來的咖啡風味是柑橘,莓果,甜感明顯,整體乾淨清爽,而製作成濃縮咖啡後可能會變得尖酸,澀感,難以下咽。
  • 如何煮出一杯完美的咖啡?
    每個人都想煮出完美的咖啡,但部分人煮出的咖啡甚至都不能算好,只達到了中等水準或者更低。德州農工大學咖啡研究與教育中心咖啡培訓和項目主任Rodrigo Chavez提供了一些有用的建議,告訴你如何煮出真正的好咖啡,以及購買好咖啡對你和種植咖啡豆的農民意味著什麼。
  • 曼特寧與意式咖啡哪一個更苦?咖啡不同衝煮方式對咖啡風味的影響
    【意式濃縮咖啡與單品咖啡概念】|意式濃縮咖啡如果要用數據來進行概括的解釋的話,水粉比例一般在1:2-1:3,舉例:20g粉在9 bar±2氣壓下被90.5~96°C的水萃取20~30秒時間得到40g咖啡(雙份濃縮分量)這所得到的40g咖啡就叫做Espresso