作者 | Gordon,Alice
頭圖 | CSDN下載自視覺中國
現在越來越多年輕人手裡的那一杯快樂肥宅水,從可樂換成了奶茶。上世紀80年的奶茶並不像現在的奶茶口味繁多,配料多樣,而大部分80、90後童年的奶茶只有一個名字,那就是「臺灣珍珠奶茶」。只需要一間幾平方米的小店,一臺手動封杯口機器,幾罐不同口味的奶茶粉末,就可以開一家奶茶店。
奶茶起源於中國北方遊牧民族,知名於中國臺灣。早期的臺灣奶茶品牌,如CoCo、50嵐、老虎茶等等。前兩家CoCo和50嵐(現在的1點點)都已經成為中國大陸大型的連鎖奶茶店。隨著奶茶越來越受大眾喜愛,湧現出更多的本土奶茶品牌,如蜜雪冰城、益禾堂。再到如今的網紅時代,由於不同奶茶品牌的口味差異不大,如何更好地營銷自己的奶茶品牌,讓消費者能從眾多奶茶中翻到自己的牌子,變得更加重要。例如奈雪的茶主打高端路線,奶茶均價在40元左右;喜茶主打品牌差異化,注重茶飲口感的同時營造店面排長龍的「時尚文化」。
圖1 奶茶發展史
數據獲取
本文數據來源於美團網,抓取了12個熱門城市的奶茶店名單,城市包括:北京、上海、廣州、深圳、天津、西安、重慶、杭州、南京、武漢、成都和長沙。共計68614家奶茶店,3萬多個奶茶品牌。在構建抓取URL時,需要注意將城市的維度具體到城市商圈,因為每個URL最多只顯示32頁內容,保證抓取每個城市時的數據量是準確的。
# 構建抓取URLdefget_url_1():for city,city_code in city_dict.items():for block_dict in area_dict[city]:for children in block_dict['children']:for page in range(1,33):block_code = children['id'] offset = 32 * (page-1)# print(city, area, block, block_code) url = 'https://apimobile.meituan.com/group/v4/poi/pcsearch/{}?uuid=6ddabcb37fdd4a8e9cdf.1599125825.1.0.0&userid=280531290&limit=32&offset={}&cateId=-1&q=奶茶果汁&areaId={}&sort=solds'.format(city_code,offset,block_code) redis_db.sadd('meituan_milk', url)
數據清洗
數據清洗部分,主要清洗了奶茶店鋪名稱,雖然數據均來源於美團網,但是同一個奶茶品牌會有多種格式,如1點點和1點點,大卡司和大卡司DAKASI。由於奶茶品牌數量眾多,並且真假難辨,所以只能進行針對性清洗,對部分名氣高的奶茶品牌名稱要保證其統一。
# 清洗欄位defclean(x):title = re.sub(u"(.*?)", "", x['title']) title = title.replace('點點','點點').replace('(','').replace(')','') title = title.replace('一點點','1點點')if'一杯會說話的茶'in title: title = '1314一杯會說話的茶'elif'大卡司'in title: title = '大卡司DAKASI'elif'1點點'in title: title = '1點點'elif'都可'in title: title = 'CoCo都可'elif'書亦燒仙草'in title: title = '書亦燒仙草'elif'蜜雪冰城'in title: title = '蜜雪冰城'elif'royal'in title or'Royal'in title or'ROYAL'in title: title = 'Royaltea皇茶'elif'ALS'in title: title = 'ALS GONG CHA貢茶'elif'GONG'in title: title = '貢茶'elif'茶百道'in title: title = '茶百道'elif'吾飲良品'in title: title = '吾飲良品'elif'悸動燒仙草'in title: title = '悸動燒仙草'elif'滬上阿姨'in title: title = '滬上阿姨'elif'7分甜'in title: title = '7分甜'elif'古茗'in title: title = '古茗'elif'奈雪'in title: title = '奈雪の茶'elif'悅色'in title: title = '茶顏悅色'else:passreturn titledf['title'] = df.apply(clean, axis=1)
數據可視化
當筆者在製作可視化圖表的時候,會發現有些奶茶品牌的名稱極為相似,讓人有一種傻傻分不清楚的感覺。
圖2 類似的奶茶品牌名稱
例如喜茶的前身「Royaltea皇茶」,因為皇茶這個商標無法註冊版權,只能加前綴或後綴,所以就出現了「世代皇茶」,「雅島英皇茶」等等的同胞「兄弟」。正是飽受這種侵權而不能訴諸法律的情況,聶雲宸才會想到直接棄了皇茶這個品牌,改名為喜茶。無獨有偶,「貢茶」這個牌子也被各種盜版,而且部分盜版牌子居然還有主頁官網,讓你很難區分哪家才是正品,這也足以顯示奶茶行業品牌競爭的激烈情況。
圖3 熱門城市奶茶店鋪數量情況
從全國12個熱門城市來看奶茶店鋪數量分布情況,廣州的店鋪數量是最多的,擁有11419家,之後是深圳(9367家)、上海(7940家)、成都(7361家)。4個一線城市中,北京的奶茶店只有4643家,筆者猜測因為北京位於北方,並不像南方一年四季幾乎都是熱天,而奶茶主要是作為冷飲,尤其現在最流行的奶蓋茶,只適用於冷飲,過熱的水溫會導致奶蓋融化。還有一點原因是,由於茶樹的生長發育需要大量水分,對空氣溼度和降水量均有比較高的要求,所以國內茶葉的產地主要集中在南方,相應的運輸成本也有價格優勢,因此相較於南方的熱門城市,北京、天津奶茶店鋪的數量相對較少。
圖4 奶茶品牌店鋪數量 TOP15
在這12個熱門城市中,總共有3萬多個奶茶品牌,最為消費者所熟悉的奶茶品牌有1點點和CoCo,它們都擁有超過1500家門店,並且都是存活了10多年的老品牌。此外,書亦燒仙草、蜜雪冰城和貢茶這些也都是有上千家門店的奶茶品牌,它們的門店都喜歡開在一起,類似於麥當勞和肯德基。一旦你在某個城市商圈看到其中一家奶茶店,在幾百米的距離內肯定能找到上述的某幾家奶茶店。
圖5 特色奶茶分布情況
有些奶茶店很有自己的地域特色,如果你想品嘗它們的原版奶茶,就可能需要跑到別的城市才能喝到,因為它們大部分分店都只開在本土城市。例如「吾飲良品(I Drink)」大部分分店開設在武漢。「茶顏悅色」的店面93.57%在長沙。「滬上阿姨」雖然生在上海,卻火在天津,分店總數有208家,而上海只有6家分店。「古茗」的分店主要集中在杭州和重慶,「茗」象徵著茶,因為這2個城市是盛產茶葉的地方。如果大家到了這些城市,記得打卡喝一杯原汁原味的奶茶。
圖6 大眾奶茶分布情況
接下來介紹一下大眾奶茶中的1點點,CoCo,書亦燒仙草和益禾堂的熱門城市分布情況,因為筆者在廣州經常能看到這幾家店,而且店面都是挨得很近。1點點和CoCo在上海的分店數量都是最多的,而書亦燒仙草在成都和長沙比較普遍,益禾堂則是在廣州和深圳。這4家奶茶品牌在廣州分店數量均有上百家,也難怪走到哪都能看到這幾家奶茶店。
圖7 奶茶品牌均價情況
「奈雪の茶」和「喜茶」作為近期最火的新式網紅茶飲,前者人均消費39元,後者約31元。而大部分奶茶品牌的均價在10-17元,之所以這兩家奶茶品牌均價會這麼高,原因在於它們採用了「茶飲+」的營銷方式,除了近30元一杯的奶茶外,還有吐司,甜品和咖啡等搭配產品,而其它品牌只是單純銷售各式各樣的奶茶。
結語
此次筆者只分析了12個熱門城市的奶茶門店數據,如果將範圍擴展到全國進行分析,或許能得到更多有意思的結果。另外,由於奶茶的含糖量高,茶葉中又含有咖啡因,容易導致肥胖和失眠,畢竟某個周姓天王歌手由於愛好奶茶已經日益發胖,就是最好的樣例。身邊也有朋友說晚上喝完奶茶,會睜眼到天亮的情況,所以奶茶不能多喝。目前也有部分品牌開始推出無糖茶,用代糖來代替白糖,這也許是奶茶的未來趨勢,既好喝又健康的奶茶,誰不愛呢?最後,如果有同事或朋友想請你喝奶茶,請參考圖7價格表,好好「善待」一番吧。
作者簡介:
Gordon,對爬蟲/機器學習/數據建模/可視化均有所涉獵的數據分析師。
Alice,在讀研究僧一枚,跨行新手數據分析師。