徐大sao吃了哪些好吃的?用Python生成詞雲,一目了然!

2020-12-21 小知編程

美食視頻作者徐大sao在網際網路上很受歡迎,平時我也非常關注他。每天都吃一頓好的,那麼他到底吃吃了哪些好吃的?在日常閱讀中,我們經常遇到一些詞雲圖片,看上去很炫酷,也能很直觀的反應關鍵詞的分布情況。本文我們將帶著任務去學習,分析一 下徐大sao到底吃了哪些好吃的,給好吃的排個名。

一、獲取徐大sao所有投稿視頻標題

想知道徐大sao每天吃什麼最多,我們可以通過標題直接看到,比如最近一期的」用sao式老方做一盆熱乾麵,一斤面不夠吃,醬香濃鬱,一口就上癮」,我們能夠看出他吃的是熱乾麵。對應的,只需要抓取徐大sao近年來所有的投稿視頻,我們就能分析出他吃什麼好吃的最多。

打開徐大sao的主頁,點擊「投稿」按F12來找一下接口:

我們可以點擊XHR(xhr,全稱為XMLHttpRequest,用於與伺服器交互數據是ajax功能實現)看看有沒有接口,經過尋找發現有可能存在接口。

右鍵在新的窗口中打開(右鍵點擊Open in new tab),看看是不是:

下圖可以看到,的確獲得了視頻的標題,那麼藍框中的參數是什麼意思呢?

經過觀察,不難發現,在徐大sao的視頻頁面中,每行有5個視頻,共有6列,一共是30個視頻。所以我們能夠大膽的猜測,ps=30這個參數,應該就是目前視頻標題數量。

那麼pn呢,默認pn=1,翻頁不難發現,pn隨著翻頁而改變,pn就是page number的縮寫,一共是17頁面。

那就簡單了,我們只需要get請求17次就能抓取到所有數據了。

數據的清洗:

上面get獲取到的json數據,不光是標題,還有簡介,評論數等各種信息,我們這裡格式化一下json看一下json數據格式,方便我們清洗。

用json數據格式化工具格式化之後,可以看到標題title在data的list下面的vlist裡面。

碼代碼:

經過我們的分析,短短幾行代碼就能獲取到第一頁的所有視頻標題:

我們只需要優化一下代碼,做個循環,就能獲取到徐大sao所有的視頻標題:

這樣我們就得到了,所有的視頻標題,並存在了一個列表中。

二、安裝所需模塊

俗話說,磨鐮不誤砍柴工。我們現在安裝一下jieba模塊用來分詞,統計詞頻,用wordcloud模塊來生成詞雲。

安裝jieba模塊,只需要執行pip install jieba

安裝wordcloud模塊對於新手來說是個問題,如果直接執行pip install wordcloud,windows下會報錯,我們用wheel方式來安裝。

首先打開 lfd.uci.edu/~gohlke/pythonlibs/ ,然後按下Ctrl +F 輸入 wordcloud並搜索。

找到合適自己的版本並下載,我這裡安裝的是python 64位的 3.7版本,那麼就下載wordcloud-1.6.0-cp37-cp37m-win_amd64.whl。

然後執行pip install wheel安裝wheel模塊,

接著執行 pip install wordcloud-1.6.0-cp37-cp37m-win_amd64.whl注意替換成你下載的模塊:

三、開始分析

jieba分詞模塊基礎功能

輸出:用sao式老方做一盆熱乾麵 ,一斤面不夠吃 ,醬香濃鬱,一口就上癮

詞雲模塊的基礎功能,將上面一句話生成詞雲看看:

結果為:

OK,迫不及待,我們直接分析,所有標題的結果吧!

得到結果,字體越大,頻率越高。不難發現,大sao最喜歡吃大蒜米飯,這些,並且非常過癮。

但是這裡面有各種各樣的詞彙,我們想知道徐大sao吃了哪些好吃的,可以將名詞選出來。

案例:

那麼n就代表名詞,我們用名詞做一個詞雲。

代碼如下:

OK,一目了然,到這裡我們看到,大sao吃的最多的就是大蒜,米飯,麵條,各種面。看來「碳水教父」的稱號果然名不虛傳啊。

那要是給各個詞排個名次,統計出現的具體次數該怎麼做呢:

輸出結果如下:

可以看到,大蒜,出現了足足134次,遠遠超過第二名!!!其次是米飯,辣椒,火鍋,麵條。

真是離不開,辣和碳水。

會了這種方法,你就可以為你喜歡的美食博主做個分析啦!

相關焦點

  • B站百大UP主徐大sao,為何只要更新視頻,就會迎來取關?
    相信只要是關注B站吃播板塊的小夥伴,都有看過徐大sao的視頻。畢竟在今年那段不能出門的日子裡,徐大sao憑藉著具有生活氣息的吃播視頻,成功獲得視頻播放量與整體漲粉數的雙豐收。
  • 徐大sao停更,因為炸雞視頻被網友圍攻,網友們該想想了
    前幾日,大sao詐捐的傳言甚囂塵上。可能你已經知道了,如果你不知道的話,我和你們大概說說。  這一切,源自李文亮醫生之前的微博,會發現他去年10月的時候,他曾經發微博表示正新也好、叫了個雞也好,感覺都沒有徐大SAO做得好吃啊。  然而就這個捐出所有收益的承諾,卻成了這位UP主之後的噩夢。
  • 千萬粉絲吃播徐大sao「詐捐」,到底是真是假,我們一起探究
    咱們閒話少續,今天主要聊一聊這個徐大sao。我們要知道徐大sao在多個平臺進行視頻發布,擁有粉絲上千萬,每月收入相比大家可想而知。作為一個重量級的視頻主,其實他是沒有必要這樣做的。小編猜想他初衷無非就是要為故去的人做一點奉獻,但世事難料別人不接受網絡捐贈,也就是想趕快忘卻傷疤,那我們又何必再去揭開呢。
  • B站up主徐大sao再陷輿論風波,硬造慷慨人設,假編劇情插廣告遭錘
    B站百萬級up主徐大sao自18年開始,徐大sao依靠個人淳樸真實的美食視頻走紅後,瞬間走了上人生巔峰,成為了各大自媒體平臺的美食視頻網紅一哥,粉絲累計上千萬。再加上其他事件的影響,徐大sao成了B站掉粉最嚴重的up主。近日徐大sao因為吃播視頻又陷輿論風波,不少粉絲質疑徐大sao人品。視頻吃播大概內容:徐大騷到武漢參加機場的活動,晚上八點打的去吃飯,偶然找到一家火鍋店,在吃飯途中有人給徐大騷送了一杯「一芳品牌」的奶茶。
  • 推薦幾個非常好用的詞雲生成工具,再也不用發愁做不出炫酷的文字
    詞雲首先說一下什麼是詞雲,以及詞雲能幹什麼詞雲,就是用詞語組合生成的類似圖片的文字組合,可以在眾多的詞語中快速找到重點關鍵詞,同時還能美化文字美化文字,在一堆文字裡面快速發現重點關鍵字,提取關鍵信息,同時生成非常好看的圖片,讓你的作品與眾不同是詞雲的使用宗旨下面推薦幾個比較好用的詞雲工具美寄支持自定義圖片,字體,形狀等等修改優詞雲
  • 手把手教你使用Python製作高顏值詞雲圖
    相信大家也都通過各種渠道了解了老乾媽與鵝廠的愛恨糾纏,當然其中還混入了迷惑行為的「騙子」、吃瓜吃得飛起的「阿里系」以及連稱此事與我無關的「某搜尋引擎」。我事先分別用python爬取了騰訊和老乾媽的回應微博下的評論(老乾媽沒有微博,換成了老乾媽警方公告下的評論),jieba分詞得到結果後,分別製作詞雲。左邊是用經典的wordcloud,右側則是今天的主角stylecloud。stylecloud簡介stylecloud 是一個 Python 包,一位數據科學家Max Woolf基於wordcloud優化改良而成。
  • 如何用Python生成若干個隨機姓名?男女取名有方法,不能千篇一律
    用Python帶你1步搞定還帶大家將百家姓的起源內容存入到了Excel中複習Excel樣式設置,案例演示Python將《百家姓》起源存到Excel中另外,針對我們常用的名字進行詞雲展示我國男女生常用名有哪些?Python用wordcloud展示,有你名字嗎?
  • 徐大SAO:不求盡如人意,但求問心無愧
    徐大SAO的生活態度徐大SAO本來是一個安徽阜陽農村的普通青年,在老家做空調安裝修理工作,家境普通工作普通,因為在B站上傳自己的美食視頻而被大家所熟知,他的視頻充滿了生活的氣息,瀰漫著家的味道,人也很樸實,說話平易近人,很接地氣。因此,他很快吸引了大量粉絲的關注,成為了最知名的生活美食博主之一。
  • Python3.5生成自己的詞性詞典
    鄧旭東,Python愛好者社區專欄作者 https://zhuanlan.zhihu.com/pythoncoder
  • 一鍵「詞雲」立馬提升你的檔次
    大家好,這裡是小夫百寶箱,今天給大家介紹一個在線詞雲生成網站——微詞雲小夥伴們都見過有些文字組成的「詞雲」,用一系列詞組拼出圖形,比起一大堆的文字描述,這種形式既新穎,又容易讓人記住。小夫給大家看一下案例是不是非常酷炫?
  • 200萬人在線,只為看他吃蒜
    做飯的人叫徐大sao,是小王最近喜歡的美食博主。他做的菜特別橫,炸雞腿、鐵鍋牛肉燜面、羊排香辣蝦,都是小王平時吃一口悔一天的食物。徐大sao有百萬粉絲,他們都和小王一樣,喜歡半夜看他做飯。小王說,從徐大sao的視頻,她看到了她的老家、她的老媽。除了徐大sao,今天,你動動手指就能從手機上看到十萬個不同的美食視頻博主。
  • python能做什麼
    python能做什麼?書聲琅琅Python培訓老師介紹,最近許多的朋友諮詢,聽說python很火,甚至可以超越JAVA,因此很想學這個python,但是不知道python能做什麼,能完成一些什麼項目呢?針對這個問題,今天徐老師跟大家來聊一聊python能做什麼的話題。
  • 文職美女上班手動用Excel表格太麻煩,當學會python後easy操作
    二、excel表格讀取提前在我的電腦D盤根目錄下創建了一個名為test的excel表格,其內容如下:2.1 導入模塊並打開excel文檔由於一個工作簿文檔裡可能包含多個sheet,對工作簿中的sheet_names方法來獲取當前有哪些
  • python和java哪個好
    python和java哪個好?書聲琅琅Python培訓老師介紹,這兩年來IT教育發展迅速,程式語言隨著發展也日益月異,比較火的Python語言發展迅速,與傳統使用的JAVA語言來說,火爆程度差不多,就有同學問了,python和java這兩個語言到底哪個好呢?
  • Python繪製各種簡單優美曲線
    numpy 是一個用python實現的科學計算包,包括一個強大的N維數組對象Array和成熟的函數庫,有用於整合C/C++和Fortran代碼的工具包,提供了實用的線性代數、傅立葉變換和隨機數生成函數等工具,可以理解成Matlab。哪些看似抽象的數學公式,實際上是自己不知道她們的應用場景而已。
  • 坑爹的Python陷阱
    那麼Python中哪些真正算得上陷阱呢第一:以mutable對象作為默認參數這個估計是最廣為人知的了,Python和其他很多語言一樣,提供了默認參數,默認參數確實是個好東西,可以讓函數調用者忽略一些細節(比如GUI編程,Tkinter,QT),對於lambda表達式也非常有用。
  • 用 Python 寫一個安卓 APP
    http://youerning.blog.51cto.com/10513771/1733534前言用 Python 寫安卓 APP 肯定不是最好的選擇,目前用Java和 kotlin 寫的居多,但是肯定也是一個很偷懶的選擇
  • PythonPython100個練手項目
    一鍵生成微信個人專屬數據報告(了解你的微信社交歷史)    9. 一鍵生成QQ個人歷史報告    10. 微信公眾號文章爬蟲    11. 新浪微博爬蟲分享(一天可抓取 1300 萬條數據)    12.
  • 開課吧:Python是什麼意思?為什麼有那麼多人學Python?
    python非常容易上手,而且能幹很多事情,WEB開發,機器學習人工智慧,數據分析,量化投資,爬蟲等,基本可以應用到各行各業,而且大家都在做基於PYTHON的庫,使得PYTHON語言變成一門直接拿來就能用的語言,更像一種工具了,比如機器學習,可能理論很複雜,但是實際在PYTHON中僅僅幾行代碼就能實現,不用花太多時間用在碼代碼上面,python 現在是越來越火