人人都能發現王思聰的中獎名單有貓膩

2021-02-19 多元思維Hack

前幾天 iG 奪冠,王老闆在微博抽獎,113 個 10000 元。


抽獎結果出來後,有心人爆出獲獎的人數 113 裡面有 112 個都是女性,這不免讓人生疑,很多大號都發文章說了,我也就不湊熱鬧了。

為啥總有人這麼牛逼,能發現這些別人看不到的事情。分析出這個結果需要什麼能力呢?

寫代碼?數據分析?還是啥東西?

這篇文章,給大家分享一個,普通人也能分析出王思聰中獎名單貓膩的方法。

首先,要分析中獎名單,肯定要知道哪些人中獎了,這些信息哪裡來呢?

這部分信息肯定是公開的,那是不公開,誰知道是不是內定呢?那結果去哪裡看呢?

王思聰發的抽獎,他的微博肯定有入口,到微博主頁搜索「王思聰」。


然後點進去,到他的微博主頁,從最近的帖子看,果然看到一條他發的抽獎結果信息,裡面有名單公示連結入口。

點這個連結,果然看到了所有中獎人的名單:


點進去第一個看看,到了他的微博主頁,但是沒有性別,雖然頭像哪裡有個箭頭,但是不直觀。繼續觀察,看到右下角一個「查看更多」


點進去看看,公開信息基本都可以看到。


好了,至此,我們已經研究出了找到中獎名單的詳細信息路徑,下面就是如果把這些信息統計下來了。

113 個,手動統計?太麻煩了!
編程?門檻太高!
有沒有啥工具,可以幫我們呢?有!

話不多說,直接上步驟!

使用軟體:webscraper

安裝步驟,看視頻:https://v.qq.com/x/page/j0753l7ki12.html

安裝好以後,打開 webscraper,點擊「導入Sitemap」


然後下面需要用到的一些代碼,大家不用理會它什麼意思。

{"_id":"wangsicong","startUrl":["http://event.weibo.com/yae/event/lottery/result?pageid=100140E1198435&id=3436763&f=weibo"],"selectors":[{"id":"people","type":"SelectorElementClick","parentSelectors":["_root"],"selector":"h4 a.S_txt1","multiple":true,"delay":"2000","clickElementSelector":"a.page.S_txt1:nth-of-type(n+3)","clickType":"clickOnce","discardInitialElements":false,"clickElementUniquenessType":"uniqueText"},{"id":"bbb","type":"SelectorLink","parentSelectors":["people"],"selector":"_parent_","multiple":false,"delay":0},{"id":"ccc","type":"SelectorLink","parentSelectors":["bbb"],"selector":"div.PCD_person_info a.WB_cardmore","multiple":false,"delay":"2000"},{"id":"ddd","type":"SelectorElement","parentSelectors":["ccc"],"selector":"div#plc_main","multiple":false,"delay":"3000"},{"id":"eee","type":"SelectorText","parentSelectors":["ddd"],"selector":"div.WB_cardwrap:nth-of-type(1) li.li_1:nth-of-type(1) span.pt_detail","multiple":false,"regex":"","delay":0},{"id":"address","type":"SelectorText","parentSelectors":["ddd"],"selector":"li.li_1:nth-of-type(2) span.pt_detail","multiple":false,"regex":"","delay":0},{"id":"sex","type":"SelectorText","parentSelectors":["ddd"],"selector":"li.li_1:nth-of-type(3) span.pt_detail","multiple":false,"regex":"","delay":0},{"id":"time","type":"SelectorText","parentSelectors":["ddd"],"selector":"li.li_1:nth-of-type(7) span.pt_detail","multiple":false,"regex":"","delay":0},{"id":"following","type":"SelectorText","parentSelectors":["ddd"],"selector":"td.S_line1:nth-of-type(1) strong.W_f18","multiple":false,"regex":"","delay":0},{"id":"followed","type":"SelectorText","parentSelectors":["ddd"],"selector":"td.S_line1:nth-of-type(2) strong.W_f18","multiple":false,"regex":"","delay":0},{"id":"content","type":"SelectorText","parentSelectors":["ddd"],"selector":"td.S_line1:nth-of-type(3) strong.W_f18","multiple":false,"regex":"","delay":0},{"id":"level","type":"SelectorText","parentSelectors":["ddd"],"selector":"p.level_info span.info:nth-of-type(1) span.S_txt1","multiple":false,"regex":"","delay":0},{"id":"vip","type":"SelectorText","parentSelectors":["ddd"],"selector":"p.info:nth-of-type(2)","multiple":false,"regex":"","delay":0},{"id":"birthday","type":"SelectorText","parentSelectors":["ddd"],"selector":"li.li_1:nth-of-type(4) span.pt_detail","multiple":false,"regex":"","delay":0}]}

需要輸入 2 個信息:
1、複製粘貼,一字不差,如果提示錯誤,檢查一下是不是一字不差,一字不差的意思是,一個標點符號都不能有誤差。
2、英文字母,隨便寫。


填完以後,點擊下面的 「Import Sitemap」

然後,點擊中間下拉菜單,再點擊 「scrape」


然後,點擊 「start scraping」


然後,會彈出一個窗口,你需要做的就是 —— ,等他抓完。

這個時間,你可以在電腦上做其他任何事情,不要關掉這個彈出的窗口就行。

大概 10 - 20 分鐘,就抓完了,具體時間根據具體情況定,抓完窗口就自動關閉了。

然後,你會看到下面這個圖片,點擊「refresh」


等出現一大堆數據後,點擊中間菜單欄,點擊 「export data as CSV」


點擊 「download」


ok,抓取到的數據,已經下載到電腦上了,你可以用 excel 打開,看看裡面有些什麼?


可以看到 113 條數據,就是 113 個中獎名單,有暱稱,地點,性別,註冊日期,關注,粉絲數,帖子數,微博等級,會員等級,個性籤名等。

可能你看到的會和上面的截圖有些不一樣,因為我已經把無關的信息列刪掉了,你直接下載下來是沒有刪掉的,你可以研究一下那些多餘的數據是什麼?其實也蠻有趣的!(後臺回復「微博」,可以獲取原始數據)

我們可以很清楚的看到,性別那列除了一個男,其他都是女,已經達到我們的目的了,但是能不能看起來更美觀一點?

聽說 excel 的透視表可以做那種看起來很有逼格的圖表,透視表,一聽就很難的樣子,實際上,我只花了 1 分鐘,然後發現,沒學會,就放棄了。

我心裡有一個聲音在響,一定有更簡單的方法做這個,一定有!

然後我就開始冥想,果然,突然靈光一閃,我想到了谷歌表格,(其實是我試了好多工具,發現谷歌表格最好用),應該可以做到這個。

麻利的打開谷歌,搜索「谷歌表格」,第一個網站,點進去,先新建一個空白表格。

然後管他三七二十一,先把要處理的數據粘貼上去,我把性別這一列數據粘貼到剛才新建的空白表格裡面,如下——


我想,谷歌的產品號稱簡潔易操作,我選中要處理的這列,應該會有一個按鈕,我一按,它就自動幫我生成一個圖標之類的東西,嗯,肯定是這樣。

管他呢!我點!點!點……

果然,在插入這個菜單下面,發現了一個叫「圖表」的選項 ——


管他呢,先看看效果 ——


哈哈,不錯,果然成功了!

但是這種展示比例的數據,之前看別人的圖片,用那種圓餅的樣子好像比較舒服,應該有按鈕可以選擇圖表類型吧,管他呢,到處點點試一下!

果然,在右邊發現了一個選項!剛好有我想要的圓餅圖


管他呢,點了試試 ——


完美!

excel 裡面的數據還有其他類型,都放上去做個圖表吧,反正有那麼多圖標類型,都試一下,看哪個漂亮,就選哪個!

地域

上海、北京、廣東人數最多,好像符合預期。

關注的人數

大部分用戶關注的人都在 300 以內,還是蠻愛學習(八卦)的。

粉絲數

可以看到,粉絲數大於 5000 的只有 3個。

帖子

大部分人都是在 850 個帖子內。

微博等級

等級在 30 區間的最多,幾乎佔到了一半還多。

是否會員

會員 30%,非會員 70%,如果數據沒有貓膩,這個比例可以用來評估微博的總體會員數,畢竟 2000w 的量足夠覆蓋到各個圈層,如果擔心不準確,可以多找幾個其他類別的數據,平均一下,也許王思聰的粉絲都比較有錢呢?

至此,藉助上面的工具,我們實現了

1. 找到信息源頭
2. 採集數據
3. 分析展示

這個完整流程。

我想說的是,上面這個例子,不僅僅是無聊湊熱鬧,這包含了面對一個信息,如何挖掘、整理、分析、展示的過程,可能中途你會遇到一些問題,但是大家注意到我上面的一個詞沒——

管他呢,先試試!

遇到問題不可怕,你遇到的問題,一定有解決方案。可怕的是,你小心翼翼,擔心嘗試的結果不如人意,浪費時間。

沒事的,自己的主動嘗試,後面的過程、結果,都會促進你的邏輯、思維更進一步,這個無形中鍛鍊出來的能力,在日後會帶給你無窮的裨益。

在爬蟲群裡,我經常遇到一些朋友,遇到一個新網站,還沒操作,就先來群裡問,這個能不能抓?其實我內心是崩潰的,能不能抓,你應該自己先試一試,如果每次遇到新網站,都需要別人肯定後,才用勇氣自己操作,那麼永遠也成長不了。

如果你下次遇到這種問題,自己還沒試,就想著問別人,我希望你能想起來下面這句話——

沒事,管他呢,先幹!

以上,是我今天的分享,希望能給您帶來幫助。

哦,對了,老闆,如果覺得本文有用,萬水千山總是情,打賞一塊行不行?

如果不打賞,分享給朋友行不行

實在不行,你就……看著辦吧!

哈哈哈哈哈

👇👇👇👇👇👇👇👇

您可能還會感興趣:

雙 11剁手,不如提升認知,擁有一個開掛的人生

有關webscraper的一些問題

分析了10個公眾號5600篇文章2000w字,原來它們用這個詞最多!

如果

相關焦點

  • 中獎名單丨小夥伴們快來看看中獎名單有沒有你
    經過小編數日辛苦的整理,「優C果茶1元搶活動」和「哈尼甜品找茬活動」的中獎名單正式出爐。
  • 溫馨提醒:明天你與胡鴻鈞有個約會哦!(內附近期活動中獎名單)
    、獲上臺互動機會名單(中獎名單由微信後臺留言中選出8名及線上遊戲中獎2名組成)(以上中獎的親們都已經收到小編在後臺發送的獲獎通知啦,記得及時去領獎哦!)沒中獎的別灰心,以後每次都來參加信君的活動,總有一次幸運兒會是你哦!
  • 踩地雷活動中獎名單!
    好像發現了什麼。沒錯,就是十二生肖。 你以為這樣就完了?請接著往下看.由於活動火爆,錢粉們的積極參與,我們決定在未中獎的錢粉中隨機選取一些用戶,同樣送10元話費。以下是幸運用戶名單:
  • 找錯字,領話費中獎名單!快來看看有沒有你!
    本期文章裡面一共有六個錯別字,只要您回答對五個即為正確。我們從回答正確的微友裡面抽取五名幸運朋友,濮陽百事通為您充10-50元話費!名單如下↓ 微信姓名中獎金額電話jyc960楊*50元話費152****7715芳雅如花小雨萌劉*偉30元話費138****6237candy09810唐*20元話費157****0273流年瘋長趙*婷10元話費139****8521漂亮辣媽李*10元話費150****3092 恭喜賀喜
  • 【中獎啦】第四期發票搖獎兌獎工作已經開始,中獎名單在這裡!
    懷來縣發票搖獎工作領導小組辦公室關於懷來縣綜合治稅發票搖獎第四期中獎名單的公告 經懷來縣發票搖獎工作領導小組批准,2019年3月1日在懷來縣公證處公證員的監督下,懷來縣綜合治稅發票搖獎第四期1500個中獎名單已產生,現將相關事宜公告如下:1、1500名中獎者包括
  • 星巴克兌換券中獎名單
    星巴克兌換券中獎名單中獎名單:@天使的興奮劑、@荀荀、@Ciel、@火星妹認真點!
  • 留言抽獎 | 第五周中獎名單公布(抽獎規則有調整,大家注意看下)
    哈嘍各位新老朋友們,又到了一周一度公布留言中獎名單的時候啦下周咱們就要從30位幸運兒中抽取麵條機/破壁機的大獎啦~大家是不是很期待呀
  • 【​拿坡海】中獎名單公布
    套餐內含:菌菇奶油蛋包飯×1份、黑椒牛肉意面×1份、榴槤薄脆披薩×1份玉米濃湯×1份、百香果樂園×1份參與後臺活動中獎名單微信名稱電話號碼Kouun189****8786偎與183****8148不禾幾178****5508領獎須知:1.所有中獎的小夥伴,請添加叄小獸微信(sanshou521521),發送【店名+姓名+電話】登記中獎,登記時間截止10月16日18:00
  • 王思聰「後院失火」!!狗女婿大戰丈母娘林更新!
    冰晨予狗血大戲精彩不斷,林更新手賤轉發李晨微博,不幸躺槍被罵;百忙之中自娛自樂一下還被韓寒家的狗嗆聲……「娛樂圈紀委」王思聰,粗來主持一下公道可好!?說起林更新的煩心事,還得從王思聰養的內條狗說起。地球人都知道王思聰為他的「小公舉」愛犬王可可開了微博。王可可和拍過《後會無期》的狗明星小馬達(微博@韓塞的馬達加斯加)的「戀情」就這麼無遮無攔的曝光在了微博上。
  • 關於邵陽縣發票搖獎活動第六期中獎名單的公告
    經邵陽縣發票搖獎活動領導小組批准,在邵陽縣公證處的監督下,邵陽縣發票搖獎活動第六期1500個中獎名單已經產生。
  • 【中獎名單】7月26日轉發贈票中獎名單公布
    7月26日轉發贈票中獎名單公布1,@周珍的朋友小猴子2,@阿蓮的朋友王小跳3,@戲看人生的朋友瑞兒
  • 【16年7月11日】嗨拉拉中獎名單公布及答疑
    Q:為什麼我的助力值已經滿10,名單上卻顯示只能領取1張票?A:名單是隔天更新的,即7月12日公布7月11日的中獎名單,但無法實現實時更新。容易出現一種情況:7月10日某用戶的助力數為5,名單公布時顯示領取票數為1;7月12日該用戶的助力數已達到12,按遊戲規則可領取門票2張。
  • 字母圈的「安檢救星」貓膩包,究竟有什麼貓膩?
    當安檢小姐姐突然向你走來,告訴你,你的包裡有剪刀/電腦/打火機,打開把它拿出來時,想到包裡還有一堆道具,你是不是恨不得在地上挖個洞鑽進去?某著名DJ說唱舞曲中曾說,「還把道具裝在包包裡你就破功了,老弟!」而下面視頻裡這款《貓膩包》堪稱安檢救星,為什麼呢?請看。
  • 發票抽獎,一大波中獎未兌獎名單來了,看看有你沒?
    人生最痛苦的事兒就是「差那麼一點點就中獎」而最最痛苦的事兒莫過於「明明中獎了,自己卻不知道」!要知道領獎時間可是有期限的逾期未兌獎的視為自動放棄兌獎再不來領獎您的寶貝獎品就要「涼涼了」自中獎號碼公布之日起30日內為兌獎時間(兌獎截止日期如遇法定節假日順延),逾期未兌獎的視為自動放棄兌獎。
  • 「長假各種曬 全家相當親」第一批中獎名單出爐!他們這是在幹什麼!?
    看來各位舅粉國慶都沒閒著呀!來看看第一批上榜的都是誰吧~ 茅茅,miss.fish,蛤蟆吐蜜,小四,凌@Kathleen,一顆小白菜,丫頭公主,朱大君,一天盡逼事,沈大小姐 這10位被選中的舅粉,請發送「照片中獎」到舅舅微信,並回復登記個人信息,然後坐等大禮送上門吧。1.關注錢塘老娘舅公眾微信。
  • 南都觀影團 《星際穿越》中獎名單
    微信君語:年度神片的魅力真不是蓋的,本次南都觀影團搶票信息發出後,收到了洶湧的網友報名,大家紛紛給微信君留言求票,互動社區也熱火朝天,微信君鴨力很大~~以下名單很多微信君的老朋友都沒有中獎,先給大家說聲抱歉了!!微信君酌情用《馬達加斯加的企鵝》的兌換碼來補償大家!!再次感謝各位!!
  • 拼圖大賽大潤發中獎名單
    一等獎:小天才電話手錶Y01一塊(1名)二等獎:小天才書包一個(2-6名)三等獎:風箏一個(7-16名)下面是中獎名單:名次姓名電話得票數1樊芷圻159****191941302付澤慶159****222436933李沐芷151
  • 微信活動中獎名單
    中獎名單如下:獎品獎項 微信號車牌號碼一等獎不老的傳說遼B **A35拉杆箱 無痕遼B **977二等獎 東子遼A **06S車載吸塵器你若安好,便是晴天遼B **Z88 棟媽遼P **635三等獎劉江(可樂爸)遼B **M01車載冷暖箱 5+0遼B **573
  • XM2017年終尾牙晚會中獎名單揭曉啦~
    幸運的你有沒有中獎呢?尾牙抽獎名單大揭秘啦!尾牙中獎名單:詳情請參閱附件獎品領獎方式及原則:1、中獎同仁憑個人員工識別卡至指定地點刷卡領取,獎品不得代領;2、若因工出差、產假、工傷無法領取,可有以下三個選擇
  • 【優生奶瓶】試用中獎名單公布
    我們上周的優生奶瓶寬口真母感矽膠護層玻璃手把吸管奶瓶L240ml試用受到了廣大媽媽們的積極參與,所以我們把中獎名額提升到了