我用微博籤到數據,給長三角城市重新排了個名

2020-12-19 DT財經

文/數據俠 徐凱恆

這位數據俠,用宏觀數據結合微博籤到數據進行聚類分析的方式,重新劃分了長三角的城市等級。

本文轉自公眾號數讀城事(ID:CityDAst)

好久沒有做新數據應用的文章了,雖說是新的網絡數據,微博籤到數據應該也不算是什麼新的數據了,早有各路大神用的飛起了,我在這裡也就拙劣的試一下手。

總的來說,技術路線就是通過微博籤到數據中 「籤到次數」與「籤到圖片數量」的總量表徵城市的網絡活力,通過網絡活力、人均GDP、人口密度等值進行聚類分析,從而得出城市群內城市等級梯度的劃分。

今天的主題是城市群,具體來說是長三角城市群,除了利用新浪微博的籤到數據外,主要參考的文件為2016年發改委印發的《長江三角洲城市群發展規劃》。

長江三角洲城市群(以下簡稱長三角城市群)是我國經濟最具活力、開放程度最高、創新能力最強、吸納外來人口最多的區域之一,是「一帶一路」與長江經濟帶的重要交匯地帶,在國家現代化建設大局和全方位開放格局中具有舉足輕重的戰略地位。

長三角城市群在上海市、江蘇省、浙江省、安徽省範圍內,由以上海為核心、聯繫緊密的多個城市組成,主要分布於國家「兩橫三縱」城市化格局的優化開發和重點開發區域。

範圍包括:上海市,江蘇省的南京、無錫、常州、蘇州、南通、鹽城、揚州、鎮江、泰州,浙江省的杭州、寧波、嘉興、湖州、紹興、金華、舟山、台州,安徽省的合肥、蕪湖、馬鞍山、銅陵、安慶、滁州、池州、宣城等26市,國土面積21.17萬平方公裡,2014年地區生產總值12.67萬億元,總人口1.5億人,分別約佔全國的2.2%、18.5%、11.0%。

(圖片說明:長三角城市群範圍;圖片來源:《長江三角洲城市群發展規劃》)

微博籤到數據的可視化

獲取了江蘇省、上海市、安徽省和浙江省的微博籤到數據,數據包括籤到點名稱,地址、類型、籤到次數、籤到照片數量等,幾十萬條吧大概,反正就是有點卡想換電腦那種。

(圖片說明:微博籤到數據示例)

將微博籤到數據空間化落在地理空間上,選擇適合的符號系統,呈現出來的效果類似於夜間燈光數據集,或許這張圖也可以叫做「微博籤到點亮長三角」。

在圖裡我們可以看到,數據最為集中的區域主要是長江沿線以及環杭州灣一帶,也可以大概看出長三角城市群內核心區域的大概範圍。

(圖片說明:微博籤到點亮長三角)

通過對微博籤到數據進行核密度分析,以及每個籤到點的籤到次數和籤到照片數量進行計算得到每個籤到點的網絡活力:

網絡活力=籤到次數+1.5*籤到照片數量

每個點的網絡活力作為核密度分析的權重值,計算半徑為1000米。(籤到同時拍照比單純的籤到具有更高的活力,因此乘以了1.5,這裡還有待商榷)

特別注意到的是,上海——蘇錫常都市圈的關係尤為緊密,上海——蘇州——無錫——常州呈現出綿延連片的趨勢,特別是縣級市、小城鎮在其中擔當了相當重要的作用,崑山、常熟、張家港、江陰等地也顯示出了較強的網絡密度。

(圖片說明:上海、蘇州、無錫、常州微博籤到密度)

通過匯總將每個城市的網絡活力的數值進行求和運算,得到每個城市的網絡活力總量。總的來看,結果還是和經驗認知相符的。

(圖片說明:長三角城市群各城市網絡活力總量)

長三角城市群經濟基礎條件

由於時間限制,我僅選取了人口、人口密度、GDP和人均GDP這幾個指標進行分析,資料來源於上海、浙江、安徽和江蘇的2016統計年鑑,人口選擇常住人口,這裡僅進行最簡化的經濟基礎條件的分析。

從各城市的人口總量來看,呈現出沿海、沿江分布的特點,由於各市行政區劃面積存在較大差異,需要比較人口密度的指標。

(圖片說明:長三角城市群各城市常住人口數量)

人口密度分布情況來看,沿海沿江的特點更為明顯,上海作為城市群內的中心城市,人口密度當之無愧位於第一,沿長江經濟帶的城市,特別是長江以南的蘇州無錫等城市人口密度也相對較高。

(圖片說明:長三角城市群各城市人口密度)

生產總值與人均生產總值情況來看,長三角城市群邊緣城市的經濟體量與核心城市存在較大差異。

(圖片說明:長三角城市群各城市地區生產總值)

(圖片說明:長三角城市群各城市人均生產總值)

案例

對於城市群內的城市等級劃分,我選取了K均值聚類算法

K均值聚類算法是先隨機選取K個對象作為初始的聚類中心。然後計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心。聚類中心以及分配給它們的對象就代表一個聚類。一旦全部對象都被分配了,每個聚類的聚類中心會根據聚類中現有的對象被重新計算。這個過程將不斷重複直到滿足某個終止條件。終止條件可以是沒有(或最小數目)對象被重新分配給不同的聚類,沒有(或最小數目)聚類中心再發生變化,誤差平方和局部最小。(以上內容來源於百度百科)

下圖展示了對n個樣本點進行K-means聚類的效果,這裡k取2

用於聚類分析的變量,也就是要選取的指標,我簡單選擇了人口、人口密度、生產總值、人均生產總值、網絡活力(籤到次數+1.5*籤到照片數量)。

通過計算,將26個城市分成了4個等級。

(圖片說明:城市等級分布)

這次的微博數據的小小實驗就到這裡。

想瀏覽更多數據俠文章?快關注DT數據俠吧~各路大牛帶你玩轉大數據!

數據俠門派

本文數據俠徐凱恆,現就職於發展改革委城市和小城鎮改革發展中心綜合交通院,主要從事交通-產業-空間三要素協調規劃,除了長得帥,媳婦也特別漂亮。 數讀城事(CityDAst)這個公眾號就是他和媳婦兩個人在學生時代的時候一點點運營起來的,主要是想分享經驗與結交朋友,雖然規模不大,但是做得很用心。

加入數據俠

「數據俠計劃」由第一財經數據新媒體DT財經發起的數據人社群平臺,旗下有數據俠專欄、數據大咖及愛好者社群、線上線下「數據俠實驗室」系列活動等項目。

相關焦點

  • 【數據獲取利器】微博POI獲取工具,城市數據派會員專享哦
    城市大數據實操攻略】12月11日北京開營,火熱報名中!面向城市研究和規劃工作者的個性化定製課程,從大數據基礎、網際網路大數據、軌跡大數據、大數據可視化、Python、機器學習、到 R,城市數據師需要具備的一切技能都在此!(點擊看詳情)【派姐說說】親愛的城市數據派會員們,2016年11月的會員福利之新技術教學終於來啦!
  • 長三角哪個城市買房好?寧波或許是個不錯選擇
    作為長三角的門戶城市,同時坐擁全球港口貨物吞吐量連續11年排名第一的港口城市跟計劃單列市,還同屬於副省級城市,寧波2019年的GDP更是高居全國第12名,可以說寧波有著太多的優勢!作為一個沿海城市,寧波同時擁有空鐵海三大先天優勢,港口已經是全球貨物吞吐量第一大港,航線遍布全球的內個角落!航空方面,目前有寧波櫟社國際機場,年客運量已經達到1400萬,去年投入運營的T2航站樓更是如虎添翼,為打造長三角的航空樞紐再添新勢力!下面是寧波西綜合樞紐工程。
  • 西北「最富」的3個城市,西安僅排第二,第一名人均GDP直逼鄭州
    我國是一座地域廣闊的國家,內部城市的發展各不相同,有的城市依據自身的資源優勢發展自身的經濟,有的城市則在國家政策的扶持下壯大自己,我國為了進一步的統籌和規劃,將國內城市劃分成8個區域,其中發展較好的分布在了東南沿海之地,而西北相對來說發展比較滯後,但隨著西部大開發政策的實施,這個地區也逐漸為人們所熟知,小編今日說的就是西北內部最富的三座城市,其中西安只能排到第二
  • 無錫長三角「C位覺醒」:錨定區域中心,重新定義太湖
    一體化重塑長三角。就比如,過往只是滬寧線上重要節點城市的無錫,成為區域樞紐城市的夢想,正在愈發清晰。澎湃新聞(www.thepaper.cn)注意到,半年來,東向上海,南下杭州,無錫用一次次外出推介、合作洽談,不斷編織著這一夢想。
  • 網傳中國十大城市生育成本排行榜 北京排第一位
    > 第9頁:第十名:長春[提要] 最近,一個名為「中國十大城市生育成本排行榜」的微博在網上熱傳。排行榜上,排在第一位的是北京,生育成本是276萬元;其次是上海,生育成本是247萬元;第三位的是深圳,生育成本是216.1萬元;第四是廣州,成本是201.4萬元;第五位是杭州,成本是183.2萬元…[我來說兩句]   在西安養育一個孩子要花費多少錢呢?最近,一個名為「中國十大城市生育成本排行榜」的微博在網上熱傳。
  • 58同城發布四季度人才流動數據:一線城市求職熱度高 長三角求職旺盛
    近日,58同城發布2020年第四季度人才流動大數據,數據顯示,新一線城市招聘需求高,一線城市求職活躍度排名靠前。同時,普工/技工類崗位供求兩旺,長三角城市群求職相對活躍。 據58同城招聘研究院數據顯示,2020年第四季度,全國招聘需求同比上升超過60%。
  • 數夢工場在滬倡議構建以數據要素驅動的長三角數字經濟生態共同體
    數夢工場作為入選樣本企業參會,並倡議構建以數據要素驅動的長三角數字經濟生態共同體,推動長三角一體化發展。因疫情原因,本次大會採取線上線下聯動的形式。100多名來自長三角地區10多個城市的專家學者以及優秀的企業負責人共聚一堂,分享創新實踐和智慧,共享創新成果和經營哲學的變革之道。
  • 高校教師解析「刷臉」籤到:掌握班級大數據
    近日,有關大學校園再現「刷臉」籤到的新聞,再次引起社會各界的關注。個別網民質疑,兩年前就火過一陣的「刷臉」籤到,如今再次出現,難道大學課堂已到了必上「枷鎖」的地步?  網民「顏其」認為,上課籤到,目的無非就是保證出勤率,讓學生都能來上課。但「刷臉」籤到的技術應用,看起來帶有強制性,治標不治本。
  • 蔡徐坤微博轉發1億?數據脫水有多難?
    很明顯,有需求才會有市場,比如:越來越多不同維度的比拼榜單;要求粉絲通過連續登陸、籤到和轉發等操作,進行打榜;用開屏、banner等位置的推廣位,引導粉絲爭相轉發;一些品牌為了刺激粉絲消費,開設銷量榜單;轉發到一定數據,品牌才會開啟明星福利彩蛋……「某某女孩絕不認輸」,在這樣的心理驅動下,粉絲瘋狂轉發微博,為偶像肝數據。
  • 數一數二丨長三角一體化紅利最大的城市 原來是它
    長三角高質量一體化發展有了定量評價指標。12月12日,浙江大學長三角一體化發展研究中心對外發布「長三角高質量一體化發展指數」。該指數定量、動態刻畫區域一體化發展程度,具有科學決策價值。從城市橫向評比來看,長三角核心區域27個城市可依據分數高低劃分為3個梯隊。
  • 請重新認識我!
    它可是2019年上半年, 在長三角城市群26個城市中, 增速最快的城市...增速達到9.4%! 讓它先來段自我介紹吧!
  • 長三角青年藝術展開幕,高校以藝術介入城市文化
    這是高校主導舉辦的以長三角地域為主的大型青年藝術展覽,涵蓋油畫、水墨、漆畫、雕塑、影像、裝置等多種藝術樣式。展覽旨在推介滬上及長三角地區具有創新意識和國際視野的青年藝術家,推進與長三角地區的藝術交流。策展人王遠表示,「展覽試圖讓高校在城市發展中發揮作用,大學不應該只是象牙塔,而應該介入社會。」
  • 長三角城市經濟圈一呼百應,中部地區為何不攜手共創城市經濟圈呢
    其實不是中部地區攜手建立城市經濟圈,而是心靈餘力不足,實力暫時欠缺,讓我們具體分析一下,中國現在總共是18個經濟圈,最有名,另外,最成熟的有三個,分別是長三角、珠三角和京津冀。長三角經濟圈可以說是中國數量最大、最發達的城市經濟圈,是唯一的世界級成熟群,排在全國第6位,可以說很厲害,城市經濟圈面積大,面積達到21.27萬平方公裡,佔全國2.2%,但經濟發展相對均衡,江浙滬三個城市,都是江南重鎮,人口1.51億,佔全國人口的11%,經濟總量13.2 % 城市化進程迅速均衡,程度高,經濟發展水平高,而且總是充滿活力,走在時代的最前線,當然能像今天這樣發展的主要原因是
  • 上海攜手長三角G60城市開啟產業數位化新局面
    同時,上海松江區政府、騰訊科恩實驗室、上海瓏睿信息科技有限公司還在會上共同籤署了合作協議,將以科恩實驗室為載體,整合騰訊全線安全產品,立足松江智慧城市項目,定製化、全維度提供全棧安全解決方案,進一步提升工業網際網路安全防護能力,助力松江區打造長三角G60科創走廊網絡信息安全示範區。
  • 華東師大|長三角一體化③多中心城市空間體系是不二之選
    多個規模較小城市的集聚經濟效應能否比得上單一較大規模城市的集聚效益呢?實際上,多中心不是簡單的低密度分散,而是分散的集中。儘管每個空間單元的集聚效益可能不及一個更大規模的空間實體,但多中心結構下的空間單元由於地理臨近,仍然可以憑藉美國城市經濟學家Alonso在上個世紀七十年代提出的「規模互借(borrowed size)」,在更大地理空間範圍內實現經濟的規模收益和集聚效應。
  • 長三角議事廳|長三角城市港口群協同發展的現狀與瓶頸
    隨著全球化和區域一體化不斷深化,全球主要城市群戰略地位不斷提升,港口群與城市群互動更加頻繁,並逐步融合成一個有機整體。長三角一體化,也包括港口群一體化,應是當前推進長三角一體化發展的主要著力點。目前,長三角港口正由城市港口、省市港口向港口群發展轉變。
  • 長三角城市文化館「當家人」齊聚浦東
    近日,長三角城市文化館聯盟二次常務理事(擴大)會議在浦東新區舉行。此次聯盟理事會期間,召開了以「長三角一體化:公共文化服務的創新服務」為主題的長三角城市文化館論壇。來自滬蘇浙皖52個城市文化館常務理事和理事單位的80多位代表出席活動,深入探討了長三角一體化的大背景下,公共文化服務如何創新服務適應新形勢,滿足公眾新需求,對接國家長三角一體化發展戰略探索新路徑等話題。圖說:長三角城市文化館聯盟二次常務理事(擴大)會議在浦東新區舉行。
  • 2020長三角城市人才政策重磅解讀!
    人才,是推送城市發展的重要力量人才爭奪戰在長三角各城市積極展開落戶、人才補貼、買房/租房補貼紛至沓來今天我們立足長三角解讀上海、杭州、蘇州、寧波、湖州這五個城市的安居指數一、安居吸引力幾何?對人才安居都非常具有吸引力圖,來自58安居客房產研究院上海社科院、江蘇人才發展戰略研究院以及零點有數集團,聯合發布《長三角青年和人才友好型城市指數研究報告》(上海除外)
  • 百度地圖2020Q3中國城市活力研究報告 以時空大數據展現城市活力
    該報告以中國100個主要城市為研究對象,基於對百度地圖開放平臺海量位置大數據、POI數據、交通出行數據、中國銀聯大數據產品行業智能決策平臺相關數據等挖掘計算所得,客觀反映了城市的出行態勢、夜間消費情況、人口吸引力和產業創新活力。據《報告》數據顯示,2020年第三季度全國總體遷徙規模已恢復至去年同期近七成,主要城市「夜生活」熱度高漲,城市活力較第一、二季度有顯著提升。
  • 長三角核心城市和珠三六市經濟哪個更發達,除深圳加成,旗鼓相當
    我們通過幾個真金白銀數據來觀察下。因為上海是我國大總部城市之一,數據加成較多,放上去可能會失真,所以特意除上海選取6個長三角核心城市。深圳也是我國總部城市之一,像金融、稅收都有一定吸附和加成,但不好剝離,所以大家需要客觀看待以下數據。珠三角六市大家應該都清楚,長三角核心城市我選取蘇錫常寧、杭甬,共六個城市。