R語言空間數據分析學習筆記2——數據基本操作

2021-03-02 GeoSuper

本節將會學習如何利用地理空間數據進行連接、篩選等操作,首先我們加載軟體環境和數據。

sf:(simple features, standard way to encode spatial vector data

tidyverse:The tidyverse package is designed to make it easy to install and load core packages from the tidyverse in a single command

janitor:janitor has simple functions for examining and cleaning dirty data

tmap/tmaptools:tmap is an actively maintained open-source R-library for drawing thematic maps

library(pacman)p_load(sf,tidyverse,janitor,tmap,tmaptools)tmap_mode("plot")#this will take a few minutesEW <- st_read("https://opendata.arcgis.com/datasets/8edafbe3276d4b56aec60991cbddda50_2.geojson")LondonData<-read_csv("https://files.datapress.com/london/dataset/ward-profiles-and-atlas/2015-09-24T14:21:24/ward-profiles-excel-version.csv",locale = locale(encoding = "latin1"),na = "n/a")

LondonData數據清洗之前

LondonData數據清洗之後,即使用janitor的clean_names函數對列名稱做了一定的清洗,裡面的空格將會變成下劃線,而且大寫字母會轉化為小寫字母。

篩選lad15cd中以「E09」開頭的條目

#篩選lad15cd中以「E09」開頭的條目LondonMap<-EW%>%filter(str_detect(lad15cd,"^E09"))LondonMap

可視化LondonMap

qtm()qtm(LondonMap,fill = "lad15nm")

不過這裡,我們沒有對EW表格中的列名稱進行清洗。下面,我們要把地理信息表EW和信息表LondonData合併,採用連接的方法,整個表連結步驟如下:

BoroughDataMap<-EW %>%  clean_names()%>%  filter(str_detect(lad15cd,"^E09"))%>%  merge(.,        LondonData,        by.x="lad15cd",        by.y="new_code",        no.dups=TRUE)%>% #內連接  distinct(.,lad15cd,           .keep_all = TRUE) #去除重複條目qtm(BoroughDataMap,fill = "rate_of_job_seekers_allowance_jsa_claimants_2015")


相關焦點

  • 零基礎學習R語言數據分析
    這裡推薦一個網站,code school的Try R 課程,非常基礎,從最基本的語句的賦值到最後的數據框的基本操作,手把手一步一步的教你,然後對你輸入的語句,網頁會給出判斷,如果寫錯了,還有很詳細的解釋。網頁全部是英文的,英語過了四級的童鞋應該可以應付了。R的入門書籍,比較好的是Learning R , 中文名是《學習 R》。
  • R語言 | 數據操作dplyr包
    [更新~] Python網絡爬蟲與文本數據分析公眾號只帶著Python字眼,卻分享著R語言,不務正業,任性了~dplyr簡介dplyr是R語言的數據分析包,很像python中的pandas,能對dataframe
  • R語言爬蟲手機app數據小筆記
    以前玩的爬蟲都是爬PC端網頁上的數據,比如以前的推文《網絡爬蟲+文本分析之解讀歷屆我們黨的全國代表大會報告》,《R語言網絡爬蟲+圖片分析之CNS
  • 零基礎數據分析——R語言入門
    作為在國內接觸較少的程式語言,從0開始的學習過程也讓許多留學生茫然無措。希望我自身的經歷分析,能給正在學習和準備學習數據分析或者R語言的同學們,提供一些值得借鑑的信息。萬事開頭難。就算是簡單的寫作業,許多人也會在翻開練習冊與落筆中間苦苦掙扎。我對於R語言的認知,就像是剛學了二元一次方程去看微積分,除了下載R和RStudio完全無從下手。
  • 知識分享 | R語言——大數據分析的一把利劍
    >一、專注於一種語言在說明為什麼你應該學習R語言之前,我想強調的是,在開始學習數據科學時,你應該學習一種語言。有些人問我是否應該學習在學R語言的同時學習Python。我的答案基本上是否定的,除非你需要使用一種以上的語言,否則你應該選擇一種語言進行學習。專注於一種程式語言的原因是,你需要更多地關注過程和技術,而不是語法。你需要掌握如何通過數據科學工具來分析數據,以及如何解決問題。事實證明,R語言是最佳的選擇。
  • 數據分析學習入門寶典 狗熊會《R語言:從數據思維到數據實戰》
    近日,數據產業高端智庫,狗熊會推出又一教材力作——《R語言:從數據思維到數據實戰》。這本書可以作為高等院校數據科學相關專業教學的通用教材,也是新手學習的入門寶典。全書採用實例講解,新穎有趣,深入淺出,把R語言簡單靈活、包羅萬象的特點體現得淋漓盡致。無論讀者數據分析基礎如何,都能通過這本書快速上手,提升實戰能力。
  • 使用R語言劍指商業數據分析
    而國內如經管之家論壇-五區 【R語言論壇】等都是優秀的R語言社區。如何系統學習和進階R語言數據分析?CDA數據分析集訓班R語言方向開課歡迎參加!數據是資訊時代的「新能源」。 02章Mysql資料庫基礎01-01Mysql資料庫知識介紹01-02Mysql資料庫的基本操作01-03Mysql數據表的基本操作01-04數據類型和約束條件01-05數據的CRUD操作之增加、刪除、修改數據表01-06SQL
  • 數據科學養成記 之 R語言基礎(2)——關於R包
    在上一節的學習中,我們已經學習了如何將數據導入R中進行數據分析。R作為一種主力的分析語言有著其獨特的優勢:大量的R包可供大家使用,提供方便快捷的數據分析,挖掘。目前有上千個R包(R package)可供大家使用,可從cran-r 下載。
  • 【R學習筆記】- 數據整形 - dplyr and tidyr
    今天這兩個包是同一個人寫的,他還開發ggplot2包,前面用來導入spass數據的haven包也是他的作品。今天沒有看說明書,就是簡單試用兩個包的幾個函數,如下:,類似標準函數ordersummarise() 對數據進行匯總操作,可結合group_by使用,類似標註函數aggregatejoin(),set(),distinct(),sample(),bind(),ifelse()參考資料數據整合神器之tidyr包 數據整合神器之dplyr包 Data Wrangling with dplyr
  • 零基礎入門R語言數據分析指南
    這裡推薦一個網站,code school的Try R 課程,非常基礎,從最基本的語句的賦值到最後的數據框的基本操作,手把手一步一步的教你,然後對你輸入的語句,網頁會給出判斷,如果寫錯了,還有很詳細的解釋。網頁全部是英文的,英語過了四級的童鞋應該可以應付了。R的入門書籍,比較好的是Learning R , 中文名是《學習 R》。
  • 一套數據分析視頻教程與R語言全套資料免費下載
    - 通過練習來學習。 包括代碼練習題、參加kaggle比賽、解決實際工作中的難題。 - 通過分享來學習。 包括自己寫筆記、寫博客、寫書、翻譯書,和同伴分享交流、培訓新人。# 全套R語音書籍下載。關注公眾號後,回覆:R語言
  • 【免費直播課程】R-GIS:R語言地統計與空間製圖實踐技術 應用
    R語言在數據分析、挖掘和可視化中發揮著重要的作用,其中在空間分析方面扮演著重要角色,與空間相關的包的數量也達到130多個。1. sp: 處理地理數據的基礎包2. sf:  dataframe數據框風格的地理數據包3. rgdal: 封裝 GDAL (一個開源地理數據抽象庫,提供非常豐富的地理數據讀寫驅動))4. rgeos: 封裝 GEOS 一個開源幾何引擎, 提供幾何模型、幾何關係判斷、基本幾何計算操作等功能5. proj4:PROJ4 一個開源地圖投影庫,提供豐富的地圖投影轉換算法
  • R語言從入門到精通:Day5-R語言數據操作示例及數據
    經過前面幾次推文的學習,相信大家對R語言已經有了一個大概的了解,同時也初步感受了R語言在數據處理領域的強大功能,不過實話實說,前面的內容還只是R
  • R語言的數據管理
    這部分內容為我學習《R語言實戰》中數據管理的部分所做的筆記。
  • R語言數據實戰 | 數據讀入
    比如狗熊會微信公眾號上的「菜鳥專欄」中,曾推出過一期網絡小說排行榜分析[ 進入狗熊會微信公眾號,輸入關鍵詞「網絡小說」,閱讀分析],它所使用的數據就包含大量已經結構化過的文本數據。這時,只需按照2.2.1中介紹的讀入csv等標準式數據的方法讀入,即可進行後續的分析。需要注意的是,如果包含中文文本,往往需要關注文件的編碼問題,如下所示:
  • R語言-初識與數據結構
    S語言:1976年貝爾實驗室發展起來的數據交互分析系統;是一種高級程序語言,很好地統計應用快速開發系統。不但包括對象而且包含了對象的系統環境;當一次使用完畢要關閉R時,R會詢問是否保存工作空間軟體包 (Package): : 執行一定功能的函數、數據等的集合,一些內置於R系統內,大部分外置於網絡。4,R語言的工作方式命令行輸入按回車鍵執行。
  • R語言學習路線和常用數據挖掘包
    那麼,眾多書籍中,一個生手應該從哪一本著手呢?入門之後如何才能把自己練就成某個方面的高手呢?相信這是很多人心中的疑問。有這種疑問的人有福了,因為筆者將根據自己的經歷總結一下R語言書籍的學習路線圖以使Ruser少走些彎路。本文分為6個部分,分別介紹初級入門,高級入門,繪圖與可視化,計量經濟學,時間序列分析,金融等。
  • Tidy時代R語言學習的一些ABC
    主要就是寫一些和數據分析(或者用時髦的說法,數據科學)相關的內容。我是一個普通的數據工作者,統計學專業出身,在大學裡教過書,也做過一些實際數據工作。數據科學於我而言,可以算工作也可以算一種愛好。這個號用到的主要數據工具是R語言。原因很簡單,我用R用了11年,順手。
  • R語言學習筆記之——數據處理神器data.table
    數據處理在數據分析流程中的地位相信大家都有目共睹,也是每一個數據從業者面臨的最為繁重的工作任務。
  • 為什麼做數據分析首選R語言?
    R 是一種免費的、開源的語言和操作環境,其初衷是為了統計計算和畫圖,但是 R語言現在能夠做的事情已經遠遠地超出了其初衷,可以在諸多領域進行應用,比如,數據挖掘、機器學習、社交網絡、生物信息、金融數據分析等。同時,R 提供了成千上萬的專業模塊和實用工具,是從大數據中獲取有用信息的絕佳工具。許多研究院,公司和大學已經使用 R。