R語言空間數據分析學習筆記2——數據基本操作

2021-03-02 GeoSuper

本節將會學習如何利用地理空間數據進行連接、篩選等操作，首先我們加載軟體環境和數據。

sf：(simple features, standard way to encode spatial vector data

tidyverse：The tidyverse package is designed to make it easy to install and load core packages from the tidyverse in a single command

janitor：janitor has simple functions for examining and cleaning dirty data

tmap/tmaptools：tmap is an actively maintained open-source R-library for drawing thematic maps

library(pacman)p_load(sf,tidyverse,janitor,tmap,tmaptools)tmap_mode("plot")#this will take a few minutesEW <- st_read("https://opendata.arcgis.com/datasets/8edafbe3276d4b56aec60991cbddda50_2.geojson")LondonData<-read_csv("https://files.datapress.com/london/dataset/ward-profiles-and-atlas/2015-09-24T14:21:24/ward-profiles-excel-version.csv",locale = locale(encoding = "latin1"),na = "n/a")
LondonData數據清洗之前
LondonData數據清洗之後，即使用janitor的clean_names函數對列名稱做了一定的清洗，裡面的空格將會變成下劃線，而且大寫字母會轉化為小寫字母。
篩選lad15cd中以「E09」開頭的條目
#篩選lad15cd中以「E09」開頭的條目LondonMap<-EW%>%filter(str_detect(lad15cd,"^E09"))LondonMap
可視化LondonMap
qtm()qtm(LondonMap,fill = "lad15nm")
不過這裡，我們沒有對EW表格中的列名稱進行清洗。下面，我們要把地理信息表EW和信息表LondonData合併，採用連接的方法，整個表連結步驟如下：
BoroughDataMap<-EW %>%  clean_names()%>%  filter(str_detect(lad15cd,"^E09"))%>%  merge(.,        LondonData,        by.x="lad15cd",        by.y="new_code",        no.dups=TRUE)%>% #內連接  distinct(.,lad15cd,           .keep_all = TRUE) #去除重複條目qtm(BoroughDataMap,fill = "rate_of_job_seekers_allowance_jsa_claimants_2015")

相關焦點

零基礎學習R語言數據分析

這裡推薦一個網站，code school的Try R 課程，非常基礎，從最基本的語句的賦值到最後的數據框的基本操作，手把手一步一步的教你，然後對你輸入的語句，網頁會給出判斷，如果寫錯了，還有很詳細的解釋。網頁全部是英文的，英語過了四級的童鞋應該可以應付了。R的入門書籍，比較好的是Learning R , 中文名是《學習 R》。
R語言 | 數據操作dplyr包

[更新~] Python網絡爬蟲與文本數據分析公眾號只帶著Python字眼，卻分享著R語言，不務正業，任性了~dplyr簡介dplyr是R語言的數據分析包，很像python中的pandas，能對dataframe
R語言爬蟲手機app數據小筆記

以前玩的爬蟲都是爬PC端網頁上的數據，比如以前的推文《網絡爬蟲+文本分析之解讀歷屆我們黨的全國代表大會報告》，《R語言網絡爬蟲+圖片分析之CNS
零基礎數據分析——R語言入門

作為在國內接觸較少的程式語言，從0開始的學習過程也讓許多留學生茫然無措。希望我自身的經歷分析，能給正在學習和準備學習數據分析或者R語言的同學們，提供一些值得借鑑的信息。萬事開頭難。就算是簡單的寫作業，許多人也會在翻開練習冊與落筆中間苦苦掙扎。我對於R語言的認知，就像是剛學了二元一次方程去看微積分，除了下載R和RStudio完全無從下手。
知識分享 | R語言——大數據分析的一把利劍

>一、專注於一種語言在說明為什麼你應該學習R語言之前，我想強調的是，在開始學習數據科學時，你應該學習一種語言。有些人問我是否應該學習在學R語言的同時學習Python。我的答案基本上是否定的，除非你需要使用一種以上的語言，否則你應該選擇一種語言進行學習。專注於一種程式語言的原因是，你需要更多地關注過程和技術，而不是語法。你需要掌握如何通過數據科學工具來分析數據，以及如何解決問題。事實證明，R語言是最佳的選擇。
數據分析學習入門寶典狗熊會《R語言:從數據思維到數據實戰》

近日,數據產業高端智庫,狗熊會推出又一教材力作——《R語言:從數據思維到數據實戰》。這本書可以作為高等院校數據科學相關專業教學的通用教材,也是新手學習的入門寶典。全書採用實例講解,新穎有趣,深入淺出,把R語言簡單靈活、包羅萬象的特點體現得淋漓盡致。無論讀者數據分析基礎如何,都能通過這本書快速上手,提升實戰能力。
使用R語言劍指商業數據分析

而國內如經管之家論壇-五區【R語言論壇】等都是優秀的R語言社區。如何系統學習和進階R語言數據分析？CDA數據分析集訓班R語言方向開課歡迎參加！數據是資訊時代的「新能源」。 02章Mysql資料庫基礎01-01Mysql資料庫知識介紹01-02Mysql資料庫的基本操作01-03Mysql數據表的基本操作01-04數據類型和約束條件01-05數據的CRUD操作之增加、刪除、修改數據表01-06SQL
數據科學養成記之 R語言基礎(2)——關於R包

在上一節的學習中，我們已經學習了如何將數據導入R中進行數據分析。R作為一種主力的分析語言有著其獨特的優勢：大量的R包可供大家使用，提供方便快捷的數據分析，挖掘。目前有上千個R包（R package）可供大家使用，可從cran-r 下載。
【R學習筆記】- 數據整形 - dplyr and tidyr

今天這兩個包是同一個人寫的，他還開發ggplot2包，前面用來導入spass數據的haven包也是他的作品。今天沒有看說明書，就是簡單試用兩個包的幾個函數，如下：，類似標準函數ordersummarise() 對數據進行匯總操作,可結合group_by使用,類似標註函數aggregatejoin()，set()，distinct()，sample()，bind()，ifelse()參考資料數據整合神器之tidyr包數據整合神器之dplyr包 Data Wrangling with dplyr
零基礎入門R語言數據分析指南

這裡推薦一個網站，code school的Try R 課程，非常基礎，從最基本的語句的賦值到最後的數據框的基本操作，手把手一步一步的教你，然後對你輸入的語句，網頁會給出判斷，如果寫錯了，還有很詳細的解釋。網頁全部是英文的，英語過了四級的童鞋應該可以應付了。R的入門書籍，比較好的是Learning R , 中文名是《學習 R》。
一套數據分析視頻教程與R語言全套資料免費下載

- 通過練習來學習。包括代碼練習題、參加kaggle比賽、解決實際工作中的難題。 - 通過分享來學習。包括自己寫筆記、寫博客、寫書、翻譯書，和同伴分享交流、培訓新人。# 全套R語音書籍下載。關注公眾號後，回覆：R語言
【免費直播課程】R-GIS:R語言地統計與空間製圖實踐技術應用

R語言在數據分析、挖掘和可視化中發揮著重要的作用，其中在空間分析方面扮演著重要角色，與空間相關的包的數量也達到130多個。1. sp: 處理地理數據的基礎包2. sf: dataframe數據框風格的地理數據包3. rgdal: 封裝 GDAL (一個開源地理數據抽象庫，提供非常豐富的地理數據讀寫驅動))4. rgeos: 封裝 GEOS 一個開源幾何引擎，提供幾何模型、幾何關係判斷、基本幾何計算操作等功能5. proj4:PROJ4 一個開源地圖投影庫，提供豐富的地圖投影轉換算法
R語言從入門到精通:Day5-R語言數據操作示例及數據

經過前面幾次推文的學習，相信大家對R語言已經有了一個大概的了解，同時也初步感受了R語言在數據處理領域的強大功能，不過實話實說，前面的內容還只是R
R語言的數據管理

這部分內容為我學習《R語言實戰》中數據管理的部分所做的筆記。
R語言數據實戰 | 數據讀入

比如狗熊會微信公眾號上的「菜鳥專欄」中，曾推出過一期網絡小說排行榜分析[ 進入狗熊會微信公眾號，輸入關鍵詞「網絡小說」，閱讀分析]，它所使用的數據就包含大量已經結構化過的文本數據。這時，只需按照2.2.1中介紹的讀入csv等標準式數據的方法讀入，即可進行後續的分析。需要注意的是，如果包含中文文本，往往需要關注文件的編碼問題，如下所示：
R語言-初識與數據結構

S語言：1976年貝爾實驗室發展起來的數據交互分析系統；是一種高級程序語言，很好地統計應用快速開發系統。不但包括對象而且包含了對象的系統環境；當一次使用完畢要關閉R時，R會詢問是否保存工作空間軟體包 (Package): : 執行一定功能的函數、數據等的集合，一些內置於R系統內，大部分外置於網絡。4，R語言的工作方式命令行輸入按回車鍵執行。
R語言學習路線和常用數據挖掘包

那麼，眾多書籍中，一個生手應該從哪一本著手呢？入門之後如何才能把自己練就成某個方面的高手呢？相信這是很多人心中的疑問。有這種疑問的人有福了，因為筆者將根據自己的經歷總結一下R語言書籍的學習路線圖以使Ruser少走些彎路。本文分為6個部分，分別介紹初級入門，高級入門，繪圖與可視化，計量經濟學，時間序列分析，金融等。
Tidy時代R語言學習的一些ABC

主要就是寫一些和數據分析（或者用時髦的說法，數據科學）相關的內容。我是一個普通的數據工作者，統計學專業出身，在大學裡教過書，也做過一些實際數據工作。數據科學於我而言，可以算工作也可以算一種愛好。這個號用到的主要數據工具是R語言。原因很簡單，我用R用了11年，順手。
R語言學習筆記之——數據處理神器data.table

數據處理在數據分析流程中的地位相信大家都有目共睹，也是每一個數據從業者面臨的最為繁重的工作任務。
為什麼做數據分析首選R語言?

R 是一種免費的、開源的語言和操作環境，其初衷是為了統計計算和畫圖，但是 R語言現在能夠做的事情已經遠遠地超出了其初衷，可以在諸多領域進行應用，比如，數據挖掘、機器學習、社交網絡、生物信息、金融數據分析等。同時，R 提供了成千上萬的專業模塊和實用工具，是從大數據中獲取有用信息的絕佳工具。許多研究院，公司和大學已經使用 R。

R語言空間數據分析學習筆記2——數據基本操作

相關焦點

零基礎學習R語言數據分析

R語言 | 數據操作dplyr包

R語言爬蟲手機app數據小筆記

零基礎數據分析——R語言入門

知識分享 | R語言——大數據分析的一把利劍

數據分析學習入門寶典 狗熊會《R語言:從數據思維到數據實戰》

使用R語言劍指商業數據分析

數據科學養成記 之 R語言基礎(2)——關於R包

【R學習筆記】- 數據整形 - dplyr and tidyr

零基礎入門R語言數據分析指南

一套數據分析視頻教程與R語言全套資料免費下載

【免費直播課程】R-GIS:R語言地統計與空間製圖實踐技術 應用

R語言從入門到精通:Day5-R語言數據操作示例及數據

R語言的數據管理

R語言數據實戰 | 數據讀入

R語言-初識與數據結構

R語言學習路線和常用數據挖掘包

Tidy時代R語言學習的一些ABC

R語言學習筆記之——數據處理神器data.table

為什麼做數據分析首選R語言?

數據分析學習入門寶典狗熊會《R語言:從數據思維到數據實戰》

數據科學養成記之 R語言基礎(2)——關於R包

【免費直播課程】R-GIS:R語言地統計與空間製圖實踐技術應用