零基礎入門Excel數據分析「函數篇」:10個常用的數據清洗類函數

2020-12-15 笨鳥學數據分析

Excel是數據分析師最常用的一種工具,可以搞定絕大多數數據分析工作,對於數據分析初學者來說,最好先從Excel函數開始學習,通過Excel函數感受Excel的強大與神奇。

關於Excel函數,可以分為5大類。

數據清洗類關聯匹配類邏輯運算類計算統計類時間序列類本文將會講解第1類:數據清洗類,在開始講解函數之前,需要先了解以下一些關於Excel的基礎知識。

1、我們可以在 Excel 中進行加、減、乘、除、冪等運算,無需使用任何函數。只需使用基本運算符:+(加)、-(減)、*(乘)、/(除)、^(冪)。

2、Excel是一個二維表格,由行、列組成,行採用數字編號,列採用字母編號。共有一百多萬行和 16,000 多列

3、公式可包含常數、運算符及單元格引用。

注意:所有公式均以等號開頭。

在了解了以上基礎知識後,就可以正式開始Excel函數的學習了。

1、TRIM

功能:去除單元格兩端的空格。

用法:=TRIM(text)。

例如,單元格B2前後有空格(紅色框線所示),通過trim函數作用後,空格被去除了。

說明:TRIM公式並不是去除所有空格,只是去除單元格前後的空格。

2、&符號

功能:字符串拼接

在Excel中,有一個特殊符號很有用,&(讀作and連接符),可以連接字符串及單元格中的內容。

例如,將單元格A1和B1進行連接,直接使用公式:=A1&B1,即可得到結果。

3、CONCAT

功能:連接單元格的內容。

用法:= CONCAT(text1, [text2],…)

例如,通過CONCAT將單元格A1和B1進行連接,如下圖所示。

說明:老版本公式為CONCATENATE。

4、MID

功能:提取字符串中間的字符串

用法:= MID(text, start_num, num_chars)

參數說明:

第1個參數text:提取的目標字符串第2個參數start_num:從第一個字符開始提取第3個參數num_chars:提取幾個字符例如,從身份證號中提取出生年月(圖中標紅的部分),可以通過MID函數實現,提取目標為A2單元格,從第7個字符開始提取,提取個數為8。

5、LEFT

功能:提取字符串左邊的字符串

用法:= LEFT(text, [num_chars])

參數說明:

第1個參數text:要提取的目標字符串第2個參數 [num_chars](可預設):提取幾個字符。說明:用中括號括起來的參數表示該參數可以不寫,即預設。

例如,通過LEFT函數從前面提取出來的年月日中提取年份,從左邊開始,提取4個字符,如下圖所示。

6、RIGHT

功能:提取字符串右邊的字符串

用法:=RIGHT(text,[num_chars])

參數說明:

第1個參數text:要提取的目標字符串第2個參數[num_chars]:提取幾個字符。RIGHT用法與LEFT類似,只是從字符串右邊開B始提取。例如,從年月日中提取月日,如下圖所示。

7、REPLACE

功能:替換字符串中的連續幾個字符或者某個字符

用法:= REPLACE(old_text, start_num, num_chars, new_text)

參數說明:

第1個參數old_text:被替換的原始字符串第2個參數start_num:從第幾個字符開始替換第3個參數num_chars:要替換幾個字符第4個參數new_text:替換後的新字符串例如,用REPLACE函數將手機號的後4位均替換為星號(*),替換的原始字符串為單元格A2,從第8個字符開始替換,替換4個字符,替換為4個星號,如下圖所示。

8、SUBSTITUTE

功能:替換字符串中的連續幾個字符或者某個字符

用法:=SUBSTITUTE(text, old_text, new_text, [instance_num])

參數說明:

第1個參數text:被替換的原始字符串第2個參數old_text:原始字符串中被替換的部分第3個參數new_text:替換後的新字符串第4個參數[instance_num]:從第幾個字符開始替換,可預設。SUBSTITUTE可以實現與REPLACE相同的效果,只是用法有所差異。

例如,用SUBSTITUTE將手機號的後4位均替換為星號,要替換的原始字符串為A2單元格中的手機號,原始字符串中被替換的部分為後4位(通過RIGHT函數獲取,前面已經介紹了RIGHT函數),替換後字符串為4個星號,如下圖所示。

9、求字符串長度:LEN

功能:返回文本字符串中的字符個數。

用法:=LEN(text)

說明:還有另外一個函數LENB,也可以求字符串的長度。

10、求字符串長度:LENB

功能:返回文本字符串中的字符個數。

用法:=LENB(text)

LEN和LENB的區別在於,對於len來說,一個中文字符的長度計算為1,對於lenb來說,一個中文字符的長度計算為2,對於英文字符或者數字則沒有差異。

例如,通過LEN和LENB分別獲取字符串的長度,對於英文、數字沒有差異,對於中文有差異,如下圖所示。

總結:以上是Excel數據分析中常用的10個數據清洗類函數。

相關焦點

  • 零基礎入門Excel數據分析「函數篇」:8個常用的時間序列類函數
    在數據分析中,日期時間類型的數據很常見,所以Excel中有專門的函數用於處理日期時間類型的數據,這些函數被歸為時間序列類。1、yearyear可以提取日期中的年份,例如,給定日期:2019/11/26,要獲取其中的年份,用year函數即可,如下圖所示。
  • 零基礎入門Excel數據分析「函數篇」:5個常用的關聯匹配類函數
    在數據分析中,數據的查找、對比等非常常見,這就需要用到關聯匹配類函數,本文將介紹Excel數據分析中常用的關聯匹配類函數,如vlookup、hlookup、index、match及rank等。1、vlookupvlookup是Excel查找函數家族中最為常用的一個函數,如果你經常和Excel打交道,那麼一定使用過vlookup。功能:用於數據區域的縱向查找。
  • 數據分析必備的43個Excel函數
    很多傳統行業的數據分析師甚至只要掌握Excel和SQL即可。對於初學者,有的時候並不需要急於苦學R語言等專業工具(當然會也是加分項),因為Excel涵蓋的功能足夠多,也有很多統計、分析、可視化的插件。只不過我們平時處理數據的時候很多函數都不知道怎麼用。關於Excel的進階學習,主要分為兩塊:一個是數據分析常用的Excel函數,另一個分享用Excel做一個簡單完整的分析。
  • 數據分析必備的43個Excel函數,史上最全!
    關於Excel的進階學習,主要分為兩塊:一個是數據分析常用的Excel函數,另一個分享用Excel做一個簡單完整的分析。這篇文章主要介紹數據分析常用的43個Excel函數及用途,實戰分析將在下一篇講解。
  • 十周入門 | 數據分析必備的43個Excel函數,超全面!
    關於Excel的進階學習,主要分為兩塊:一個是數據分析常用的Excel函數,另一個分享用Excel做一個簡單完整的分析。這篇文章主要介紹數據分析常用的43個Excel函數及用途,實戰分析將在下一篇講解。
  • 零基礎入門Excel數據分析「函數篇」:邏輯判斷類
    數據分析中經常要使用到條件判斷,條件判斷在Excel中通過if語句來實現,而條件之間的邏輯關係通過邏輯運算符來體現,常見的邏輯關係有與(and)、或(or)、非(not)。1、if功能:if函數主要用於判斷數字或者變量之間的邏輯關係。
  • Excel玩轉數據分析常用的43個函數!
    李啟方 | 作者簡書 | 來源Excel是我們工作中經常使用的一種工具,對於數據分析來說,這也是處理數據最基礎的工具。很多傳統行業的數據分析師甚至只要掌握Excel和SQL即可。對於初學者而言,有時候並不需要急於苦學R語言等專業工具(當然,學會了就是加分項).因為Excel涵蓋的功能足夠多,也有很多統計、分析、可視化的插件等,只不過我們平時處理數據的時候對於許多函數都不知道怎麼用!
  • 整理一套數據分析中常用的Excel函數集合(上)
    Excel是我們工作中經常使用的一種工具,對於數據分析來說,這也是處理數據最基礎的工具。本文對數據分析需要用到的函數做了分類,並且有詳細的例子說明。Excel函數分類:關聯匹配類、清洗處理類、邏輯運算類、計算統計類、時間序列類由於篇幅過長,本篇先分享關聯匹配類和清洗處理類,其餘三個在二條繼續分享。經常性的,需要的數據不在同一個excel表或同一個excel表不同sheet中,數據太多,copy麻煩也不準確,如何整合呢?
  • 數據分析9 - 數據分析常用excel函數筆記整理
    在數據分析中,excel可以方便快速的分析小樣本數據,熟練運用excel函數也很重要。「不會因為會python成為好的數據分析師,而是能用任何工具解決問題」,其實數據分析師重要的是解決問題,發現問題,一起學起來吧
  • Excel有哪些常用的數據描述與分析類函數?
    描述統計是數據分析中常用的方法,它是指通過數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變量之間的關係進行估計和描述的方法。描述統計通常包括集中趨勢分析、離散趨勢分析和相關分析三大部分。使用Excel函數公式或者分析工具可以滿足這樣的分析需求。
  • 『Excel x 數據分析』43個常用函數整理!
    李啟方 | 作者簡書 | 來源Excel是我們工作中經常使用的一種工具,對於數據分析來說,這也是處理數據最基礎的工具。很多傳統行業的數據分析師甚至只要掌握Excel和SQL即可。對於初學者而言,有時候並不需要急於苦學R語言等專業工具(當然,學會了就是加分項).因為Excel涵蓋的功能足夠多,也有很多統計、分析、可視化的插件等,只不過我們平時處理數據的時候對於許多函數都不知道怎麼用!
  • 43個Excel函數,數據分析必備!
    很多傳統行業的數據分析師甚至只要掌握Excel和SQL即可。對於初學者而言,有時候並不需要急於苦學R語言等專業工具(當然,學會了就是加分項),因為Excel涵蓋的功能足夠多,也有很多統計、分析、可視化的插件等,只不過我們平時處理數據的時候對於許多函數都不知道怎麼用!
  • excel圖文教程:深入了解數據分析函數FREQUENCY
    今天要給大家介紹的這個函數,估計很多人都不認識,但卻是高手的必會函數之一。其實這個函數我們在之前的文章中就有提到過,當時它就僅憑一己之力,分別統計出了滿足不同條件區間的數據個數,可謂是相當厲害。但當時我們只簡單講解了這個函數的用法,並沒有去深入了解它,今天我們就一起來好好認識一下FREQUENCY函數吧!
  • excel圖文教程:深入了解數據分析函數FREQUENCY
    今天要給大家介紹的這個函數,估計很多人都不認識,但卻是高手的必會函數之一。其實這個函數我們在之前的文章中就有提到過,當時它就僅憑一己之力,分別統計出了滿足不同條件區間的數據個數,可謂是相當厲害。但當時我們只簡單講解了這個函數的用法,並沒有去深入了解它,今天我們就一起來好好認識一下FREQUENCY函數吧!
  • dplyr | 數據導入和預處理的常用函數
    在正式分析數據前,我們通常需要先預處理一下數據,比如篩選有效樣本,定義變量格式,處理缺失值等,目的是把數據整理成比較清潔的形式,便於後續處理,而R的tidyverse系列工具包針對此提供了豐富多樣的處理方案。本篇內容主要介紹常用的數據導入函數和dplyr包中的一些重要函數。
  • 數據分析入門,EXCEL的這幾個函數你必須知道
    大家整理了,數據分析入門常用的EXCEL在數據分析行業,EXCEL是最基礎的、入門級的,也是最常用,最容易上手的工具了。想要學習數據分析的小夥伴可以選擇先從EXCEL入手,下面小編就給函數,希望對各位小夥伴有所幫助。
  • 字符處理文本查找截取常用的10個excel函數公式,上班族職業必備
    點擊上方藍字  免費關注置頂公眾號或設為星標,否則可能收不到文章
  • 045數據分析小白入門,數據處理常用的Excel函數
    你好,感謝打開才少廚房今天是2020年2月5日星期三,農曆正月十二(庚子鼠年 戊寅月 戊寅日)今天,我想與你分享的是:數據處理常用的5個Excel函數使用階段數據處理一般在發生在數據清理和數據轉換的階段,也就是我在043篇文章中,所說的洗菜和切菜的階段。
  • Python數據分析常用函數及參數詳解,可以留著以備不時之需
    利用Python進行數據分析最核心的庫就是Pandas,可以說,掌握了Pandas庫,Python數據分析就屬於中階水平了。在《一次簡單、完整的Python數據分析,讓我們不再害怕Python!》一文中我們介紹了Python進行數據分析全流程的幾個主要函數。但由於實際中的分析需求可能比較複雜,就要求對數據做更加複雜的處理。
  • 像Excel一樣使用R進行數據分析(3)
    Excel是數據分析中最常用的工具,本篇文章通過R與excel的功能對比介紹如何使用R通過函數式編程完成excel中的數據處理及分析工作。