Excel騷操作-巧用字符函數實現中英文分割

2021-01-14 PM職道

作為產品經理,時常需要查看數據,來評估產品的表現。對於一些數據設施不完善的公司,可能還需要通過開發同學拉日誌取數的方式把一些業務數據給到產品同學。這時,就需要產品經理自行對數據進行整理。


說到數據整理,一般情況下,我們說的是數據的標準化和匯總,比如拆分,格式整理,匯總整合等等。其中,數據拆分是一種很常見的操作,比如一些業務數據中,可能把多個屬性整合在一個欄位中,然後用分隔符區分開,這樣存儲簡單,使用也方便。


去年,遇到一個問題酒類的品牌數據中英文混合,需要把兩者分離開,做成標準的中文品牌和外文品牌欄位。


數據格式及想要實現的目標結果如下所示:

中外文品牌是我們拿到的原始數據。


對於拆分,日常見的也不少,但是此類數據,卻是頭一次遇到。


以往的數據中,需要拆分的數據之間大多有如「-」或者「|」或者「\」分隔符或者是空格進行連接,那麼直接通過數據分列功能即可實現,非常簡單。對於長度非常規整的,按寬度也可以進行分裂,也是通過數據分列功能即可。

那是不是就沒有辦法了呢?當然也不是。


此處,我們需要先了解兩個Excel中的函數,LEN和LENB。


LEN函數的功能是返回文本串的字符數。Len()可以得到字符串的長度。LENB函數將字符串當作一組字節而不是一組字符,可以返回文本串的字節數。如果需要返回字符總數而非字節總數,可使用LEN函數。


在Unicode編碼中,一個中文漢字是2個字節,英文則是1個字節。


因此,通過上述的LEN和LENB函數,可以計算出中文漢字的個數,只要拿到了個數,那麼便可以通過LEFT和RIGHT函數,取出相應字符串的中文和英文部分。

可以看到,LENB-LEN的值就是中文字符數。很神奇吧,第一次看到的時候,驚呆了!

那麼接下來,我們便可以通過LEFT函數,從左取相應字符數,得到中文品牌名。

同樣,如果需要取外文品牌名稱,我們可以使用RIGHT函數,從右側開始取相應的英文字符數,得到外文品牌名稱。

上述的整個數據整理,涉及LEN函數、LENB函數、LEFT函數、RIGHT函數,通過四個函數便可以實現中文與其他字符的數據分離。


當然以上方式並不是沒有弊端,如果整個值裡邊有數字等被記為一個字符的,可能會有問題,比如3泉3 Spring,此時通過此方式拆分就不準了,這點需要注意。


雖然略有不足,不過已經是個可以進行批處理數據的方法了,剩下的一些特殊數據可以人工再檢查一遍,手動進行修正。


類似這樣的案例,也在提醒我們,面對工作中的一些磨人任務,不要急於處理,冷靜下來,觀察規律,善用搜索工具,一定事半功倍。


相關焦點

  • Excel Substitute函數使用方法,含嵌套一次替換多個不同字符實例
    在 Excel 中,一共有兩個替換字符的函數,一個是Substitute函數,另一個是Replace函數;前者是用新字符替換舊字符,後者是用新字符替換指定字符數。Substitute函數既可以替換源文本中所有指定字符,又可以替換某個指定字符,並且還能嵌套使用以實現一次替換多個不同字符。
  • Excel黑科技,可以用函數實現中英文自動翻譯
    Excel是一個開放度和自由度相當高的辦公軟體,隨著微軟公司對其不斷的更新升級,利用Excel可以實現很多高端需求。在2013版本,微軟公司對Excel新增了50多個函數,其中創造性的加入了三個web函數,讓Excel可以調用網絡上的一些數據。
  • Excel技巧—一個公式實現中英文翻譯
    接著上一章用Excel實現漢字轉拼音,不禁讓小編想到那是否可以用Excel實現中英文翻譯呢?畢竟現在中國發展越來越快,和國際間交流越來越多,可能有些人的領導就是外國人,那這個時候拿著一堆中文的Excel報表給領導看他也看不懂。畢竟英文能力很強的人比較少,大多數人可能還是需要藉助詞典,在線翻譯等,這樣來回折騰是很浪費實際的。
  • pandas向量化字符串操作方法!
    向量化的操作使我們不必擔心數組的長度和維度,只需要關係操作功能,尤為強大的是,除了支持常用的字符串操作方法,還集成了正則表達式的大部分功能,這使得pandas在處理字符串列時,具有非常大的魔力。例如,要計算每個單詞中『a』的個數,下面一行代碼就可以搞定,非常高效。假如用內置的字符串函數進行操作,需要進行遍歷,且Python原生的遍歷操作無法處理缺失值。
  • 職場excel如何用函數進行五星打分?大神一個公式就搞定!
    課程信息卡課程:《Excel天天訓練營》2.0圖文版章節:第2章-精通函數內容:五星打分(int\rept)在excel表格裡面,如果對一些打分的數據用星星字符來展示,老闆肯定看了更喜歡。比如:學生的成績表、員工的滿意度、產品的好評度等等。
  • EXCEL函數公式大全之利用PROPER函數LOWER函數實現英文大小寫轉換
    EXCEL函數公式大全之利用PROPER函數LOWER函數實現英文字母大小寫轉換。EXCEL函數與公式在工作中使用非常的頻繁,會不會使用公式直接決定了我們的工作效率,今天我們來學習一下提高我們工作效率的函數PROPER函數LOWER函數。
  • excel中的替代函數——replace和substitute函數的應用實例
    在excel中,常用的替換函數有replace和substitute函數,這兩個函數都可以替換單元格中的部分內容,功能和ctrl+H的功能類似,但是使用函數的目的一方面不會破壞原數據,另一方面與其他函數結合可以實現更多功能,對於substitute的參數=substitute(單元格,被替換的字符串,新字符串,指定替換第幾個),第四個參數可以省略,表示全部替換。
  • Excel中的單條件計數函數countif
    COUNTIF函數會統計某個區域內符合您指定的單個條件的單元格數量,記得函數返回值是滿足給定條件的單元格的數量。例如,我們可以計算以某個特定字母開頭的所有單元格的數量,或者可以計算包含大於或小於指定數字的所有單元格的數量。
  • excel篩選技巧:不用函數公式也能快速多對多查找
    說到excel中的篩選,想必大家早已是了如指掌,不過增強版的篩選,你聽說過嗎?它可比普通的篩選厲害多了,不僅能實現excel中的一對多查找,就連複雜的多對多查找也不在話下!趕緊來看看吧!或許有些朋友也會想到那個最近很火,據說是可以讓VLOOKUP提前退休的XLOOKUP函數實現一對多查找。其實是使用公式還是用其它方式解決問題,也要看應用場景的,比如只是臨時的需要,那就完全不需要使用這麼繁瑣的萬金油公式,也不需要這個像空中樓閣似的XLOOKUP函數出馬(能使用這個函數的Excel少得可憐)。
  • Excel Replace函數與ReplaceB函數的使用方法,含7個替換實例
    以下是 Excel Replace函數與ReplaceB函數的使用方法,總共有7個實例,分別為把單槓替換為雙槓,替換姓名中間一個字,把部分數字替換為星號*,替換某個字後的所有字符,替換一段字符中間指定個字符、替換數字、字母和特殊字符和替換單字節與雙字節,實例操作所用版本均為 Excel 2016。
  • EXCEL函數公式大全之利用SUBSTITUTE函數REPLACE函數刪除特定文本
    在前面的課程中我們學習過了從字符串的任意位置提取字符替換字符,今天我們要學習的是利用SUBSTITUTE函數和REPLACE函數的組合刪除字符串中的指定字符。第一步利用SUBSTITUTE函數將手機號中的字符「-」替換為空白。SUBSTITUTE函數的使用方式為:公式----插入函數----輸入函數名SUBSTITUTE函數----點擊轉到----點擊確定。
  • CHAR函數:電腦中所使用的一切字符,我都可以輕鬆生成,關注我
    今天函數哥將像大家分享一個較為奇葩的函數-CHAR函數。CHAR函數運用不是很普遍,在一些特殊的環境下可能才會用到,比如SQl資料庫建設,以及其他編程方面。CHAR函數的核心功能是將數字轉化為電腦中所包含的字符。
  • excel函數技巧:如何用三角函數製作環形氣泡圖
    【前言】在EXCEL眾多函數中,除了「臭遍大街」的常規函數外,其實它還有很多「專業函數」的分類。例如「財務函數」、「數學函數」、「分析函數」等等。學習更多技巧,請收藏部落窩教育excel圖文教程。上圖就是一個轉化的公式,=TEXT(A2/24,"[h]°m's」"),但是我們一定要知道為什麼用時間表達式也可以表達度數,這個原理對我們以後對於三角函數的應用或者拓展將大有用途!通過上圖我們可以看出,時間單位的換算和角度單位換算的進位是一樣的,所以我們這裡可以利用TEXT函數來進行操作。
  • EXCEL函數公式大全之利用FIND函數MID函數提取字符串中間指定文本
    在前面的課程中我們學過了,從字符串最前端提取字符串,也學習過從字符串末尾提取字符。今天我們要學習的是利用MID函數,從字符串中間位置提取指定長度的文本。第一步利用FIND函數判斷字符「部」和「-」所處的字符位置。FIND函數的使用方式為:公式----插入函數----輸入函數名FIND函數----點擊轉到----點擊確定。
  • 22個常用Excel函數大全,直接套用,提升工作效率!
    05.IF的多條件判斷公式:C2=IF(AND(A2<500,B2="未到期"),"補款","")說明:兩個條件同時成立用AND,任一個成立用OR函數。六、字符串處理公式23.多單元格字符合併公式:c2=PHONETIC(A2:A7)說明:Phonetic函數只能對字符型內容合併,數字不可以。
  • pandas數據處理:常用卻不甚了解的函數,pd.read_excel()
    人們經常用pandas處理表格型數據,時常需要讀入excel表格數據,很多人一般都是直接這麼用:pd.read_excel(「文件路徑文件名」),再多一點的設置可能是轉義一下路徑中的斜槓,一旦原始的excel表不是很規整,這樣簡單讀入勢必報錯!
  • excel函數應用技巧:如何按不同要求,改變數字格式
    【ANSWER 1】取整到千位,我們可以這樣操作,如下: 【函數解析】數值除以1000,得到43.854,再用INT函數取整得到43,再乘以1000,得到43000。有的時候就是這樣,如果有了思路,不用想太多,直接用已知的函數得到結果就好了。【ANSWER 2】再想,還有什麼方法可以得到這個結果呢?
  • 用excel製作文件管理器,所有版本皆可使用
    Hello,大家好,之前跟大家分享了使用excel中的power query功能製作一個文件管理器,但是很多分析反應自己的excel版本不夠高,無法使用,今天就跟大家分享如何使用宏表函數製作文件管理器,他也是可以實現文件刷新的,這個的操作也不難,下面就讓我們來看下他是如何設置的一、什麼是宏表函數以及FILES函數宏表函數是早期低版本excel的產物
  • excel函數公式大全之利用ROUND函數FLOOR函數實現特定條件的捨入
    excel函數公式大全之利用ROUND函數FLOOR函數實現特定條件的捨入,excel函數與公式在工作中使用非常的頻繁,會不會使用公式直接決定了我們的工作效率,今天我們來學習一下提高我們工作效率的函數ROUND函數FLOOR函數,利用ROUND函數FLOOR函數實現特定條件特定數值的捨入。
  • excel隨機數函數是什麼?excel怎樣生成隨機數?
    本篇將介紹excel隨機數函數是什麼?excel怎樣生成隨機數?有興趣的朋友可以了解一下!一、前言excel是我們工作中很常用的一款表格製作工具,它不僅僅只是用來製作表格,它還能對表格中的數據進行處理(比如:運算、排序、篩選等)。excel為數據的處理提供了很多函數,今天小編要介紹的是excel隨機數函數,以及隨機數函數的用法,希望對大家有所幫助!