Excel的長處在於處理規範化的數據,不過我們在工作中接觸到的數據往往是不規範的,比如下面這個例子,我從京東商城的某個店鋪抓取了一些SKU和SPU的數據,這些數據以逗號、冒號和括號間隔,全部集中在了第一列,現在我們的需求是把其中的SKU提取到單獨的一列中,如何實現那?使用分列功能。
首先選中A列,再點擊數據選項卡下的分列按鈕,選擇使用分隔符號進行分列,分隔符號設置為逗號,數據類型設置為常規,點完成可得到第一次分列的結果,如果下圖所示,此時A列的內容已經比最初要簡化了很多,但是SKU仍然沒有單獨提取出來,這時我們進行第二次分列,第二次分列選擇的分隔符號為英文狀態中的冒號,點完成後SKU數據將會提取到C列。



分列功能除了可以處理不規範的數據之外,還可以用來規範時間格式,我們都知道在excel中「2018年5月1日」和「2018-05-01」這兩種寫法是等價的,而「2018.5.1」則是不規範的時間數據,有時候我們在利用時間進行數據匯總時,「xx.xx.xx」的時間格式會造成數據匯總錯誤,如何將「xx.xx.xx」的格式規範為「某年某月某日」那,仍然是使用分列功能,如下圖所示。
A列中的數據使用了「xx.xx.xx」的格式來表示的時間,我們選擇分列功能,不選擇任何分隔符號,直接一路點擊下一步到最後,選擇日期格式,選定「YMD」,點完成後即可把數據轉化為規範的日期格式,結果如下圖。
分列之後的數據已經為規範的日期格式,此時再使用設置單元格格式功能,可進一步將原始數據轉化為我們想要的格式。