一維表、二維表那些事

2021-01-18 PowerBI大師

上次帶大家見識了幾個制表時最常見的誤區,提出了四條規則

要想通過一次討論就把所有誤區都說清楚也不現實,有些坑還是要自己踩自己跌自己爬,挫敗感是學習成長道路上的二師兄——有些討厭,卻少不了他

假如你面對這些坑,騰挪輾轉收放自如,那恭喜你,離玩轉Power BI又近了一步

今天想談談一維表和二維表

這兩樣如果搞不清,數據清洗時仍然會陷入事倍功半的泥潭

什麼是二維表?

看下圖,確定一個數值,必須通過行列兩個條件去定位,這是二維表最顯著的特徵

什麼是一維表呢?

像下面左圖這種僅需通過單行就能確定數值的,被稱為一維表。為了方便瀏覽列印美觀,很多人會把重複姓名合併單元格,如下面右圖(合併單元格只是格式美觀,對數據清洗反而是一大障礙,會耗費額外時間精力)

 

為什麼表格會有一、二維之分

大家還記不記得小時候最早接觸到表格是什麼樣?對,就是學校的課程表。用二維表樣式來製作課程,是再合理不過了。這張伴隨學生時代的課程表,給人留下的印象太深,即便到了工作崗位,表格的製作和列印,也大都是二維表樣式

那一維表是怎麼來的,為什麼會出現這樣一種有大量重複,反人性的表格樣式?

最早接觸一維表的,是那些資料庫從業者,因為一維表大都是系統自動生成的。但凡從系統裡導出來的表,不管是XLS還是CSV,都是一維表樣式

換句話說,一維表是符合資料庫設計規範的——資料庫設計規範是一套參考體系,在技術世界裡不分國界地沿用了超過三十年

你只要知道,需要行和列來定位數值的,就是二維表;僅靠單行就能鎖定全部信息的,就是一維表


當然,一維表、二維表可以相互轉換
一維轉二維用透視表,反之用逆透視


我們把一維表稱為源數據,特點是數據豐富詳實,適合做流水帳,方便存儲,有利於做統計分析;二維表稱為展示數據,特點是明確直觀,適合列印、匯報

依然用之前的示例(全國影城數據)來演示
這是系統導出的一維表,全國上萬家影城,2019年上半年各月的人次明細,總計有六萬多行,地理維度有省市區三層

一維表顯然不適合人類閱讀,想了解匯總信息,只能通過透視功能轉換為二維表。一維表信息越詳實,二維表可展示的方式就越靈活

回到數據清洗這個環節上來

實際工作中,我們拿到的數據大多是手工製作的二維表——注意,是手工製作,而不是透視過來的二維表,兩者最大的區別就在於,手工二維表,存在大量「髒」數據,最典型的就是前文提過的「制表坑」

一個最顯著的特點,就是存在大量合併單元格。二維轉一維過程中,合併單元格是惡魔

但光你自己明白合併單元格的利弊並沒什麼L用,要知道,做數據分析時,數據的來源千差萬別,如果都是系統導出的倒還好,清洗起來沒什麼工作量,就怕是那種各部門提交過來的手工電子表,他們只圖自己工作方便,制表隨意性造成了大量不確定因素,使你的清洗工作量成倍增加

關於數據清洗的經驗與技巧,可以單獨寫本書,況且外面也已出版了很多Power Query的書籍,網上也有很多PQ方面的收費課程,學習門檻幾乎可以忽略

這裡就舉個小示例,演示一下行列都有合併單元格的情況下,如何二維轉一維

連結:https://pan.baidu.com/s/1p7OfC3-BkqpYw74pbzj0YA
提取碼:g3j2


PQ自動打開後,數據已導入,你會發現,之前合併單元格的地方,已被null佔據

選擇前三列,「向下填充」

通過「轉置」功能,把月份人次場次,行轉列

選中第一列月份,依然「向下填充」,把null覆蓋掉

將前兩列暫時合併,方便後續處理(你也可以試著不合併,看後面操作能不能繼續下去。如果不能,究竟卡在什麼地方,為什麼出卡住,再回過來想一下,這步合併的緣由自然就水落石出)

行列恢復如初


將第一行提升為標題。選取前四列,點擊「逆透視其他列」



至此,二維錶轉一維表過程結束(注意修改列名)

接下來就可以建度量值拉圖表搭建可視化頁面了



相關焦點

  • 關於一維表,你想知道的都在這裡了
    在之前的文章中,我也經常強調一維表的易用性,也時常有人問我,什麼是一維表,為什麼要轉為一維表呢,這篇文章就來幫你梳理清楚並告訴你如何將二維錶轉化為一維表。通過以上二維表和一維表的比較,你應該能分清楚什麼是一維表、什麼是二維表了,簡單來說:而這兩點對於二維表,都不適合。
  • Excel技巧:二維錶轉一維表最快方法!
    前幾天看到群友問到,如何將二維錶轉成一維表。接下來和大家介紹一個簡單的方法。這是一個二維表,希望轉成這樣的大家應該明白用意了,接下來和大家分享利用power query去解決。①點擊數據選項卡,選擇從文件-從工作薄②選擇對應數據所在的工作薄,點擊導入③編輯二維表④在power query編輯器中,選中第一列,在轉換選項卡下方選擇逆透視其他列。
  • Excel – 自動判斷二維表的最大最小值
    但這些方法都有一個共同的特性:只能對一維數據起作用。如果要同時對二維表的所有行或所有列一次性做判斷,那就不行了。如果要同時判斷二維表所有行、列的最大最小值,就需要通過條件格式來實現。下面就教大家用條件格式,一次性設置完成整張二維表。1. 選中需要設置的所有數據區域 --> 選擇菜單欄的 Home(開始)--> Conditional Formatting(條件格式)--> New Rule(新建規則)2.
  • Excel–文本格式的二維錶轉一維表,兩種方法都妙不可言
    但是如果文本二維表要還原成一維表,該如何實現呢? 今天就一次性教大家兩種解決方案。 案例: 將下圖 1 的二維數據表還原成一維表,效果如下圖 2 所示。
  • 科學家們提出了全新的元素周期表
    元素周期表主要由俄羅斯化學家門捷列夫創建,去年為誕生的150周年,得到廣泛的應用。在18世紀後期,化學家清楚了元素與化合物之間的區別:元素在化學上是不可分割的,而化合物則是由兩種或更多種元素組合而成,其性質與組成元素完全不同。
  • 人類進入五維空間,會發生那些神奇的事
    一維時空就是就是一個點左右運動,沒有前後。二維時空就是真正自由的世界了,可以在前後左右移動,但沒有高度。看一維和二維世界的時候,我們其實有一種上帝的視角。比如我們在螞蟻面前放一塊糖,然後忽然將這塊糖移走,螞蟻如果會思考,肯定會認為自己碰見了神跡。 以此類推,站在更高維度的文明看待我們,估計也是上帝般的存在。那麼一旦人類進入五維空間,接下來會發生那些事?
  • 纏論的一維空間(一)
    市場價格運動到底是幾維,說實話,無論是一維,二維,還是三維,都是不同的精度而已,不同倍數的放大鏡而已。在我眼裡無論二維還是三維,都是一維的,換句話說,是給市場價格運動做減法,複雜的看不來,一維的肯定能夠看得明白。一維空間的內容,是最簡單,卻是最難弄明白了,除非經過常年觀察統計總結。
  • NVH那些事(十四)
    說到噪聲前面曾有一期瞎想之六十一《說說噪聲》,其中對有關噪聲的基本概念做了簡要介紹,可惜當時還沒有寫這個NVH系列文章的計劃,沒有歸入這個系列,大家不妨先看看那篇文章裡的基礎知識,把那篇文章作為NVH噪聲部分的一篇吧,如果以後有機會重新編輯出版這些文章,我會把它重新編輯歸類。本期我們就接著前面那篇文章往下講,說說聲波及其傳播的特點。
  • 交叉表卡方檢驗兩種數據錄入格式:頻數表與原始表
    第一種是匯總後的頻數表,屬於二手數據,第二種是原始數據記錄構成的個案變量二維表,屬於一手數據。 匯總的頻數表 舉例:對26例冠心病病人和28例對照者進行病例對照研究,探討冠心病發生的有關危險因素。這54人是否吸菸的頻數統計匯總如下,請考察冠心病與是否吸菸有無關係。
  • LabVIEW創建一維數組
    一維數組是最基本的數組,多維數組是在一維數組的基礎上創建的。一維數組的創建過程如下。  (1)創建數組框架。在前面板窗口控制項選板中選擇控制項「新式→數組、矩陣與簇→數組,置於前面板窗口的空白處,如圖1所示。
  • 職場「懶人」必做的那些事
    有時候往往那些勤奮的人無法成為公司高層,是因為他們太忙了,都把注意力集中在事務性的工作上,根本沒有時間去思考新的問題,就無法去把握新的市場機會。  規範工作領域  平時最好不要介入別人的工作領域,和同事們閒聊些無聊的八卦事情,久而久之就會成為必談的話題,這樣會佔用你很多有限的工作時間,使你想做的事情卻沒辦法按時完成,使自己無法突破。
  • 物理學中,那些帶物理常數的公式是怎麼推算出來的呢?
    有了速度與溫標的樣本數據,我們建立一個二維表,在直角坐標系中,繪製對應的散點分布圖,再逼近一個可能的函數曲線,有一個大致的解析幾何方案。然後,對速度與溫度兩個二維參數,做統計平均分析。而後做統計誤差分析。計算它們的算術平均值,分析收斂性趨勢。
  • Excel數據分析案例:用excel實現一維和二維靈敏度分析
    一、一維靈敏度分析一下面的例子來說明如何實現一維靈敏度分析。某公司正在考慮一個購置設備以生產某種新產品的投資項目。要解決這個問題,需要在範圍H2:I13中作一維靈敏度分析操作以生成貼現率與投資項目淨現值之間的自變量-函數對照表的方法。第一,在範圍H3:H13中鍵入準備讓輸入作為自變量的貼現率(D4)取得的各個數值。
  • 元素周期表新成員命名那些事
    在原子核的所謂超重質量區,核內大量質子的超大庫倫斥力使原子核極不穩定,乃至不可能存在,不僅未在地球自然界觀察到,從實驗上合成和鑑別這些超重原子核,也面臨極大挑戰,門捷列夫元素周期表上第7行右端出現長期空缺。
  • 一維彈性碰撞
    感謝感謝感謝:麻省理工學院Walter lewin教授分享的課程一維彈性碰撞作者:李建海Walter lewin教授的實驗直接證明:不管是彈性碰撞還是非彈性碰撞,mv是守恆的,定義mv為動量,稱為動量守恆;在彈性碰撞中,mv2亦守恆,定義mv2 /2為動能,稱為動能守恆;而非彈性碰撞中動能並不守恆
  • 一維到十一維空間圖解 二維空間是一維空間的延展
    一、一維空間因為空間是一個點組成的單一直線,處在一維空間的生物,只能沿著這一條單一的直線一直往前走。二、二維空間二維空間是一維空間進行延展,二維空間就是兩條相交的直線所表現出來的平面,在二維空間的生物,可以在整個平面上進行移動,但是不能夠進行上下移動。