同樣是用Excel,為什么別人那么優秀?
“為什么同樣是用Excel工作,新來的小李竟能比我這資深表哥快這么多”。
對自己多年練就的“神速做表手”充滿信心的老王怎么也想不明白,為什么自己最快也要兩天才能做好的數據報表,到新來的小李手里只用半天就搞定了。
其實要解釋老王的疑惑一點也不難,小李站在“表結構”數據上跳舞,而老王仍停留在傳統Excel的“表格結構”數據上埋頭苦干。
兩者雖然只有一字之差,但“表結構”數據比“表格結構”數據更具優勢,而且這種優勢是單憑人的快速熟練的操作技巧所追趕不上的。
1、什么是表結構數據,什么又是表格結構數據,兩者間又有什么區別呢?
- 表格結構數據就是我們傳統使用的Excel工作表數據,
- 表結構數據則是像數據庫中數據表一樣的數據結構。
兩者間***的區別就是基本計算單位不同。
表格結構數據基本計算單位是單元格,如果在C1單元格中輸入公式“=A1+B1”,則公式將分別引用單元格A1與單元格B1中的值,再將兩個值相加并在C1單元格中返回計算結果。整個運算過程都是基于單元格完成的,像這樣以單元格為參照對象進行計算的數據結構就是表格結構數據。
表結構數據的基本計算單位是整列數據,如下圖所示,先在Excel的A列和B列中分別輸入商品數量和商品單價的相關信息,然后使用開始選項卡中套用表格格式功能將A列和B列中的值轉換為表結構數據,并且在C2單元格中輸入公式“=[@商品數量]*[@商品單價]”并點擊回車后……
會神奇的發現,再不用向下拖拽公式了,所有不同行上的商品數量與商品單價的乘積的結果都會自動顯示在C列中。
這是因為表結構數據的基本計算單位是整列數據,表結構數據對列中所有行上的值進行統一計算,并統一返回所有行上值對應的計算結果的原因。
2、表結構數據的優勢在哪?
表結構數據在以下幾個方面具有表格結構數據無法比擬的優勢:
- 優勢1:可對零散數值進行不同維度下的匯總觀測
- 優勢2:可非常輕松地關聯并整合多種不同數據源數據
- 優勢3:可對大規模數據進行批量計算,其速度遠大于表格結構數據
- 優勢4:可在不同表間建立關聯關系,讓所有不同維度數據表整合為一個完整的多維數據模型
- 優勢5: 多數表結構數據處理工具記錄的是運算過程而非計算結果,所以一旦記錄好一次完整、準確的運算過程,便可反復利用,可大幅減少在Excel傳統工作表中進行的重復性工作。
3、表結構數據是如何完勝的?
正是以上五點優勢幫助站在表結構數據上跳舞的小李完勝了還在表格結構數據上苦干的老王,那么為什么小李會完勝老王呢?
老王要制作的數據報表需要先從多個不同的數據源中采集數據,這些數據有來自于CSV格式文本文件的,Excel的,數據庫中多個不同數據表的,TXT格式文本文件等等
每次老王需要一個個將這些數據源中的數據復制粘貼到自己工作用的Excel文件中的多個不同工作表中,要處理的數據行數多達六萬行。
V好數據后,當前文件很有可能因為計算資源枯竭而導致崩潰,老王需要盡快把這份數據轉移到一個新的Excel文件上。
轉移過后,老王需要繼續添加多個計算列才能完成一份完整的數據源,有了數據源后,老王還需要制作多個數據透視表來獲得最終數據報表中使用的匯總值,有了匯總值,老王才可以著手準備數據報告。
老王負責的數據報表是周報,也就是說每周都要重復一次上述所有的工作流程,在制作報表過程中哪怕有一步做錯了都要再重新來過……
我不想再說下去了,表哥表姐表叔表嫂們心里的苦是說不清道不盡的。
那么面對同樣的工作問題,已經玩轉表結構數據的小李又是如何做的呢?
小李用到了Excel中專門處理表結構數據的Power Query以及Power Pivot工具。
他先用Power Query直接關聯到多個不同數據源上,將這些數據源中的數據統一導入到Power Query數據環境下,然后使用合并功能,輕松將所有不同數據源中數據匯總到了一起,這就是表結構數據***個優勢。
然后小李在整合好的數據中添加計算字段,雖然數據量很大,但因為表結構數據具有“可對大規模數據進行批量計算,其速度遠大于表格結構數據”的優勢,瞬間就完成了所有計算任務。
然后小李把加工好的多個數據表一起導入到Power Pivot中創建關聯關系,搭建了統一的多維數據環境,并且在Power Pivot中設計了復雜的匯總計算規則,在完整的數據環境上,小李非常輕松的獲得了報表所需的數據匯總值。
并且在此基礎上還為領導提供了可做篩選操作的多個不同的觀測維度信息。這就是表結構數據的第三和第四個優勢。
小李創建的整個處理過程被完整的記錄在Power Query與Power Pivot中,于是,到了每周出周報的時間,小李只需要把數據源文件替換好,然后點擊一下Excel中數據選項卡下的全部刷新按鈕,稍等片刻,所有工作就全部完成了。再不需要每次都重復所有的制作過程。
所以一旦記錄好一次完整、準確的運算過程,便可反復利用,可大幅減少在Excel傳統工作表中進行的重復性工作”成為小李壓倒老王的***一根稻草。在面對表結構數據的高維打擊下,處在低維的表格結構數據已經開始顯得力不從心。
在業務數據分析中,常用到的表結構數據處理加工分析工具主要有Excel Power BI以及數據庫的SQL語句。