該數據分析項目通過某零售公司2014年-2015年的銷售記錄、省份區域、客戶信息、產品信息、銷售人員架構、銷售人員任務額等數據,從趨勢分析、銷售代表分析、客戶分析、產品分析、區域分析五個方面,分析該零售公司2015年銷售情況以及公司運營狀況。
該項目分析步驟為分析設計、數據收集、數據處理、數據分析、數據可視化、數據結論六步。分三篇文章進行闡述。
Part1-某零售公司2015年銷售情況分析項目 (分析設計、數據收集、數據處理)
Part2-某零售公司2015年銷售情況分析項目 (數據分析)
Part3-某零售公司2015年銷售情況分析項目 (數據可視化、數據結論)
該篇文章目錄如下:
- 分析設計
1.1 分析目的
1.2 分析思路
1.3 分析工具 - 數據收集
2.1 創建時間表
2.2 獲取其他數據集 - 數據清洗
3.1 數據清洗工具
3.2 從文件夾合并多個Excel文件
3.3 數據類型的轉換
一、分析設計
1. 分析目的
分析的目的是通過某零售公司2014年-2015年的銷售記錄、省份區域、客戶信息、產品信息、銷售人員架構、銷售人員任務額等數據分析該零售公司的銷售情況以及公司的運營狀況。
2.分析思路
該數據分析項目從以下五個方面進行分析。
3. 分析工具
使用數據分析工具為:XMind,Power Query,Power Pivot,Power BI。
二、數據收集
1. 創建時間表
- 時間表通過Excel創建。
- 利用YEAR()和MONTH()函數增加列年份和月份。
- 利用CHOOSE()函數增加列季度。
2. 獲取其他數據集
其他數據集通過網站下載獲取。
2.1 銷售記錄文件夾
該文件夾為31個省份的銷售記錄,每個省份一個Excel文件。
2.2 省份區域
該文件說明省份與區域之間的對應關系。
2.3 客戶表
該文件說明客戶ID與客戶名稱、客戶省份、銷售代表ID之間的對應關系。
2.4 產品分類表
該文件說明產品ID與產品名稱、產品子分類、產品分類之間的對應關系。
2.5 銷售人員架構
該文件說明銷售ID與銷售代表、銷售經理之間的對應關系。
2.6 2015年銷售人員任務額
該文件說明2015年銷售代表ID與每個月任務額之間的對應關系。
三、數據清洗
1. 數據清洗工具
通常使用Excel、Power Query插件或者Python進行數據清洗,此次拿到的數據比較干凈,直接使用Power Query進行處理。Power Query的作用是連接、轉換、組合、共享。
2. 從文件夾合并多個Excel文件
源數據中31個省份的銷售記錄文件都存放在同一文件夾中,為了構建可一鍵刷新的自動化報表,使用Power Query從該文件夾合并多個Excel文件到查詢。
3. 數據類型的轉換
確認各列的數據類型,下圖為銷售記錄三個時間日期格式列的轉換。
該項目分析設計、數據收集、數據處理部分結束。請閱讀該項目其他數據分析步驟的文章。
Part2-某零售公司2015年銷售情況分析項目 (數據分析)
Part3-某零售公司2015年銷售情況分析項目 (數據可視化、數據結論)