醉魚草
主講:陳丹奕
撰寫第一份數據分析報告
展示數據收集、處理的能力,邏輯思維框架,數據可視化,行業業務理解的能力
數據報告的制作過程
需求層、數據層、分析層、輸出層
普通難度
目標確定 數據獲取 數據清洗 數據整理 描述分析 洞察結論 報告撰寫
目標確定
選擇熟悉感興趣的領域行業
選擇范圍比較小的細分領域行業作為切入點
確定這個領域行業有公開發表的數據,可以獲取的ugc內容
構建報告故事線,常用結果是“總分總”
數據獲取
數據來源 內部數據和外部數據
內部數據可以直接獲取,已有原始資料需整理,需要進行收集
外部數據包括一般手段收集、技術手段收集、合作、純購買
數據清洗
數據清洗是分析流程最重要的部分,占分析項目時間的60%以上
數據清洗路徑
預處理
去除/補全有缺失的數據
去除修改格式和內容錯誤的數據
去除邏輯錯誤的數據
去除不需要的數據
關聯性驗證
數據計算 對數據表進行統計計算,生成各級指標
描述分析:變化 分布 對比 預測
數據建模
考慮線性回歸和聚類模型