《深入淺出數據分析》讀書筆記-第一部分

《深入淺出數據分析》通過模擬業務案例,結合統計知識,介紹了數據分析的分析過程,是一個很有幫助的數據分析入門指導書籍。

一.分解數據,挖掘信息

案例:結合Acome公司貌潔保濕霜的銷量數據,提升保濕霜銷量
知識點1:分析模型:確定——分解——評估——決策
分析過程如下:
1.確定問題
首先在明確本次數據分析的目標后,需要確定目標存在的問題。也可以說解決了這些問題,就能實現目標。如:
目標:提升保濕霜銷量
問題:目前保濕霜銷售存在什么問題?哪些地方可以提升銷量?
方法:通常通過與客戶的溝通,來明確這些問題。
2.分解
需要對目前掌握的數據和問題進行分解分析,將大問題化為小問題,從數據中尋找相關因子。
分解問題:將大問題分解為小問題

分解問題

除了針對問題分解,還可從知識點的角度,發散思維,窮盡問題相關可能性,然后結合實際的業務情況進行取舍,這樣在分析問題時就有較為完善維度,減少遺漏問題的可能性。
.問題分解的過程需要我們發散思維,盡可能多的思考場景
發散思維

分解數據:將大數據化為小數據,小數據匯總成統計數據查看

3.評估
評估方法——“比較”,比較因果之間,因子之間,時間維度的比較,通常能發現一些數據規律。
下表“匯總數據”分析可以得出的結論:
1).12月/1月/2月,總銷量與目標銷量之間的差距較大
2).12月/1月/2月,降價對于目前銷量的提升沒有太大的作用
3).廣告費的降低,可能帶來了銷量的下降;社會網絡費增加并沒有帶來直觀的銷量增長。

匯總數據

通過數據表的評估分析,可能得出一個能提升銷量的方法;但是需要結合實際的業務去評估,目前廣告受眾群體的市場占有率如何?是否都購買了貌潔保濕霜?

下表持續對銷量明細數據分析發現:
1.泛美批發商的銷量可觀,但它與其他經銷商的性質不同,詳細分析發現它的市場客戶群體與目前廣告營銷的客戶群體不同,是男性客戶群體。


明細數據

泛美公司銷量明細數據

通過數據分析,提升銷量的方法可能有兩種:1.擴大對目前客戶群體的廣告投入 2.增大對男性客戶群體的影響,可以是廣告宣傳或其他途徑的宣傳等。
4.決策
結合實際的業務情況,進行清晰明了的決策。

二.檢驗你的理論

案例:解決星巴仕公司銷量下降的危機
知識點1:觀察法——比較觀察,排除混雜因素
知識點2:實驗法——控制組,對比驗證
1).通過用觀察法,對比各區域及匯總數據,能發現:咖啡價值在非富人區明顯下降,而在富人區不變

用戶調研問卷數據

2).針對價值下降問題分析:
客戶覺得咖啡現有的價格無法匹配當前的價值,有兩個直觀的方法:1.改變客戶的觀念,星巴仕的咖啡名副其實的 2.降價。
3).因為無法判斷兩種方法哪種更好,則需要做三組實驗小組,分別采用不同的營銷方法,來對比分析。而在實驗樣本小組的選擇過程中,小組之間是相同性質的,以防止其他數據干擾實驗的數據。
案例中的結論數據

三.尋找最大值

知識點:最優化問題,最大值
方法:
1找到決策變量(即你可以控制的因素)
2找到變量的約束條件(即決策變量受約束的條件)
3找到目標及目標函數
4羅列約束條件組合,求解目標函數(實際上運用Excel 的solver最優規劃來實現計算)

案例:浴盆寶12月的橡皮鴨和橡皮魚的生產計劃,使企業的利潤最大
求解過程如下:
已知約束條件:每只鴨利潤$5,每只魚利潤$4,下個月最多生產400只鴨或300條魚,橡皮的總供應量為50000g,每只鴨需要100g橡皮,每只魚需要125g橡皮
決策變量為:橡皮鴨的數量,橡皮魚的數量
目標:利潤最大
方法:利用solver工具,如圖所示(需要列出目標的計算公式,需求量大計算公式),得出結論
注意:上述的約束條件中未考慮橡皮鴨和橡皮魚的市場銷量情況,可以結合往年的歷史銷量數據預測橡皮鴨的銷量,如果增加這個條件,則在solver 的約束條件中增加一行條件,如橡皮鴨小于50等

規劃求解過程

四.數據圖形化

案例:新軍隊優化網站的需求:如何從紛繁雜亂的數據中讓信息脫穎而出
知識點1:散點圖——利用散點圖探索原因,分析因果關系
方法:
1.解決雜亂的數據的方法是:進行正確的比較。如本例中將影響目標的因素都進行清晰的對比
2.利用散點圖,表達1個因素與目標之間的關系
3.當影響目標的因素較多時,這個時候可以運用多元散點圖來表達。如下圖:橫軸表示因素影響,縱軸表示單一元素對頁面間的影響

多元散點圖

五.假設檢驗-證偽法

案例:預測podphone公司新手機的上市時間,為電膚公司的生產計劃做準備
知識點1:相關關系網絡圖:分析多個因子之間及因子與結果之間的關系圖
知識點2:假設檢驗法:核心是證偽(證明假設錯誤),若假設無法直接排除,則可借助診斷性找出否定最小的假設
方法:
1.可以利用外界的文字信息進行歸納整理,分析因子之間,因果之間的關系圖,如下圖。因果關系通常不是線性的,用這種網絡正負關系圖,能幫我們較快的梳理思路,

案例中的因子關系圖

2.一般預測某一個結論,會先預設幾個假設,結合目前掌握的證據,證明假設錯誤,就可以排除錯誤的假設。若假設無法排除,可基于證據的證明強弱對假設進行排序,選擇最可能的假設條件作為預測結論,如下圖所示。當然,若有新的證據進入,再次對假設條件作判斷。


假設否定證據排序

3.假設檢驗的思路:
A:整理證據,分析證據鏈關系
B:假設條件
C:根據證據證偽,排除假設
D:無法直接排除,根據證據對假設的否定順序排列,選擇最可能發生的假設;或者尋找新的證件,做出新的判斷。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。