其他數(shù)據(jù)分析和挖掘的忠告

此部分內(nèi)容來自對《Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營》4.8節(jié) 其他數(shù)據(jù)分析和挖掘的忠告

1 不要忘記數(shù)據(jù)質(zhì)量的驗(yàn)證

數(shù)據(jù)質(zhì)量是所有數(shù)據(jù)工作中最基礎(chǔ)但也是最容易被忽視的一個(gè)環(huán)節(jié),在實(shí)際問題中,要有效的應(yīng)對數(shù)據(jù)質(zhì)量的問題,必須在工作過程中進(jìn)行數(shù)據(jù)質(zhì)量驗(yàn)證。

  • 理解數(shù)據(jù)來源、數(shù)據(jù)統(tǒng)計(jì)和手機(jī)邏輯,數(shù)據(jù)入庫處理邏輯;
  • 理解數(shù)據(jù)在數(shù)據(jù)倉庫中存放細(xì)節(jié),包括字段類型、小數(shù)點(diǎn)位數(shù)、取值范圍,規(guī)則約束等;
  • 明確數(shù)據(jù)的取數(shù)邏輯,尤其是過程中是否對數(shù)據(jù)有轉(zhuǎn)化或重新定義;
  • 第一時(shí)間對數(shù)據(jù)做數(shù)據(jù)審查,包括數(shù)據(jù)有效性驗(yàn)證、取數(shù)范圍、空值和異常值驗(yàn)證,是否與原始數(shù)據(jù)原則一致等。

2 不要忽視數(shù)據(jù)的落地性

無論數(shù)據(jù)分析的服務(wù)對象是具有決策權(quán)的領(lǐng)導(dǎo)層還是執(zhí)行層的業(yè)務(wù)層,數(shù)據(jù)的價(jià)值都只存在于輔助決策或者數(shù)據(jù)驅(qū)動中。
部分?jǐn)?shù)據(jù)分析師的數(shù)據(jù)報(bào)告讓業(yè)務(wù)方覺得沒有價(jià)值,表現(xiàn)為:

  • 分析過程明顯不符合業(yè)務(wù)操作實(shí)際
  • 結(jié)論明顯是錯(cuò)的
  • 建設(shè)方向性很對,但都是人人都知道的大道理,具體執(zhí)行缺乏落地性
  • 建議方向性很明確,也有具體執(zhí)行建議,但業(yè)務(wù)不能執(zhí)行
    在以上的問題中,前兩條問題的原因是數(shù)據(jù)分析的及基本數(shù)據(jù)能力和業(yè)務(wù)基本常識不足,后兩條的原因更多的在于信息不對稱。從數(shù)據(jù)分析師的主觀問題分析,根源可能有以下幾個(gè)方面:
  • 數(shù)據(jù)分析師不理解業(yè)務(wù)操作流程,憑自己的理解去猜測業(yè)務(wù)流程
  • 數(shù)據(jù)分析師不了解目前業(yè)務(wù)的困難點(diǎn)和緊迫點(diǎn),想要驅(qū)動的是業(yè)務(wù)的“次要”關(guān)注點(diǎn);
  • 數(shù)據(jù)分析師不了解業(yè)務(wù)的實(shí)際能力和權(quán)限

3 不要把數(shù)據(jù)陳列當(dāng)做數(shù)據(jù)結(jié)論

數(shù)據(jù)報(bào)告中一定要根據(jù)數(shù)據(jù)得出相應(yīng)的結(jié)論。在實(shí)際業(yè)務(wù)中要根據(jù)匯報(bào)對象的層次、理解水平、對數(shù)據(jù)認(rèn)識程度以及聽匯報(bào)的習(xí)慣重新組織語言和格式等。

4 數(shù)據(jù)結(jié)論不要產(chǎn)生于單一指標(biāo)

5 數(shù)據(jù)分析不要預(yù)設(shè)價(jià)值立場

6 不要忽視數(shù)據(jù)與業(yè)務(wù)的需求沖突問題

總結(jié)

在實(shí)際的數(shù)據(jù)分析問題中,要考慮數(shù)據(jù)的質(zhì)量,數(shù)據(jù)分析結(jié)論的正確性,一定要結(jié)合實(shí)際的業(yè)務(wù)需求,同時(shí)數(shù)據(jù)分析要做到客觀、公正。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容