我是一個(gè)著迷于產(chǎn)品和運(yùn)營(yíng)的技術(shù)人,樂于跨界的終身學(xué)習(xí)者。歡迎關(guān)注我的個(gè)人公眾號(hào)「跨界架構(gòu)師」
每周五11:45 按時(shí)送達(dá)~
我的第「206」篇原創(chuàng)敬上
大家好,我是Z哥。
首先說明一下,今天不賣課程哈,就單純聊聊我在做數(shù)據(jù)分析時(shí)的一些經(jīng)驗(yàn)。
在如今這個(gè)數(shù)據(jù)爆炸的時(shí)代,我們每天不管是主動(dòng)還是被動(dòng),都會(huì)面對(duì)大量的數(shù)據(jù)撲面而來。
如果有較好的數(shù)據(jù)分析能力,不管是對(duì)你的生活還是工作,都將帶來巨大的幫助。因?yàn)槟惚葎e人擁有更好的“洞察力”,看到別人看不到的信息,這些信息可以幫助你更好地做出決策。
很多人做數(shù)據(jù)分析的時(shí)候經(jīng)常會(huì)遇到一個(gè)問題,面前擺著一堆海量的數(shù)據(jù),但是不知道怎么分析,從何下手,以此來得到一些有用的結(jié)論。
我最開始也深受這個(gè)問題的困擾,想了好久才明白這里的問題所在,所以今天我把我思考后的思路分享給你,希望能對(duì)你有所幫助。
一個(gè)合理的數(shù)據(jù)分析思路,不但可以幫助你高效地獲得對(duì)你有價(jià)值的信息,還能提高結(jié)論的準(zhǔn)確性。
我的思路其實(shí)是一個(gè)構(gòu)建「點(diǎn)->線->面->體」的過程,主要分為以下六個(gè)步驟。
/01? 帶著目的/
如果你會(huì)覺得無從下手,大概率是因?yàn)槟康牟幻鞔_,或者說缺少目的。
沒有目的,何以解決問題?寄希望于某個(gè)牛逼的方法能夠“點(diǎn)石成金”?但是,誰來告訴你這個(gè)方法呢?靠上帝嗎?
這個(gè)道理說透了其實(shí)很容易明白,但現(xiàn)實(shí)卻是很多人陷在數(shù)據(jù)的海洋中無法自拔,認(rèn)為先收集足夠多的數(shù)據(jù),然后再分析,就能從中得到一些有價(jià)值的結(jié)論。這個(gè)邏輯其實(shí)你細(xì)想一下是有問題的,因?yàn)椴煌娜丝创瑯拥臄?shù)據(jù)得出的結(jié)論往往是不同的。因此,如果你沒有清晰的目的,再多的數(shù)據(jù)也沒有意義。
所以,先確定目的就是先明確「點(diǎn)」,只有有了「點(diǎn)」,我們才能繼續(xù)延伸去構(gòu)建我們的「線面體」。
目的一般分為以下兩種。
? ? 1.找原因。當(dāng)前面臨一些問題,從數(shù)據(jù)中找出相關(guān)因素。
? ? 2.找規(guī)律。從數(shù)據(jù)中提煉出一些規(guī)律,趨勢(shì),幫助未來做決策。
所以,不妨先明確一下,你是要找原因?還是找規(guī)律?
比如,我們分析網(wǎng)站訪問量為什么下滑。很明顯,這個(gè)目的是「找原因」。
/02? 分解目的/
明確了目的,就有了一個(gè)大方向,剩下的就是分解目的。
分解目的的方法論有很多,MECE、5W2H 等等都可以。
按照 MECE 法,以「不重疊、不遺漏」的方式將數(shù)據(jù)分析的目的拆解成多個(gè)子問題。
5W2H 法很常見,就是what、why、when、where、who、how、how much。
還有一個(gè)我覺得很好用的方法論,從 GrowingIO 那學(xué)來的。就是一個(gè)「業(yè)務(wù)目標(biāo) * 業(yè)務(wù)流程 * 業(yè)務(wù)場(chǎng)景」的三級(jí)結(jié)構(gòu)。先列出業(yè)務(wù)目標(biāo),然后展開每個(gè)目標(biāo)的流程,再展開流程上的每一個(gè)環(huán)節(jié)對(duì)應(yīng)的場(chǎng)景(場(chǎng)景中蘊(yùn)涵著關(guān)鍵指標(biāo))。
這個(gè)方法其實(shí)一次性就把「線面體」的大框架構(gòu)建完了。
在我們的案例中,影響訪問量的因素有很多,對(duì)于這個(gè)目的的分解用 MECE 方法更合適。我們也可以用思維導(dǎo)圖來實(shí)現(xiàn)。
/03? 驗(yàn)證子問題/
通過 MECE 方法將目標(biāo)分解完之后,其實(shí)就已經(jīng)把「線和面」構(gòu)建完了,接下去就是最后一步,構(gòu)建「體」。
構(gòu)建「體」的過程其實(shí)就是思考如何驗(yàn)證其中的每一個(gè)子問題。
怎么驗(yàn)證?先建指標(biāo)。現(xiàn)代管理學(xué)之父彼得·德魯克說過一句很經(jīng)典的話:
如果你不能衡量它,那么你就不能有效增長(zhǎng)它。
所謂衡量,就是需要建立統(tǒng)一的標(biāo)準(zhǔn)來定義和評(píng)價(jià)。你認(rèn)為的不錯(cuò),別人不一定這么認(rèn)為,老板可能還認(rèn)為很糟糕。所以,建立指標(biāo)的目的其實(shí)就是統(tǒng)一口徑,使得同一份數(shù)據(jù)能讓更多人得到一致的理解。
建立和使用單一指標(biāo)是數(shù)據(jù)分析的第一步,接下來你需要建立指標(biāo)體系,因?yàn)楣铝⒌闹笜?biāo)發(fā)揮不出數(shù)據(jù)的價(jià)值。
一個(gè)還不錯(cuò)的指標(biāo)體系,至少要滿足以下三點(diǎn):
???■?有三個(gè)以內(nèi)的核心指標(biāo)。核心指標(biāo)不僅僅是數(shù)字,是所有人需要盯著看去努力的。就像銷量和銷售額,用戶數(shù)和活躍用戶數(shù),大多數(shù)情況下后者都比前者重要。
???■?指標(biāo)之間存在關(guān)聯(lián)性。
???■?單一指標(biāo)至少有兩個(gè)以上維度。(比如,同比、環(huán)比等)
指標(biāo)體系沒有放之四海而皆準(zhǔn)的模板,不同業(yè)務(wù)形態(tài)有不同的指標(biāo)體系。移動(dòng) APP 和網(wǎng)站不一樣,SaaS 和電子商務(wù)不一樣,低頻消費(fèi)和高頻消費(fèi)不一樣。比如婚慶業(yè)務(wù)不需要考慮復(fù)購(gòu)率指標(biāo);互聯(lián)網(wǎng)金融必須要風(fēng)控指標(biāo);電商領(lǐng)域里的用戶需要分為賣家和買家,而且他們的指標(biāo)各不一樣。
對(duì)我們上面的案例,擺上指標(biāo)后大致是這個(gè)樣子。
/04? 清洗數(shù)據(jù)/
好了,「體」建設(shè)完之后,接下來就是把數(shù)據(jù)填入進(jìn)去了。但是在復(fù)雜的數(shù)據(jù)分析場(chǎng)景下,我們可能在數(shù)據(jù)填入之前還要做一件事。
由于在實(shí)際的業(yè)務(wù)場(chǎng)景中,原始數(shù)據(jù)可能會(huì)來自于各個(gè)內(nèi)部以及外部系統(tǒng)。指標(biāo)口徑對(duì)不上,總會(huì)出現(xiàn)不一致、重復(fù)、不完整、存在錯(cuò)誤或異常的數(shù)據(jù)。
因此需要通過一些額外操作對(duì)這些數(shù)據(jù)做清洗,得到符合我們要求的原始數(shù)據(jù)。我們這里不講太技術(shù)性的東西。從邏輯上主要做以下幾件事。
? ? 1.數(shù)據(jù)清洗:去掉噪聲和無關(guān)數(shù)據(jù)
? ? 2.數(shù)據(jù)聚合:將多個(gè)數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來存放在一個(gè)一致的數(shù)據(jù)存儲(chǔ)中
? ? 3.數(shù)據(jù)轉(zhuǎn)換:把原始數(shù)據(jù)轉(zhuǎn)換成為適合做分析的數(shù)據(jù)格式。
/05? 用數(shù)據(jù)驗(yàn)證/
好了,框架搭好了,原始數(shù)據(jù)也有了。剩下的就是通過數(shù)據(jù)來驗(yàn)證猜想了。
怎么驗(yàn)證呢?
這里我又要給出一個(gè)大殺器了,就是多用「演繹法」,而不是「歸納法」。
雖然這倆這都屬于邏輯思維,但是歸納法有一個(gè)很大的問題:因?yàn)槲覀儾豢赡苡^察到某個(gè)事物的所有影響因素,所以歸納法得出的結(jié)論是不一定是正確的。
比如,某個(gè)指標(biāo)下降了 5 %,真的是個(gè)不好的情況嗎?不一定,如果行業(yè)下降了 20 %,你才下降了 5 %,這就是一個(gè)還不錯(cuò)的結(jié)果。
而演繹法的本質(zhì)是,找到發(fā)生變化的原因,如果某個(gè)原因在未來還會(huì)繼續(xù)存在,那么可以支撐某個(gè)結(jié)論。
比如,行業(yè)為什么下降了 20 %?導(dǎo)致下降的原因未來是否還會(huì)存在?如果這些因素?zé)o法消除,那么未來繼續(xù)下滑是在預(yù)期之內(nèi)的。
/06? 保持迭代/
當(dāng)你形成了一套自己的數(shù)據(jù)分析體系之后,還不能一勞永逸,需要保持迭代。因?yàn)樵跇I(yè)務(wù)的不同時(shí)期,我們關(guān)注的點(diǎn)會(huì)不同。
比如,在業(yè)務(wù)的初期,我們會(huì)更多關(guān)注流量、轉(zhuǎn)化率這些,但到了成長(zhǎng)期以及成熟期之后,還需要關(guān)注用戶活躍度、復(fù)購(gòu)率等等數(shù)據(jù)指標(biāo)。
好了,這次就聊這么多。慣例總結(jié)一下。
這篇呢,Z 哥和你分享了我在數(shù)據(jù)分析上的一些經(jīng)驗(yàn)。
我的思路其實(shí)是一個(gè)構(gòu)建「點(diǎn)->線->面->體」的過程,主要分為以下六個(gè)步驟。
? ? 1.帶著目的
? ? 2.分解目的
? ? 3.驗(yàn)證子問題
? ? 4.清洗數(shù)據(jù)
? ? 5.用數(shù)據(jù)驗(yàn)證
? ? 6.保持迭代
希望對(duì)你有所幫助
從本質(zhì)上看,真正要做好數(shù)據(jù)分析這件事,本身對(duì)一個(gè)人商業(yè)理解、業(yè)務(wù)能力有很高的要求。因?yàn)橹挥杏辛诉@些能力,我們才能知道我需要哪些數(shù)據(jù),才能識(shí)別出哪些數(shù)據(jù)是對(duì)我有用的,以及我可以如何運(yùn)用這些數(shù)據(jù)。這些對(duì)數(shù)據(jù)分析有著事半功倍的效果。
引用一張 GrowingIO 的圖,分別展現(xiàn)了數(shù)據(jù)分析相關(guān)工作的投入產(chǎn)出比。
可以看到,看上去越偏技術(shù)性的工作,其實(shí)產(chǎn)生的單位價(jià)值反而更低。所以,你知道該怎么做了吧?
推薦閱讀:
如果你喜歡這篇文章,可以點(diǎn)一下右下角的「愛心」,支持我的創(chuàng)作~
定期發(fā)表原創(chuàng)內(nèi)容:架構(gòu)設(shè)計(jì)丨分布式系統(tǒng)丨產(chǎn)品丨運(yùn)營(yíng)丨一些深度思考。