用Python分析用戶(hù)消費(fèi)行為

這是一份用戶(hù)在一家CD網(wǎng)站上的消費(fèi)記錄

1、導(dǎo)入數(shù)據(jù)

--?對(duì)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)

可知用戶(hù)平均每筆訂單購(gòu)買(mǎi)2.4個(gè)商品,中位數(shù)為2,75分位數(shù)為3,說(shuō)明絕大部分訂單的購(gòu)買(mǎi)量都不多。

但是最大值為99個(gè),數(shù)字偏高。

一般來(lái)說(shuō),根據(jù)二八法則,20%的用戶(hù)貢獻(xiàn)的收入會(huì)占總收入的80%。


--?將order_dt改為可計(jì)算的時(shí)間字符類(lèi)型并將消費(fèi)頻次按月計(jì)算

查看更改以后的數(shù)據(jù)

2、進(jìn)行用戶(hù)消費(fèi)趨勢(shì)的分析(按月)

(1)每月的消費(fèi)總金額

(2)每月的用戶(hù)消費(fèi)次數(shù)

(3)每月的產(chǎn)品購(gòu)買(mǎi)量

(4)每月的消費(fèi)人數(shù)

(1)對(duì)每月的消費(fèi)總金額繪制折線圖分析

每月的消費(fèi)總金額
每月的消費(fèi)總金額(折線圖)

由圖可知,用戶(hù)發(fā)生購(gòu)買(mǎi)行為多在1-3月,從四月份以后,消費(fèi)較為穩(wěn)定呈輕微下降趨勢(shì)

(2)對(duì)每月消費(fèi)人數(shù)繪制折線圖分析

每月的用戶(hù)消費(fèi)次數(shù)
每月的用戶(hù)消費(fèi)次數(shù) (折線圖)

前三個(gè)月消費(fèi)訂單次數(shù)在10000次接近12000次,后續(xù)每月消費(fèi)次數(shù)則在2500次

(3)對(duì)每月產(chǎn)品購(gòu)買(mǎi)量繪制折線圖分析

每月產(chǎn)品購(gòu)買(mǎi)量
每月產(chǎn)品購(gòu)買(mǎi)量(折線圖)

前三個(gè)月物品購(gòu)買(mǎi)量約為25000元,后續(xù)月份則保持在7000元左右

(4)對(duì)每月的消費(fèi)人數(shù)繪制折線圖分析

每月消費(fèi)人數(shù)(折線圖)

前三個(gè)月每月的消費(fèi)人數(shù)在8000-10000之間,后續(xù)月份,平均消費(fèi)人數(shù)在2000不到

3、用戶(hù)個(gè)體消費(fèi)分析

(1)用戶(hù)消費(fèi)金額,消費(fèi)次數(shù)的秒速統(tǒng)計(jì)

(2)用戶(hù)消費(fèi)金額和消費(fèi)次數(shù)的散點(diǎn)圖

(3)用戶(hù)消費(fèi)金額的分布圖

(4)用戶(hù)累計(jì)消費(fèi)金額占比(百分之多少的用戶(hù)占了百分之多少的消費(fèi)額)

(1)對(duì)用戶(hù)金額及消費(fèi)次數(shù)繪制散點(diǎn)圖分析

用戶(hù)金額及消費(fèi)次數(shù)(散點(diǎn)圖)

過(guò)濾掉極值

用戶(hù)金額及消費(fèi)次數(shù)(散點(diǎn)圖)

(3)對(duì)用戶(hù)消費(fèi)金額作直方圖分析

用戶(hù)消費(fèi)金額(直方圖)

由圖可知用戶(hù)消費(fèi)金額,絕大部分呈現(xiàn)集中趨勢(shì),小部分異常值干擾了判斷,可以使用過(guò)濾操作排除異常值

過(guò)濾后的用戶(hù)消費(fèi)金額( 直方圖 )

(4)對(duì)用戶(hù)累計(jì)消費(fèi)金額占比作折線圖分析

用戶(hù)累計(jì)消費(fèi)金額占比(折線圖)

由圖可知50%的用戶(hù)僅貢獻(xiàn)了15%的消費(fèi)額度,而排名前5000的用戶(hù)就貢獻(xiàn)了40%的消費(fèi)額度


3、用戶(hù)消費(fèi)行為

(1)用戶(hù)第一次消費(fèi)(首購(gòu))

(2)用戶(hù)最后一次消費(fèi)

(3)新老客戶(hù)消費(fèi)比

? ? ? ? ①多少用戶(hù)僅消費(fèi)一次

? ? ? ? ②每月新客占比

(4)用戶(hù)分層

????????①?RFM模型

????????②新、老、活躍、回流、流失

(5)用戶(hù)購(gòu)買(mǎi)周期(按訂單)

????????①用戶(hù)消費(fèi)周期描述

????????②用戶(hù)消費(fèi)周期分布

(6)用戶(hù)生命周期(按第一次和最后一次消費(fèi)) -用戶(hù)生命周期描述

????????①用戶(hù)生命周期分布

(7)復(fù)購(gòu)率和回購(gòu)率分析

(1)(2)對(duì)用戶(hù)第一次及最后一次消費(fèi)進(jìn)行分析

用戶(hù)第一次消費(fèi)
用戶(hù)最后一次消費(fèi)

大多數(shù)人最后一次購(gòu)買(mǎi)時(shí)間都在1-3月份,說(shuō)明他們購(gòu)買(mǎi)了一次就不再進(jìn)行購(gòu)買(mǎi),隨著時(shí)間的遞增,最后一次購(gòu)買(mǎi)數(shù)量也在遞增,消費(fèi)呈現(xiàn)流失上升的狀況。用戶(hù)流失比例基本一致,一開(kāi)始用戶(hù)迅猛增長(zhǎng)數(shù)量比較多流失的也比較多。

(3)對(duì)新老客消費(fèi)比進(jìn)行分析

取每個(gè)用戶(hù)首次和最后一次購(gòu)買(mǎi)時(shí)間

用戶(hù)首次和最后一次購(gòu)買(mǎi)時(shí)間

查詢(xún)只進(jìn)行過(guò)一次購(gòu)買(mǎi)的用戶(hù)人數(shù)

一次購(gòu)買(mǎi)的用戶(hù)人數(shù)

由圖可知,將近一半的用戶(hù)僅僅消費(fèi)了一次,新老客戶(hù)占比接近1:1

(4)RFM模型

RFM模型的三個(gè)指標(biāo)為最近一次消費(fèi)時(shí)間、消費(fèi)頻率 、消費(fèi)金額?

繪制透視圖表進(jìn)行分析

RFM模型

要將order_dt里面具體的日期變成R中的天數(shù)

再將order_amount和order_products重命名為F、M

RFM模型

對(duì)用戶(hù)進(jìn)行分群(8個(gè))

將RFM中的數(shù)值換為容易理解的文字

對(duì)重要價(jià)值客戶(hù)及非重要價(jià)值客戶(hù)的消費(fèi)時(shí)間、消費(fèi)頻率繪制散點(diǎn)圖

(4)對(duì)用戶(hù)生命周期 新客,活躍,回流,流失進(jìn)行分析

從上圖中可以看到,表中數(shù)據(jù)有0,1,2···,要將有消費(fèi)的變?yōu)?,沒(méi)有消費(fèi)變?yōu)?

這里由于進(jìn)行數(shù)據(jù)透視,填充了一些 null 值為0,而實(shí)際可能用戶(hù)在當(dāng)月根本就沒(méi)有注冊(cè),這樣會(huì)誤導(dǎo)第一次消費(fèi)數(shù)據(jù)的統(tǒng)計(jì)。

自定義函數(shù)

將自定義函數(shù)運(yùn)用到數(shù)據(jù)中

將未注冊(cè)的替換為空值,這樣 count 計(jì)算時(shí)不會(huì)計(jì)算到,從而得到每個(gè)月的用戶(hù)分布

對(duì)這些用戶(hù)做面積圖分析

(5)用戶(hù)購(gòu)買(mǎi)周期?對(duì)用戶(hù)消費(fèi)周期進(jìn)行分析

計(jì)算相鄰兩個(gè)訂單的時(shí)間間隔,用shift 函數(shù),shift函數(shù)是對(duì)數(shù)據(jù)進(jìn)行錯(cuò)位,所有數(shù)據(jù)會(huì)往下平移一下,可以計(jì)算

以用戶(hù)分組,對(duì)兩個(gè)訂單的間隔進(jìn)行計(jì)算

NaT表示只有一次購(gòu)買(mǎi)

對(duì)時(shí)間間隔進(jìn)行描述性統(tǒng)計(jì)分析

去除days并繪制直方圖

時(shí)間間隔(直方圖)

用戶(hù)的平均購(gòu)買(mǎi)周期是68天,絕大部分用戶(hù)的購(gòu)買(mǎi)周期都低于100天

(6)對(duì)用戶(hù)生命周期(按第一次和最后一次消費(fèi))

描述性分析

去除days并繪制直方圖

用戶(hù)生命周期(直方圖)

用戶(hù)的生命周期受只購(gòu)買(mǎi)一次的用戶(hù)影響比較厲害,所以要對(duì)用戶(hù)進(jìn)行篩選

(7)復(fù)購(gòu)率和回購(gòu)率分析

復(fù)購(gòu)率:自然月內(nèi),購(gòu)買(mǎi)多次的用戶(hù)占比(即,購(gòu)買(mǎi)了兩次以上)

回購(gòu)率:曾經(jīng)購(gòu)買(mǎi)過(guò)的用戶(hù)在某一時(shí)期的再次購(gòu)買(mǎi)的占比(可能是在三個(gè)月內(nèi))

復(fù)購(gòu)率折線圖

復(fù)購(gòu)率穩(wěn)定在20%所有,前一個(gè)月因?yàn)橛写罅啃掠脩?hù)涌入,而這批用戶(hù)只購(gòu)買(mǎi)了一次,所以導(dǎo)致復(fù)購(gòu)率降低

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容