python計算分位數(shù)

pandas 和 numpy中都有計算分位數(shù)的方法,pandas中是quantile,numpy中是percentile

兩個方法其實沒什么區(qū)別,用法上稍微不同,quantile的優(yōu)點是與pandas中的groupby結(jié)合使用,可以分組之后取每個組的某分位數(shù)

quantile代碼:

import pandas as pd
import numpy as np
data = pd.read_csv('order_rank_p_0409.txt',sep='\t')
#將data按id_1 和 id_2 分組
grouped=data.groupby(['id_1','id_2'])
#用quantile計算第40%的分位數(shù)
grouped['gmv'].quantile(0.4) 
#用to_csv生成文件
x.to_csv('order_ran_re.txt',sep= '\t')

percentile代碼:


import pandas as pd
import numpy as np
data = pd.read_csv('order_rank_p_0409.txt',sep='\t')
a = array(data['gmv'])
np.percentile(a,0.4)

兩段代碼,兩種方法計算的結(jié)果是一樣的

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容