Pandas的groupby分組

定義DataFrame


1. 按df中某列對行數據分組

df['data1'].groupby(df['key1']).sum()



2.按列表對行數據分組

key=[1,2,1,1,2]

df['data1'].groupby(key).mean()


3.按多個列對行數據分組


4.按列索引分組



5.將有多重索引的Series轉行成DataFrame

df1.unstack()


6.按類型對列數據分組

df.groupby(df.dtypes, axis=1).sum()


定義DataFrame

df = pd.DataFrame(np.random.randint(1,10,(5,5)), columns=list('abcde'), index=['Alice', 'Bob','Candy', 'Dark','Emily'])



1.對列分組

mapping = {'a': 'red', 'b':'red', 'c': 'blue', 'd':'orange', 'e': 'blue'}

grouped = df.groupby(mapping, axis=1)


2.按索引長度分組


最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容