Pandas常用命令-1

初期的時候,可能會先從實例入手,而不是先把所有先備命令學一遍,但下面這幾個命令還是經常用的,如果被很長的tutorial嚇跑,可以先敲一遍這些命令。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

用dict建立Dataframe

# DataFrame by dict
df2 = pd.DataFrame({'A' : 1.,
                   'B' : pd.Timestamp('20130102'),
                   'C' : pd.Series(1, index=list(range(4)), dtype='float32'),
                   'D' : np.array([3]*4, dtype='int32'),
                   'E' : pd.Categorical(["test", "train", "test", "train"]),
                   'F' : 'foo'})
df2

生成隨機數的矩陣 np.random.randn(6,4)

df = pd.DataFrame(np.random.randn(6,4), index = dates, columns = list('ABCD'))
df

對某一列降序排列

df.sort_values(by=['B'], ascending=False)

按index范圍取某幾行

print df['2013-01-01':'2013-01-04']

print dates
print df.loc[dates[1]]

取某幾行幾列

df.loc['20130101':'20130103' , ['A','B']]

選擇符合某條件的行列

df[df.A>0]

對Null值進行 查找,刪除,替換

df1 = df.reindex(index=dates[0:4], columns=list(df.columns)+['E'])
df1.loc[dates[0]:dates[1], 'E'] = 1
df1

DataFrame減去序列

# 每一行減去同樣的值
print df
print s
df.sub(s, axis='index')
# 每一列減去同樣的值
print df
df.sub([1,2,3,4], axis='columns')

Apply:對數據應用函數

# 每一列 最大值-最小值
df.apply(lambda x: x.max()-x.min())

歷史技術博文鏈接匯總

我是 不會停的蝸牛 Alice
85后全職主婦
喜歡人工智能,行動派
創造力,思考力,學習力提升修煉進行中
歡迎您的喜歡,關注和評論!

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容