最近在學習python的數據分析庫,把練習的代碼貼出來,記錄一下。
創建序列
如果不是基礎包內的函數,就要把相應的包名寫上(pd,np之類的)
s = pd.Series([1,3,5,np.NaN,6,8])
產生時間序列 pd.date_range
pandas.date_range(start=None, end=None, periods=None, freq='D', tz=None, normalize=False, name=None, closed=None, **kwargs)
其中freq參數用來確定按什么頻率產生序列,默認按天(D天,M月,W周,H小時,min分鐘,s秒),不同的freq參數也會影響時間序列
period指定時間長度,如果缺失,需要指定開始、結束日期
dates = pd.date_range('20160101',periods=6)
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))
布爾索引
df[df.A > 0]
df2[df2['E'].isin(['two','four'])]
df['F'] = s1 # 按索引進行關聯
df1.dropna(how='any')