pandas模塊

清洗數據工的自我修養:)

0.增加索引

df.set_index('Team', inplace=False, drop=True) 
#以Team為索引
#inplace=True 在原數據集上修改
#默認情況下,設置成索引的列會從DataFrame中移除,drop=False將其保留下來

1.丟棄值

df.drop(['a','b'], axis=1)  # 按列(axis=1),丟棄指定的列,默認按行

2.拼接數據

pd.merge(new_A, new_B, how='left', on='Team')
#how:指的是合并(連接)的方式有inner(內連接),left(左外連接),right(右外連接),outer(全外連接);默認為inner
#on : 指的是用于連接的列索引名稱。必須存在右右兩個DataFrame對象中,如果沒有指定且其他參數也未指定則以兩個DataFrame的列名交集做為連接鍵
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容