清洗數據工的自我修養:)
0.增加索引
df.set_index('Team', inplace=False, drop=True)
#以Team為索引
#inplace=True 在原數據集上修改
#默認情況下,設置成索引的列會從DataFrame中移除,drop=False將其保留下來
1.丟棄值
df.drop(['a','b'], axis=1) # 按列(axis=1),丟棄指定的列,默認按行
2.拼接數據
pd.merge(new_A, new_B, how='left', on='Team')
#how:指的是合并(連接)的方式有inner(內連接),left(左外連接),right(右外連接),outer(全外連接);默認為inner
#on : 指的是用于連接的列索引名稱。必須存在右右兩個DataFrame對象中,如果沒有指定且其他參數也未指定則以兩個DataFrame的列名交集做為連接鍵