14課時 Pandas 如何處理丟失數據。
很多消失數據。用np.nan。
.dropna(axis=0,how=‘any’) #how={‘any’,‘all’} axis=0是丟掉行。How =any是只要有任何一個為nan就丟掉整行了。后面的all 是整個行的所有列都為nan才丟失這個行,默認是how=any。 Axis=1是丟掉列。.dropna(axis=0,how=‘all’)
注:.dropna 這里沒有n。
并且最后要打印 print(-.dropna函數)
Print(np.any(df.isnull()==True)#就可以很快的查看是否丟失了數據,最后會返回時否為true,會。
? ? ? ? ? ? ? ? ? ? 15課時 Pandas導入導出數據
1 如何調用已經存儲好的數據表格類
2 excel一般用csv
3 data=pd.read_csv(‘名.csv’)
Print(data) ? ? ? ? ? ? #默認加行索引,今后可以用這個索引和column來調用數據 要用data=來命
data.to_pickle(‘studen.picklet’) #存儲 ?運行此行命令即可。
4 jupyter 工作路徑的查看
在cmd中,?輸入“ipython notebook”或“jupyter notebook”打開notebook,此時cmd的當前路徑即為notebook的工作路徑。
另外,可通過設置config文件的方法來設置固定的工作路徑
16課時 Pandasconcat 合并
合并多個dataframe 可以橫向縱行,即可columns的命不一樣
用pandas 和numpy
#concatenating
df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d'])
df2=pd.DataFrame(np.ones((3,4))*1,columns=['a','b','c','d'])
df3=pd.DataFrame(np.ones((3,4))*2,columns=['a','b','c','d'])
print(df1)
print(df2)
print(df3)
res=pd.concat([df1,df2,df3],axis=0,ignore_index=True) ?#pd中 記住 axis的代表,合并函數,axis=0 代表行都合并成多行,在行上進行合并,axis=1代表在列上面進行合并, ignore 可以讓前面的index重新順序,而非之前的index。
print(res)
# join,[‘inner’,’outer’]
默認是outer 就是說列上面沒有的寫為空
而inner是合并的時候,只合并列里面都有列,行保持不變累加。
df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d'])
df2=pd.DataFrame(np.ones((3,4))*1,columns=['e','b','c','d'])
res=pd.concat([df1,df2],join='inner',ignore_index=True)
print(res)
#join_axes
df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d'],index=[1,2,3])
df2=pd.DataFrame(np.ones((3,4))*1,columns=['b','c','d','e'],index=[2,3,4])
res=pd.concat([df1,df2],axis=1,join_axes=[df1.index])
print(res)