簡(jiǎn)介: 本文主要介紹在pandas中如何處理缺失數(shù)據(jù)。
主要方法有:
- isnull()
- notnull()
- dropna()
- fillna()
-
判斷數(shù)據(jù)是否缺失
使用isnull()函數(shù),返回bool類型數(shù)據(jù)
dataframe.isnull()
使用notnull()函數(shù),同樣返回bool類型數(shù)據(jù)
dataframe.notnull()
使用sum()函數(shù),統(tǒng)計(jì)缺失數(shù)據(jù)
dataframe.isnull().sum()
-
過(guò)濾缺失數(shù)據(jù)
dataframe[dataframe.colname.isnull()]
dataframe[dataframe.colname.notnull()]
-
丟棄缺失數(shù)據(jù)
how按行row判斷
dataframe.dropna(how='any')
dataframe.dropna(how='any', inplace=True)
dataframe.dropna(how='all')
dataframe.dropna(how='all', inplace=True)
對(duì)特定列操作
dataframe.dropna(subset=["col1", "col2"], how='any')
dataframe.dropna(subset=["col1", "col2"], how='all')
-
填充缺失數(shù)據(jù)
fillna()函數(shù)
附上小哥哥的視頻鏈接Data analysis in Python with pandas
Youtube ??
嗶哩嗶哩 ??
所有文章列表
pandas使用技巧總覽