pandas 高級用法

處理缺失值


數據離散化

  1. 分組
    • 自動分組 new_sr = pd.qcut(sr, bins=3)
    • 自定義分組 new_sr = pd.cut(sr, bins=[0, 165, 185, 300])
  2. one-hot編碼
    df = pd.get_dummies(new_sr , prefix=)

合并

  • 方向合并
    pd.concat([df1, df2], axis=0)

    axis=0豎直合并
    axis=1 水平合并

  • 索引合并
    pd.merge()
    • 內連接


      pd.merge(left, right, how='inner', on=['key1', 'key2'])
    • 左連接


      pd.merge(left, right, how='left', on=['key1', 'key2'])
  • 右連接


    pd.merge(left, right, how='right', on=['key1', 'key2'])
  • 外連接


    pd.merge(left, right, how='outer', on=['key1', 'key2'])

交叉表與透視表

分組與聚合

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容