
seaborn整體風格設置 sns.set() → 整體設置seaborn的主題,調色板,顏色代碼等多個樣式 sns.set_style() →...
相關性分析 1、相關性分析是指對多個具備相關關系的變量進行分析,從而衡量變量間的相關程度或密切程度 2、相關性可以應用到所有數據的分析過程中,任...
柱狀圖 → plt.plot(kind='bar')/plt.bar() 柱狀圖:是一種以長方形的長度為變量的統計圖表。長條圖用來比較兩個或以上...
一、數據離散化 1、所謂離散化,就是把無限空間中的有限個體映射到一個有限的空間中。 2、數據離散化大多針對連續數據進行,處理后數據值域分布將從連...
一、項目背景 本次練習使用的數據集為美國城市巴爾的摩2016年公務員工資的數據集,將通過數據可視化和數據描述性分析等手段,分析其工資分布情況。 ...
一、數據說明 本次演練的數據集為某企業業務部門的客戶數據,將對該數據集進行數據預處理等操作。 二、缺失值判斷及處理 從返回信息可知,數據結構為(...
一、異常值 1.異常值是指樣本中的個別值,其數值明顯偏離其余的觀測值。異常值也稱離群點,異常值的分析也稱為離群點的分析 2.異常值的處理,先是辨...
一、缺失值處理 數據缺失主要包括記錄缺失和字段信息缺失等情況,其對數據分析會有較大影響,導致結果不確定性更加顯著 缺失值處理方法:丟棄 → 刪...
一、讀取MySQL數據庫 MySQL數據庫是開源的關系型數據庫,可以通過python與其進行連接。首先需要安裝第三方庫pymysql → pip...