用Python進行數據分析-01


數據可視化基礎(一)

01??常用統計圖

數據可視化,即將數據以圖形化的形式展示出來,常用統計圖:

①折線圖:以折現的上升或下降來表示統計數量的增減變化的統計圖

特點:能夠顯示數據的變化趨勢,反應事物的變化情況。(變化)

②直方圖:由一系列高度不等的縱向條紋或線段表示數據的分布情況,一般用橫軸表示數據范圍,縱軸表示分布情況。

特點:繪制連續型的數據,展示一組或者多組數據的分布狀況(統計)

③條形圖:排列在工作表的列或行中的數據可以繪制到條形圖中。

特點:繪制離散型的數據,能夠一眼看出各個數據的大小,比較數據之間的差距。

④散點圖:用兩組數據構成多個坐標點,考察坐標點的分布,判斷兩變量之間是否存在某種關聯或總結坐標點的分布模式。

特點:判斷變量之間是否存在數量關聯趨勢,展示離群點(分布規律)

02? ?Numpy基礎

Numpy是效率很高的一個數學庫,主要用于數組和矩陣運算,其核心數據類型是ndarry,可以認為是一種n維的數組結構。

① 引入numpy庫:

import? numpy? as? np(慣例寫法)

② 創建數組:

(1)使用array()函數可將Python的列表數據直接轉換為ndarry類型

(2)使用Numpy函數創建數組

1.data1=np.zeros((2,3)):創建了一個2行3列,元素值均為0.0的二維數組。

2.data2=np.ones((2,3)):創建了一個2行3列,元素值均為1.0的二維數組。

3.data3=np.arange(1,5,0.2)

該語句創建一維數組,數組取值范圍為[1,5),數組元素包括左側數值1,但不包括右側數值5,0.2為步長值。

4.data4=np.linspace(1,5,9)

創建一個一維數組,取值范圍[1,5],9表示將數據等分為9份。

5.data5=np.arange(12).reshape((3,4))

先產生數據范圍在[0,12)的自0開始到12結束的12個整數的一維數組(),步長為默認值1.其后的reshape表示將此數組重新劃分為3行4列的二維數組。

6.data6=np.random.random((2,3))

產生數值范圍在[0.0,1.0)的2行3列的二維數組。

7.data7=np.random.randint(1,10)

生成一個值范圍在[1,10)的整數。

圖片1 使用array函數創建數組

圖片2??使用Numpy函數創建數組

03? ?使用Matplotlib繪制折線圖

①引入matplotlib庫

import matplotlib.pyplot as plt

繪制圖形的一般步驟:1.準備圖形數據(如使用Numpy)2.生成繪圖畫布plt.figure()? 3.選擇合適的圖形繪制? 4.渲染圖形并畫出圖形

②基本格式:

plt.plot(x,y,color=”color”,marker=”o”,linestyle=”dashed”,label=”label”,其他參數)

示例1:繪制函數y=sin(x),x取值范圍為[-π,π]的數據線。

代碼如下圖所示:

代碼的運行結果如下所示:

示例2:在同一窗口中繪制y=sin(x)和y=cos(x)的圖像,x的取值范圍為[-π,π]

代碼如下圖所示:

代碼的運行結果如下圖所示:

歡迎關注我的個人微信公眾號:全哥的學習生涯,里面分享的是關于自己醫學專業上的學習經驗,與本專業之外包括日語、英語以及數據分析中的重點知識匯總、學習方法與心得,當然,還有我自己的保研歷程與經驗、一些生活上的感悟等等

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容