數據可視化基礎(一)
01??常用統計圖
數據可視化,即將數據以圖形化的形式展示出來,常用統計圖:
①折線圖:以折現的上升或下降來表示統計數量的增減變化的統計圖
特點:能夠顯示數據的變化趨勢,反應事物的變化情況。(變化)
②直方圖:由一系列高度不等的縱向條紋或線段表示數據的分布情況,一般用橫軸表示數據范圍,縱軸表示分布情況。
特點:繪制連續型的數據,展示一組或者多組數據的分布狀況(統計)
③條形圖:排列在工作表的列或行中的數據可以繪制到條形圖中。
特點:繪制離散型的數據,能夠一眼看出各個數據的大小,比較數據之間的差距。
④散點圖:用兩組數據構成多個坐標點,考察坐標點的分布,判斷兩變量之間是否存在某種關聯或總結坐標點的分布模式。
特點:判斷變量之間是否存在數量關聯趨勢,展示離群點(分布規律)
02? ?Numpy基礎
Numpy是效率很高的一個數學庫,主要用于數組和矩陣運算,其核心數據類型是ndarry,可以認為是一種n維的數組結構。
① 引入numpy庫:
import? numpy? as? np(慣例寫法)
② 創建數組:
(1)使用array()函數可將Python的列表數據直接轉換為ndarry類型
(2)使用Numpy函數創建數組
1.data1=np.zeros((2,3)):創建了一個2行3列,元素值均為0.0的二維數組。
2.data2=np.ones((2,3)):創建了一個2行3列,元素值均為1.0的二維數組。
3.data3=np.arange(1,5,0.2)
該語句創建一維數組,數組取值范圍為[1,5),數組元素包括左側數值1,但不包括右側數值5,0.2為步長值。
4.data4=np.linspace(1,5,9)
創建一個一維數組,取值范圍[1,5],9表示將數據等分為9份。
5.data5=np.arange(12).reshape((3,4))
先產生數據范圍在[0,12)的自0開始到12結束的12個整數的一維數組(),步長為默認值1.其后的reshape表示將此數組重新劃分為3行4列的二維數組。
6.data6=np.random.random((2,3))
產生數值范圍在[0.0,1.0)的2行3列的二維數組。
7.data7=np.random.randint(1,10)
生成一個值范圍在[1,10)的整數。
圖片1 使用array函數創建數組
圖片2??使用Numpy函數創建數組
03? ?使用Matplotlib繪制折線圖
①引入matplotlib庫
import matplotlib.pyplot as plt
繪制圖形的一般步驟:1.準備圖形數據(如使用Numpy)2.生成繪圖畫布plt.figure()? 3.選擇合適的圖形繪制? 4.渲染圖形并畫出圖形
②基本格式:
plt.plot(x,y,color=”color”,marker=”o”,linestyle=”dashed”,label=”label”,其他參數)
示例1:繪制函數y=sin(x),x取值范圍為[-π,π]的數據線。
代碼如下圖所示:
代碼的運行結果如下所示:
示例2:在同一窗口中繪制y=sin(x)和y=cos(x)的圖像,x的取值范圍為[-π,π]。
代碼如下圖所示:
代碼的運行結果如下圖所示:
歡迎關注我的個人微信公眾號:全哥的學習生涯,里面分享的是關于自己醫學專業上的學習經驗,與本專業之外包括日語、英語以及數據分析中的重點知識匯總、學習方法與心得,當然,還有我自己的保研歷程與經驗、一些生活上的感悟等等