直方圖

<a name="" >為什么進行數據可視化:在我看來就是減少大腦的運算。</a>
可視化是什么:將抽象的科學或者商業數據.用圖像表示出來.幫助理解數據的意義的過程。它通常會在進行數據分析(data analysis)的過程中大量的使用。
直方圖)是一種對數據分布情況的圖形表示,是一種二維統計圖表,它的兩個坐標分別是統計樣本和該樣本對應的某個屬性的度量。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
weight_data=pd.read_table('weight.txt')
weight_data.shape
(80, 1)

這里可以看出有80個數,如果事先看了原始數據的話心理大概就有譜了

操作數據時應該先大概看下原始數據(事先并沒有看,只想只完成任務,沒有思考)
下回應該先看看原始數據的結構

平均值

weight_data['weight'].mean()
50.700000000000003
求"方差"(標準差的平方根是方差)(每個數偏差平方的和是標準差)(偏差是一個數離平均值的距離)
方差的優勢:波動值合理;單位和原始數據一致
weight_data['weight'].var()
39.275949367088607

直方圖

fig=plt.figure()
x=weight_data['weight']
ax=fig.add_subplot(111)
numBins=15
ax.hist(x,numBins,color='red',alpha=0.8,rwidth=0.5)
plt.title(u'weight')
plt.show()
12.png

結果分析

一:(1)共有體重80條記錄;(2)平均值是50.7;(3)方差是39.275。
二:(1)50.7-39.275=11.425; 平均波動范圍在20%
三:(1)數據集中在45·55中間
四:有3個偏差較大值,(1)體重接近70和體重4時頻數最小
(2)在體重48的人數最多

cav文件

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
passengers_data = pd.read_csv('AirPassengers.csv')
#read_csv 從文件、URL、文件型對象中加載帶分隔符的數據。默認分隔符為逗號
passengers_data.shape


(144, 2)

144個數 兩列

求NumPassengers這列數的平均數
passengers_data['NumPassengers'].mean() 
280.29861111111109

求NumPassengers這列數的方差

passengers_data['NumPassengers'].var() 
14391.917200854699

求NumPassengers這列數的中位數

passengers_data['NumPassengers'].mean()
280.29861111111109
fig = plt.figure(figsize = (6, 3), dpi = 100)
x = passengers_data['NumPassengers']
ax = fig.add_subplot(111)
ax.hist(x , bins = 50, color = 'red', alpha = 0.8, rwidth = 0.9, normed = False)
plt.grid(True)
plt.title('passenger')
plt.show()

用plt的figure函數新建繪圖,并定義為fig。
定義X為weight_data中weight列的數據。
用fig畫圖,并名為ax,(111)就是顯示在矩陣塊的1行1列的第1塊,也就是1塊白板吧。
定義柱子有15根。
用hist函數顯示ax繪圖,x是橫軸數據,15根藍色柱子,寬度為0.9。
plt命名為weight。
用show函數顯示結果

var是方差,std 是偏差

123.png

結果分析

數據集的平均值是280;方差是14391波動性很大;
數據集字啊100~200較為穩定;200之后波動性很大
400之后呈促步下降的趨勢
偏差較大的地方為:(1)沒有<100的次數;
(2)>600的數據;(3)在230時頻數最大


[參考小春玉子-有詳細的注釋](http://www.lxweimin.com/p/cc3b5d76c587)


[點社群-共創課程系列](http://www.lxweimin.com/c/9b4685b6357c)
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容