第二次數據分析作業----做出一組數據的直方圖

在余博士的教材指導下,終于完成了python的環境設置,非常感謝余博士。
在把代碼打進去,直方圖出現的那一刻真的好興奮,終于學會用python做直方圖了,用python做比excel快多了。真的沒錯,編程是每個人該學會的技能。

言歸正轉,下面是作業:

  1. 一組人的體重
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
weight_data=pd.read_table('weight.txt')
weight_data.shape
(80, 1)
80個樣本數據,一行
#求均值

weight_data['weight'].mean()
50.7
#求方差

weight_data['weight'].var()
39.27594936708859
fig=plt.figure()
x=weight_data['weight']
ax=fig.add_subplot(111)
numBins=15
ax.hist(x,numBins,color='blue',alpha=0.8,rwidth=0.9)
plt.title(u'weight')
plt.show()
Paste_Image.png

分析:

(1)樣本是80個人的體重
(2)平均體重是50.7kg
(3)這群人的體重偏離平均體重39.27kg
(4) 體重集中在45kg-50kg的人數最多

  1. 樣本是49年至60年每個月的乘客數量
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
passengers_data = pd.read_csv('AirPassengers.csv')
passengers_data.shape

#read_csv 從文件、URL、文件型對象中加載帶分隔符的數據。默認分隔符為逗號
(144, 2)

144個數據,2行

#求NumPassengers這列數的平均數

passengers_data['NumPassengers'].mean()
280.2986111111111
#求NumPassengers這列數的方差

passengers_data['NumPassengers'].var()
14391.917200854701
fig = plt.figure()
x = passengers_data['NumPassengers']
ax = fig.add_subplot(111)
ax.hist(x , bins = 20, color = 'blue', alpha = 0.8, rwidth = 0.9)

plt.title('passenger')
plt.show()
Paste_Image.png

分析:

(1)樣本是49年至60年這12年144個月每個月的乘客數量
(2)12年來每個月乘座飛機的平均人數是280人
(3)由于時間維度比較長,歷史背景條件不一樣,所以這組數據的波 動比較大,方差是14391
(4)每個月出行人數最多是100至200之間,500-600最少
(5)這組數據這樣做直方圖太籠統了,很想按年和月做直方圖,可惜現在還不會,等以后學了再做吧。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容