描述性統計分析之離中趨勢分析
離中趨勢是指一組數據中各數據值以不同程度的距離偏離其中心(平均數)的趨勢,又稱標志變動度。主要靠全距、四分差、平均差、方差、標準差等統計指標來研究數據的離中趨勢。離中趨勢指標是用來綜合反映數據的離中程度的一類指標。
(1)全距(極差)
極差=最大變量值-最小變量值,組距數列極差可近似值為:極差=最大組的上限-最小組的下限。優點:計算簡便,含義清楚;缺點:沒有考慮到中間變量值的變動情況,測定離中趨勢時不準確。
(2)分位差
是從一組數據中剔除了一部分極端值之后重新計算的類似于極差的指標。常用的有四分位差、八分位差和十分位差等。
四分位差=(第三個四分位數-第一個四分位數)/2
(3)平均差
是數據組中各數據值與其算術平均數離差絕對值的算術平均數。平均差異大,表明各標志值與算術平均數的差異程度越大,該算術平均數的代表性就越小;平均差越小,表明各標志值與算術平均數的差異程度越小,該算術平均數的代表性就越大。平均差是總體所有單位與其算術平均數的離差 絕對值的算術平均數。因離差和為零,離差的平均數不能將離差和除以離差的個數求得,而必須講離差取絕對數來消除正負號。平均差是反應各標志值與算術平均數之間的平均差異。
a.普通平均差計算:b.加權平均差計算:
b.加權平均差計算:
(4)方差
方差是數據組中各數據值與其算術平均數離差平方的算術平均數。方差的平方根就是標準差。
方差:
標準差: