探索性分析是一種對資料的性質、分布特點等完全不清楚的時候對變量進行更加深入研究的描述性統計方法。
案例
根據已有天津、濟南兩座城市2007年各月份的平均氣溫。對天津平均氣溫和濟南平均氣溫進行探索性統計分析。
數據來源
SPSS統計分析與行業應用案例詳解+配套光盤+示例>02>正文>原始數據>案例2.3;
數據分析
執行analyze/descriptive statistics/explore
將“平均氣溫”置于“dependent list”;
將“城市”置于“factor list”;
將“月份”置于“label cases by”,ok即可
描述性統計分析
上述的分析結果呈現的是兩個城市天期的基本情況,以濟南為例,包括12個樣本的平均數M=15.03,SD=9.62;最大值MAX=26.60,MIN=0.00,MID=15.35等。
探索性分析中還有一個莖葉圖
莖葉圖中的莖代表數值的整數部分,葉代表數值的小數部分,實際數值=(莖+葉)*莖寬;
以濟南為例:有2個數,整數部分是0,小數部分分別為0和2的值,也就是0.00和0.20,實際數值為0.00和2.00;
有3個數,整數部分是0,小數部分分別為7,8,8,也就是0.7,0.8,0.8,實際數值為7,8,8;
以此類推,實際上統計的結果就是14,16,21,23,25,26,26;這有助于直接看出溫度偏高或是偏低。
可以看到天津的平均氣溫(M=13.62;SD=10.98)要比濟南的平均氣溫(M=15.03;SD=9.62)相對來說低一點。
箱圖
箱圖旨在用不同的形式呈現結果,可以看到:天津的平均氣溫要比濟南低一點,同時變化相對來說也大一點。
數據來源為楊維忠老師的“SPSS統計分析與行業應用案例詳解”,僅做分析之用。