統(tǒng)計(jì)學(xué)大體的分類。
1.描述性統(tǒng)計(jì):
假設(shè)有一大堆數(shù)據(jù),卻希望在不告訴別人所有數(shù)據(jù)的情況下,可以找一些指示性的數(shù)據(jù)來代表所有數(shù)據(jù),而無需將所有數(shù)據(jù)都說一次。
2.推斷性統(tǒng)計(jì):
運(yùn)用數(shù)據(jù)來對實(shí)物做結(jié)論, 假設(shè)從總體得到一些樣本,從分析這些樣本而推斷出總體。
集中趨勢
集中趨勢是屬于描述性統(tǒng)計(jì),也就是一組數(shù)據(jù)中最具有代表性的數(shù)據(jù),一般包括算術(shù)平均數(shù)(均值)、中位數(shù)、眾數(shù)。
均值(算術(shù)平均數(shù)):
所有數(shù)據(jù)之和除以數(shù)據(jù)的個(gè)數(shù)即為平均數(shù)
中位數(shù)
奇數(shù)時(shí),排在最中間的數(shù)就是中位數(shù);
偶數(shù)時(shí),排在中間的兩個(gè)數(shù)的算術(shù)平均數(shù)即為中位數(shù)。
眾數(shù)
一組數(shù)據(jù)中出現(xiàn)頻率最高的數(shù)即為眾數(shù);
如果一組數(shù)據(jù)中出現(xiàn)兩個(gè)相同頻率的眾數(shù),那么這叫雙眾數(shù);
如果一組數(shù)據(jù)中出現(xiàn)兩個(gè)以上相同頻率的眾數(shù),即為多眾數(shù);
雙眾數(shù)和多眾數(shù)會使數(shù)據(jù)模糊,所以一般不采用雙眾數(shù)或多眾數(shù)來查看集中趨勢。
離群值
與其它數(shù)很不一樣的數(shù)(比如特別大或者特別小),有此數(shù)時(shí),中位數(shù)和眾數(shù)比算術(shù)平均數(shù)更能體現(xiàn)該組數(shù)的集中趨勢。
有了平均數(shù)為什么還要中位數(shù)和眾數(shù)啦?
這三種計(jì)算方式都是為了看一組數(shù)據(jù)集中在那個(gè)數(shù)據(jù)的周圍(也就是集中趨勢的概念),因?yàn)槠骄鶖?shù)會受到一組數(shù)據(jù)中的太大或者太小的數(shù)據(jù)(離群值)的影響,而中位數(shù)和眾數(shù)則不會受到影響。