背景介紹
“回歸”一詞在統計領域是弗朗西斯·高爾頓在研究父母身高和子女身高的關系時引入的。高爾頓發現:盡管存在父母高子女也高,父母矮子女也矮的趨勢(個體角度),但是觀察總樣本的話,父母異常高(矮)子女雖然可能也高于(低于)人口平均水平,但比父輩矮(高),呈向平均水平靠攏的趨勢,而不是向2個極端發散的趨勢。希爾頓描述為兒輩的身高回歸到中等身高。“回歸”由此而來。
什么是回歸
在今天,回歸是研究因變量對自變量的依賴關系的一種統計分析方法,更側重的是研究方法而不是回歸的字面意義。我們一般通過回歸分析,來研究變量之間的相關關系。
回歸的特點
- 指示自變量和因變量之間的顯著關系(是否相關)
- 指示多個自變量對一個因變量的影響強度(參數)
回歸的作用
1.挑選與因變量相關的自變量(由特點1來)
2.描述因變量與自變量之間的關系強度(由特點2來)
3.生成模型,通過自變量來預測因變量(定義本身)
應用場景