線性回歸是我們接觸得最早的一種回歸,只是當時他的名字不叫線性回歸,當時可能說的是線性擬合。
Y=aX+b+e
沒有看錯,就是這貨,一元線性回歸。
這里Y是連續變量,a和b是參數,e是誤差,X是自變量。
求解參數我們需要求得最小的e,這里我們采用的是最小化平方和誤差,(y實際值-y估計值)^2。
多元線性回歸如字面上的意思,有多個自變量(至少2個自變量)。
標準線性回歸公式:
敲黑板,劃重點
線性回歸123:
- 自變量和因變量之間要有線性關系才能用線性回歸
- 線性回歸對異常值非常敏感,分析之前可以用箱線圖看看或用其他途徑剔除異常值。
- 多元線性回歸存在多重共線性、自相關性和異方差性
- 多重共線性會增加系數估計值的方差,導致系數估計值不穩定