線性回歸是最常見的統計建模方法之一,本節將向大家介紹 Scikit-Learn 中線性回歸工具的使用方法,以及一些常用的操作技巧。
首先,我們導入需要用到的其他工具庫,并對構建的示例數據進行展示:
1
2
可以看到,這些隨機樣本的兩個特征在二維空間中表現為較明顯的正相關關系:
通過導入 Scikit-Learn 的 LinearRegression 函數,我們可以很輕松地構建一個線性回歸模型,模型的構建過程及擬合效果如下:
4
5
我們可以通過模型對象的 coef_ 和 intercept_ 屬性查看回歸曲線的斜率與截距:
7
當存在多個自變量時,線性回歸模型將會默認地擬合估計截距與自變量相對應的回歸系數數組:
8
在前幾節中我們曾經談到過, Scikit-Learn 中的 PolynomialFeatures 函數可以幫助我們生成自變量 x 的冪,從而方便我們構建多項式線性回歸:
9
未完待續:課程內容較多,請復制鏈接通過電腦學習,獲得最佳學習效果。 http://datacademy.io/lesson/141
更多課程和文章盡在微信號:「datartisan數據工匠」