線性回歸中引入核方法

2019-04-09

1. 線性回歸 (L2-norm)

目標函數:
L(w) = (Xw - y)^{T}(Xw - y) + \lambda w^{T}w
最優解:w = (X^{T}X + \lambda I)^{-1}X^{T}y

2. 非線性 && 拉伸函數

擬合目標為非線性,例如真實分布如下:
y = (x, x^{2})(w_1, w_2)^{T} + b
則在用線性模型擬合時,應考慮將一維x \in \mathcal X^{1} “拉伸”為二維向量,即對于每個樣本特征從一個標量x \in \mathcal X^{1}變換為二維向量\phi(x) = (x, x^{2}) \in \mathcal X^{2}\phi(.)稱為拉伸函數。
假設N個訓練樣本,記\Phi = \Phi(X) = (\phi(X_1), \phi(X_2), ..., \phi(X_N))^{T},即對每個樣本特征進行拉伸后的結果。那么最優解為 (式2-2):
w = (\Phi^{T}\Phi + \lambda I)^{-1}\Phi^{T}y
實際上對于不同任務找到合適的拉伸函數\phi(.)幾乎是不可能的。所以為了避開這樣的尋找過程,引入“核方法”的技巧。

3. 基本的核方法

(如果沒有“核方法”的話,我們要找到合適的拉伸函數\phi(.),然后還要計算高維向量的內積, 如式2-2)
我們首先把這樣的向量內積計算表示為:
\phi(X_i)^{T}\phi(X_j) = k(X_i, X_j)
k(., .)便是所謂的核函數。線性模型的表達式為:y = \phi(x)^{T}w = w^{T}\phi(x)

依據式2-2,w可以表示為w = \Phi^{T} \alpha(因為都是線性組合?),結合矩陣乘法w可表示為:
w = \Phi^{T} \alpha = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})
其中\alpha = (\alpha_{1}, \alpha_{2}, ... , \alpha_{n})^{T}.

所以,
y = w^{T}\phi(x) = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})^{T} \phi(x) = \sum_{i=1}^{N} \alpha_{n} k(X_i, x)

下面求未知向量\alpha,記K = \Phi\Phi^{T},有
L(w) = L(\Phi^{T} \alpha) = (\Phi \Phi^{T} \alpha - y)^{T}(\Phi \Phi^{T} \alpha - y) + \lambda (\Phi^{T} \alpha)^{T}(\Phi^{T} \alpha)
= (K\alpha - y)^{T}(K\alpha - y) + \lambda \alpha^{T} K \alpha
=\alpha^{T} (K^2 + \lambda K) \alpha - 2y^{T}K\alpha + y^{T}y
有上式對于\alpha的偏導等于0可得:
2(K^2 + \lambda K)\alpha -2yK = 0
計算得:\alpha = (K + \lambda I)^{-1} y

4. 小結

應對場景,選用不同得k(.,.),可以在訓練集上計算好K, \alpha,就可以構建如下核化的線性模型:
\hat{y} = w^{T}\phi(x) = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})^{T} \phi(x) = \sum_{i=1}^{N} \alpha_{n} k(X_i, x)
其中X_{i}為第i個訓練樣本,(x, \hat{y})為測試的輸入輸出對。

5. ....

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 原文章為scikit-learn中"用戶指南"-->"監督學習的第七節:Gaussian Processes"##...
    HabileBadger閱讀 18,609評論 0 9
  • 以西瓜書為主線,以其他書籍作為參考進行補充,例如《統計學習方法》,《PRML》等 第一章 緒論 1.2 基本術語 ...
    danielAck閱讀 4,579評論 0 6
  • 曾經的曾經,大家對保險代理人的負面評價不少: 愛吹牛,不務正業,騙人,潛規則等。三年前入行后,從原來的雞血...
    泰米姐姐閱讀 270評論 0 1
  • 今天兒子去上托輔,我也上班了!我在托輔里給兒子報了個練書法的班,希望能讓兒子能把字體寫的漂亮一點,從而養成寫好...
    郭錫厚媽媽閱讀 235評論 0 1
  • 最近入手這個火的不行的游戲機:switch,以及玩了火的不行的游戲:馬里奧(其實是借的),想聊聊感受。 不想寫測評...
    冰激凌女王閱讀 1,601評論 0 2