2019-04-09
1. 線性回歸 (L2-norm)
目標函數:
最優解:
2. 非線性 && 拉伸函數
擬合目標為非線性,例如真實分布如下:
則在用線性模型擬合時,應考慮將一維 “拉伸”為二維向量,即對于每個樣本特征從一個標量
變換為二維向量
。
稱為拉伸函數。
假設N個訓練樣本,記,即對每個樣本特征進行拉伸后的結果。那么最優解為 (式2-2):
實際上對于不同任務找到合適的拉伸函數幾乎是不可能的。所以為了避開這樣的尋找過程,引入“核方法”的技巧。
3. 基本的核方法
(如果沒有“核方法”的話,我們要找到合適的拉伸函數,然后還要計算高維向量的內積, 如式2-2)
我們首先把這樣的向量內積計算表示為:
便是所謂的核函數。線性模型的表達式為:
依據式2-2,可以表示為
(因為都是線性組合?),結合矩陣乘法
可表示為:
其中.
所以,
下面求未知向量,記
,有
有上式對于的偏導等于
可得:
計算得:
4. 小結
應對場景,選用不同得,可以在訓練集上計算好
,就可以構建如下核化的線性模型:
其中為第
個訓練樣本,
為測試的輸入輸出對。