【機器學習基礎】核邏輯回歸

將軟間隔支持向量機看做正則化模型

上一小節中我們介紹了軟間隔支持向量機,該模型允許有錯分類數據的存在,從而使模型對數據有更好的適應性,有效避免過擬合的問題。
現在我們回顧一下松弛變量ξn,我們用ξn來記錄違反分類邊界的數據到邊界的距離。



我們可以從另外一個角度,考慮一下ξn的計算:
對于任何一個點,如果該點違反了邊界,那么ξn記錄了其到邊界的距離;如果沒有違反,ξn為0。



所以我們可以用下面這個式子來表示:

與正則化模型的比較

在正則化中,我們用w的長度來控制復雜度,并且我們希望某個誤差度量最小。所以對于軟間隔支持向量機來說,你可以把它看成是這種正則化的一種形式。



那么我們為什么不從正則化的角度來介紹SVM呢?

原因:
首先如果以正則化的角度看待SVM,那么這就不能使用二次規劃的方式來求解,這樣就不能使用核技巧來解決對偶問題
其次,max(·,0)這個誤差函數可能沒有辦法進行微分,比較難以求解

SVM和正則化

正則化做的事情是,其想讓Ein變小,但是在其上使用w的長度作為控制的條件。
而硬間隔SVM是在把Ein當做是條件,要求模型一定要將數據正確的分開,并且希望w的長度越小越好。
如果看一般的L2正則化,則是如下的形式:


所以,最大間隔就是一個正則化的實現形式,它代表了可以找到較少的超平面。
參數C比較大的時候,對應比較小的λ,就代表了越小的正則化。


小結

我們已經介紹完了SVM,但是我們想將SVM延伸到其他問題上,比如邏輯回歸的問題上,那么我們需要知道SVM和其他問題的關系,這樣才能將它靈活的運用。

使用SVM來求解邏輯回歸問題

第一步:比較SVM中誤差函數和邏輯回歸的交叉熵誤差

下面我們將SVM中誤差函數、邏輯回歸的交叉熵誤差和0/1誤差畫在同一圖像中:



我們可以看出SVM中誤差函數和邏輯回歸的交叉熵誤差都是0/1誤差的上限函數,而且SVM的誤差函數還是一個凸上限函數。
我們可以發現SVM中誤差函數和邏輯回歸的交叉熵誤差是很相像的。
下面是這兩個誤差函數的比較:



于是,我們可以猜想,SVM相當于做L2正則化的邏輯回歸問題。

第二步:用SVM做二元軟分類來得到類別概率


根據上面的式子,我們首先使用SVM計算一個分數,得到w。然后再加上兩個自由度,將這個分數乘上放縮因子A,加上平移因子B,這樣比較符合邏輯回歸中最大似然的需求。從幾何意義上來講,我們通過SVM計算得到分割線的法向量,然后再進行一些平移和放縮的微調,使之能更加吻合最大似然的要求。這是一個融合SVM和邏輯回歸的方式。
如果SVM做的足夠好的話,A的值應該大于0,而B的值應該很接近0。



下面是新的邏輯回歸的式子:


這個式子第一階段用SVM得到的一個分數,這個分數也可以看做是做完SVM后得到的一個特別的轉換,相當于從多維轉到一維的轉換。
在第二階段相當于求解的是單一維度的邏輯回歸問題。

這個算法流程敘述如下:



這個方法是使用核SVM得到Z空間中的邏輯回歸的近似解。

核邏輯回歸

在SVM中,我們要解的是一個二次規劃問題,然后可以到處對偶的式子,我們使用核技巧來求解高維向量的內積。
然而,在邏輯回歸中,壓根就不存在二次規劃問題,那么我們該怎么去使用核技巧呢?
我們在計算中用到了w和z的內積,如果w可以表示成z的線性組合,當w和z求內積的時候,我們就可以用核技巧來計算z和z的內積了。


表示定理(Representer Theorem)

如果你求解的是L2-regularized的問題,那么一定有一個最好的w可以表示成z的線性組合:


如何來證明這件事情呢?
我們將w分成兩個部分,分別為w的平行部分(由zn展開的那個空間的向量來構成)和w的垂直部分(與zn展開表示的向量垂直的向量)。
我們希望最后完全沒有w的垂直部分。
將最優的那個w與zn相乘其實和w的平行部分和zn相乘得到的結果是一樣的,因為w的垂直部分與zn相乘為0,所以得到的err是一樣的。
對于最佳解wTw,其包含w的平行部分的平方和w的垂直部分的平方,如果使用反證法,假設w的垂直部分不是0,那么,wTw必將大于w的平行部分的平方,但是最小解wTw卻比w的平行部分的平方還大,這與我們的假設是矛盾的,所以就證明了w的垂直部分為0。
這樣就證明了w的最佳解可以被z線性表達。


通過上面的證明,我們知道只要是求解L2的線性模型,就可以使用核技巧。

將核技巧用于L2正則化的邏輯回歸


我們先得到要求解的表達式,然后用zn和βn的線性組合的方式表示最佳的w,代入到原始的式子中,就可以通過求βn代替求w了。



這就得到了一個沒有約束條件的最佳化問題,我們可以通過梯度下降的方法來求解βn。這就是核邏輯回歸問題。

核邏輯回歸的另一種解釋

在之前的介紹中,我們將核邏輯回歸看做是w的線性模型,這個w的線性模型作用于使用核技巧進行的轉換之中的數據,還使用了L2正則項。
而另一種視角是,我們可以將K(xm,xn)當做是一種數據的轉換,在轉換后的數據(K(x1,xn),K(x2,xn),...,K(xN,xn))加以β的權重。
將前面一項寫作矩陣形式βT* K *β可以看做是β和β的乘積,也相當于一種正則項。
這樣核邏輯回歸就可以看做是β的線性模型,作用于使用核函數轉換之后的數據和一個核正則項。


轉載請注明作者Jason Ding及其出處
GitCafe博客主頁(http://jasonding1354.gitcafe.io/)
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.lxweimin.com/users/2bd9b48f6ea8/latest_articles)
百度搜索jasonding1354進入我的博客主頁

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,836評論 6 540
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,275評論 3 428
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,904評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,633評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,368評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,736評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,740評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,919評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,481評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,235評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,427評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,968評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,656評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,055評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,348評論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,160評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,380評論 2 379

推薦閱讀更多精彩內容