【機器學習基礎】核邏輯回歸

將軟間隔支持向量機看做正則化模型

上一小節中我們介紹了軟間隔支持向量機，該模型允許有錯分類數據的存在，從而使模型對數據有更好的適應性，有效避免過擬合的問題。
現在我們回顧一下松弛變量ξn，我們用ξn來記錄違反分類邊界的數據到邊界的距離。

我們可以從另外一個角度，考慮一下ξn的計算：
對于任何一個點，如果該點違反了邊界，那么ξn記錄了其到邊界的距離；如果沒有違反，ξn為0。

所以我們可以用下面這個式子來表示：

與正則化模型的比較

在正則化中，我們用w的長度來控制復雜度，并且我們希望某個誤差度量最小。所以對于軟間隔支持向量機來說，你可以把它看成是這種正則化的一種形式。

那么我們為什么不從正則化的角度來介紹SVM呢？

原因：
首先如果以正則化的角度看待SVM，那么這就不能使用二次規劃的方式來求解，這樣就不能使用核技巧來解決對偶問題
其次，max(·,0)這個誤差函數可能沒有辦法進行微分，比較難以求解

SVM和正則化

正則化做的事情是，其想讓Ein變小，但是在其上使用w的長度作為控制的條件。
而硬間隔SVM是在把Ein當做是條件，要求模型一定要將數據正確的分開，并且希望w的長度越小越好。
如果看一般的L2正則化，則是如下的形式：

所以，最大間隔就是一個正則化的實現形式，它代表了可以找到較少的超平面。
參數C比較大的時候，對應比較小的λ，就代表了越小的正則化。

小結

我們已經介紹完了SVM，但是我們想將SVM延伸到其他問題上，比如邏輯回歸的問題上，那么我們需要知道SVM和其他問題的關系，這樣才能將它靈活的運用。

使用SVM來求解邏輯回歸問題

第一步：比較SVM中誤差函數和邏輯回歸的交叉熵誤差

下面我們將SVM中誤差函數、邏輯回歸的交叉熵誤差和0/1誤差畫在同一圖像中：

我們可以看出SVM中誤差函數和邏輯回歸的交叉熵誤差都是0/1誤差的上限函數，而且SVM的誤差函數還是一個凸上限函數。
我們可以發現SVM中誤差函數和邏輯回歸的交叉熵誤差是很相像的。
下面是這兩個誤差函數的比較：

于是，我們可以猜想，SVM相當于做L2正則化的邏輯回歸問題。

第二步：用SVM做二元軟分類來得到類別概率

根據上面的式子，我們首先使用SVM計算一個分數，得到w。然后再加上兩個自由度，將這個分數乘上放縮因子A，加上平移因子B，這樣比較符合邏輯回歸中最大似然的需求。從幾何意義上來講，我們通過SVM計算得到分割線的法向量，然后再進行一些平移和放縮的微調，使之能更加吻合最大似然的要求。這是一個融合SVM和邏輯回歸的方式。
如果SVM做的足夠好的話，A的值應該大于0，而B的值應該很接近0。

下面是新的邏輯回歸的式子：

這個式子第一階段用SVM得到的一個分數，這個分數也可以看做是做完SVM后得到的一個特別的轉換，相當于從多維轉到一維的轉換。
在第二階段相當于求解的是單一維度的邏輯回歸問題。

這個算法流程敘述如下：

這個方法是使用核SVM得到Z空間中的邏輯回歸的近似解。

核邏輯回歸

在SVM中，我們要解的是一個二次規劃問題，然后可以到處對偶的式子，我們使用核技巧來求解高維向量的內積。
然而，在邏輯回歸中，壓根就不存在二次規劃問題，那么我們該怎么去使用核技巧呢？
我們在計算中用到了w和z的內積，如果w可以表示成z的線性組合，當w和z求內積的時候，我們就可以用核技巧來計算z和z的內積了。

表示定理(Representer Theorem)

如果你求解的是L2-regularized的問題，那么一定有一個最好的w可以表示成z的線性組合：

如何來證明這件事情呢？
我們將w分成兩個部分，分別為w的平行部分（由zn展開的那個空間的向量來構成）和w的垂直部分（與zn展開表示的向量垂直的向量）。
我們希望最后完全沒有w的垂直部分。
將最優的那個w與zn相乘其實和w的平行部分和zn相乘得到的結果是一樣的，因為w的垂直部分與zn相乘為0，所以得到的err是一樣的。
對于最佳解wTw，其包含w的平行部分的平方和w的垂直部分的平方，如果使用反證法，假設w的垂直部分不是0，那么，wTw必將大于w的平行部分的平方，但是最小解wTw卻比w的平行部分的平方還大，這與我們的假設是矛盾的，所以就證明了w的垂直部分為0。
這樣就證明了w的最佳解可以被z線性表達。

通過上面的證明，我們知道只要是求解L2的線性模型，就可以使用核技巧。

將核技巧用于L2正則化的邏輯回歸

我們先得到要求解的表達式，然后用zn和βn的線性組合的方式表示最佳的w，代入到原始的式子中，就可以通過求βn代替求w了。

這就得到了一個沒有約束條件的最佳化問題，我們可以通過梯度下降的方法來求解βn。這就是核邏輯回歸問題。

核邏輯回歸的另一種解釋

在之前的介紹中，我們將核邏輯回歸看做是w的線性模型，這個w的線性模型作用于使用核技巧進行的轉換之中的數據，還使用了L2正則項。
而另一種視角是，我們可以將K(xm,xn)當做是一種數據的轉換，在轉換后的數據(K(x1,xn),K(x2,xn),...,K(xN,xn))加以β的權重。
將前面一項寫作矩陣形式βT* K *β可以看做是β和β的乘積，也相當于一種正則項。
這樣核邏輯回歸就可以看做是β的線性模型，作用于使用核函數轉換之后的數據和一個核正則項。

轉載請注明作者Jason Ding及其出處
GitCafe博客主頁(http://jasonding1354.gitcafe.io/)
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.lxweimin.com/users/2bd9b48f6ea8/latest_articles)
百度搜索jasonding1354進入我的博客主頁

最后編輯于：2017.11.27 02:24:13

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 229,836評論 6贊 540
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 99,275評論 3贊 428
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 177,904評論 0贊 383
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,633評論 1贊 317
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 72,368評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,736評論 1贊 328
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,740評論 3贊 446
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,919評論 0贊 289
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 49,481評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 41,235評論 3贊 358
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,427評論 1贊 374
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,968評論 5贊 363
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,656評論 3贊 348
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 35,055評論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,348評論 1贊 294
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 52,160評論 3贊 398
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 48,380評論 2贊 379

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

【機器學習基礎】核邏輯回歸

【機器學習基礎】核邏輯回歸

將軟間隔支持向量機看做正則化模型

與正則化模型的比較

SVM和正則化

小結

使用SVM來求解邏輯回歸問題

第一步：比較SVM中誤差函數和邏輯回歸的交叉熵誤差

第二步：用SVM做二元軟分類來得到類別概率

核邏輯回歸

表示定理(Representer Theorem)

將核技巧用于L2正則化的邏輯回歸

核邏輯回歸的另一種解釋

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

【機器學習基礎】核邏輯回歸

將軟間隔支持向量機看做正則化模型

與正則化模型的比較

SVM和正則化

小結

使用SVM來求解邏輯回歸問題

第一步：比較SVM中誤差函數和邏輯回歸的交叉熵誤差

第二步：用SVM做二元軟分類來得到類別概率

核邏輯回歸

表示定理(Representer Theorem)

將核技巧用于L2正則化的邏輯回歸

核邏輯回歸的另一種解釋

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频