【機器學(xué)習(xí)基礎(chǔ)】非線性變換

引言

在之前介紹的分類問題中,所涉及的分類的模型都是線性的,在非線性變換這一節(jié)中,我們將模型延伸到非線性的情況下來進(jìn)行數(shù)據(jù)的分類。

二次假設(shè)(Quadratic Hypotheses)


我們看到上面的例子,在左圖中,圓圈和紅叉的數(shù)據(jù)無法用一條直線將其分成兩類,那么這這個例子中,我們其實可以用一個大圓圈將數(shù)據(jù)分類,所以現(xiàn)在我們考慮假設(shè),該假設(shè)hSEP(x)是一個過原點的圓圈,這啟示我們可以用系統(tǒng)化的方法結(jié)合之前我們學(xué)習(xí)的線性分類的方法,來解決更加廣泛的問題。
還是拿上面的這個圓圈的Φ假設(shè)為例,h(x)=sign(0.6· 1 + (-1) ·x1^2 + (-1) ·x22)。我們令w0=0.6,w1=-1,w2=-1;而z0=1,z1=x12,z2=x2^2。通過這種方式我們就可以將之前的h(x)變化成sign(wT * z),這個熟悉的形式就是我們之前學(xué)習(xí)的線性分類的形式,我們唯一做的不同的事情就是將之前的x的空間轉(zhuǎn)換成新的z的空間。我們把x空間的每一個點轉(zhuǎn)換到z空間的每一個點的過程稱作特征轉(zhuǎn)換(Feature Transform)。這里值得一提的是,x空間里用二次假設(shè)可分的情況,可以得到在z空間的 線性可分,但是反過來則不可以,因為在z空間里的直線不見得在x空間里都是正圓形,還有可能是雙曲線之類的二次曲線,所以在z空間使得數(shù)據(jù)線性可分的直線對應(yīng)x空間的特定的曲線。

我們可以考慮一個更加廣泛的二次假設(shè),這個假設(shè)是使得在z空間里讓數(shù)據(jù)線性可分的假設(shè),那其中的轉(zhuǎn)換函數(shù)如下圖定義。

非線性變換(Nonlinear Transform)

我們可以總結(jié)這個非線性轉(zhuǎn)換的步驟,即先通過Φ(x)將x空間的點轉(zhuǎn)換成z空間的點,而在z空間上得到一個線性的假設(shè),再恢復(fù)到原來的x空間中得到一個二次的假設(shè)(這個反運算的過程不一定存在)。



其實這個特征轉(zhuǎn)換是非常重要的,比如在手寫數(shù)字分類的案例中,我們將原始的像素的特征數(shù)據(jù)轉(zhuǎn)換到更加具體的、具有物理意義的特征上去,進(jìn)而進(jìn)行分類的求解。這個例子其實就是在新的特征空間中做線性分類,而對于原始的像素空間里其實是一個非線性的假設(shè)。


非線性變換的代價(Price of Nonlinear Transform)

計算/存儲的代價(Computation/Storage Price)

現(xiàn)在我們考慮一個很一般化(general)的非線性變換,將剛才的二次變成Q次的多項式轉(zhuǎn)換。



我們用d來表示在z空間的維度,我們需要得到d維的不同的組合方法,復(fù)雜度是O(Q^d)。
這個數(shù)字代表我們需要這樣的計算復(fù)雜度來計算Φ(x)變換、計算參數(shù)w(因為一些訓(xùn)練算法的時間復(fù)雜度和數(shù)據(jù)的維度是有關(guān)的),還有存儲w的話也需要付出代價。


模型復(fù)雜度(Model Complexity Price)

我們知道這個z空間的模型的參數(shù)是1+d個,這個相當(dāng)于是z空間的vc維,所以當(dāng)Q變大的時候,vc維也變大了。


泛化問題(Generalization Issue)

我們再回到機器學(xué)習(xí)的一個基本都是平衡折中問題上,如果d(Q)大的時候,我們可以讓Ein很小,但是這會導(dǎo)致Ein和Eout差別很大;當(dāng)d(Q)小的時候,可以使得Ein和Eout差別小,但是又不能保證Ein很小。


結(jié)構(gòu)化的假設(shè)集合(Structured Hypothesis Sets)

現(xiàn)在我們把多項式的變換做一個遞歸式的定義,先定義0次的變換,再定義1次的變換,其中包括之前的0次變換和所有的一次式,以此類推,Q次的變換包含之前的Q-1次的變換和所有的Q次式。



上面的定義中,因為每個變換都包含了前面的變換,即前面的變換是后面變換的一個特例。從假設(shè)集合的角度,復(fù)雜的變換對應(yīng)的假設(shè)集合是包含相對簡單的變換對應(yīng)的假設(shè)集合。



有了之前復(fù)雜度不同的假設(shè)集合的包含關(guān)系,可以得到以下的關(guān)系,即vc維隨著假設(shè)集合的數(shù)量越累越多而變得越來越大,而Ein隨著這些假設(shè)集合中的選擇越來越多而呈下降的趨勢。

這個關(guān)系如下圖所示,這告訴我們一個高維度的變換因為付出了很大的模型復(fù)雜度,所以會使得Eout和Ein偏離較遠(yuǎn)。那么,在未來的模型選擇中,可以首先選擇線性的模型,因為線性模型簡單、有效、安全并且工作效果好。


轉(zhuǎn)載請注明作者Jason Ding及其出處
Github主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.lxweimin.com/users/2bd9b48f6ea8/latest_articles)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,182評論 6 543
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,489評論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,290評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,776評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 72,510評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,866評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,860評論 3 447
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 43,036評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,585評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 41,331評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,536評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,058評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,754評論 3 349
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,154評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,469評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,273評論 3 399
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 48,505評論 2 379

推薦閱讀更多精彩內(nèi)容