連載 | 機器學習基石 Lec 5:Growth Function & Break Point

Lec5：Training versus Testing

tips：符號含義參照Lec1

上一節中我們得到在一些條件下，learning is feasible！這一節我們將接著上一節探討在 M = | H | 無限大時是怎樣的？

learning實際可以分兩部分看待：

1）Ein（g）≈ 0：在in - sample上應該盡量小，這是在train時希望的事情。

2）Eout（g）≈ Ein（g）：Eout要和Ein接近，這是test階段希望的事情，在 Out -of -sample 上表現好才是目標！

1、Trade-off on M

上面的回顧說learning可以分為兩個問題：1）Eout是不是和Ein足夠接近？2）Ein是不是足夠小？

那么 M 跟這兩個問題有什么關系？

small M：1）yes！但 ?2）no！（選擇太少）；

large M：1）No！（P[Bad]幾率增加）但 ?2）yes！ ?

所以M太大太小都不好，trade off！當M無限大時顯然bad，那之前的PLA是不對的嗎？after 3 more lectures (；′⌒`)

我們要想辦法解決large M，甚至無限大M 。已知：

如果我們可以用一個有限的 mH 代替M，似乎就可以解決這個問題了。下面將從理論上說明這件事是可以的。

2、H的kind有限

先回想一下M從何而來的？級聯上限！通俗點講，霍夫丁不等式只能保證一個h遇到bad data的概率小，M個h遇到bad data的概率就乘以M，如果保證union bound小，這時候A就可以在H中隨意做選擇。但是M無限大時boom！這個“上限”是哪里有問題呢？

考慮 h1 ≈ h2的情況，union bound 時區別對待h1和h2，實際上并不需要加兩次霍夫丁，這就造成級聯上限over-estimating過度估計！這就是問題所在。為了解決這個問題，我們可以把類似的hypothesis分類。如何歸類？以perceptron為例，line的個數是無限多的，種類呢？

1個input時，x1，只有2種kind，一種是類似h1的，將x1劃分為+1；另一種是類似h2的，將x1劃分為-1.

2個input時，x1、x2，有4種kind，圈代表+1，叉代表-1，如下圖：

3個input時，x1、x2、x3，有8種kind，如圖：

到這你是不是覺得自己已經發現規律了，kind就是2的N方嘛！不要急，接著看3個input的情況，會一直有8個kind嗎？考慮三點共線的情況，實際上會有2個kind不存在，這時只有6個kind。此外，當input重疊時，kind也會小于2的N次方。

接著看有4個input的情況，x1、x2、x3、x4，會有16種kind嗎？

圖中只給出了8張圖，另外8張是跟此圖對稱的。其中一個kind無論如何都是實際不存在的，所以4個input的時候，最多14個kind。

把N個輸入時最多的kind數量叫做effective number of lines，有效數量 ≤ 2的N次方。無限多的lines的kind有限，如果可以用有限的有效數量取代M，并且effective（N）<<2的N次方，那么M無限大時learning is possible！下面證明這是可以的。

3、Growth Function

先來介紹個新名詞dichotomies，表示kind，在（x1，x2，...，xN）上，H包括所有的dichotomies.

不同的data，dichotomies的數量也會有不同，如上節3個輸入的情況。所以我們只考慮dichotomies的最大值，用m（H）表示，稱為“成長函數”growth function。

怎么計算成長函數？perceptron的較難計算，先看幾個簡單的例子：

1）positive rays：

h（x）= sign（x - a），實際就是1維的perceptron，mH（N）= N + 1，當N很大的時候，N+1 << 2的N次方；

2）positive intervals：

h（x）= +1 iff x∈[l，r），-1otherwise ，mH（N）= 1/2（N*N+N）+1，就是C N 2，從N個里面選兩個點，再加上全部是叉的情況。當N很大時，mH（N）H<<2的N次方。

3）convex sets：

平面上凸region的集合，下圖藍色部分就是一個convex region：

h（x）=+1 iff x in region，mH（N）= 2的N次方。why？對于N個輸入，不管哪些x為+1，我們都能做出一個凸多邊形將+1包括在內，-1排除在外，如下圖：

我們將mH（N）= 2的N次方的情況稱為 exist N inputs can be “shattered”！

小summary，這節有三個新名詞：dichotomies、growth function、shattered

4、Break Point

總結一下四個不同的成長函數：

如果我們要用成長函數取代M，m是多項式時，exp下降很快：good；m是指數型時，指數增長 * 指數下降exp，并不能確保bound小：bad.

那么perceptron的成長函數是指數的還是多項式的呢？下一章證明。在此之前再來介紹一個新名詞：break point！

如果mH（k）< 2的k次方，k就是一個break point . 而且k+1、k+2、k+3......都是break point！我們通常關心最小的那個break point k.如2維perceptron 最小的break point 是4。如果shattered，就沒有break point，如convex sets！

下一章我們將證明，如果有k，則mH（N）= O（N的k-1次方），即多項式。歡迎繼續關注~~~

【如果您堅持讀到了最后～就點個贊、打個賞激勵下吧，哈哈～】

最后編輯于：2017.12.04 05:59:21

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,786評論 6贊 534
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,656評論 3贊 419
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,697評論 0贊 379
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,098評論 1贊 314
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,855評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,254評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,322評論 3贊 442
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,473評論 0贊 289
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 49,014評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,833評論 3贊 355
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,016評論 1贊 371
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,568評論 5贊 362
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,273評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,680評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,946評論 1贊 288
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,730評論 3贊 393
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 48,006評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

連載 | 機器學習基石 Lec 5:Growth Function & Break Point

連載 | 機器學習基石 Lec 5:Growth Function & Break Point

Lec5：Training versus Testing

1、Trade-off on M

2、H的kind有限

4、Break Point

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

連載 | 機器學習基石 Lec 5:Growth Function & Break Point

Lec5：Training versus Testing

1、Trade-off on M

2、H的kind有限

4、Break Point

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频