【7%】100小時(shí)機(jī)器學(xué)習(xí)——K近鄰法

總目錄鏈接

K近鄰法(K-NN,k-NearestNeighbor)

前言

什么是KNN

K-NN是一種簡(jiǎn)單且最常用的分類(lèi)算法,可以應(yīng)用于回歸計(jì)算。K-NN是無(wú)參數(shù)學(xué)習(xí),這意味它不會(huì)對(duì)底層數(shù)據(jù)的分布做出任何假設(shè),它是基于實(shí)例并在一個(gè)有監(jiān)督的學(xué)習(xí)環(huán)境中使用。我們的算法沒(méi)有顯示的模型,它選擇的是記憶訓(xùn)練實(shí)例。

K-NN算法工作原理

KNN用于分類(lèi)時(shí)的輸出結(jié)果是一個(gè)類(lèi)別,這種方法有三個(gè)關(guān)鍵元素:
· 一組標(biāo)記的對(duì)象
· 對(duì)象之間的距離
·k的值-最近鄰的數(shù)量


kNN分類(lèi)原理

KNN分類(lèi)

要對(duì)未標(biāo)記的對(duì)象進(jìn)行分類(lèi),則會(huì)計(jì)算出該對(duì)象對(duì)標(biāo)記的對(duì)象之間的距離(最常用的是歐氏距離),確定其k近鄰點(diǎn),然后使用周邊最多的最近鄰點(diǎn)的類(lèi)標(biāo)簽來(lái)確定該對(duì)象的類(lèi)標(biāo)簽。

歐氏距離

其他常見(jiàn)的距離度量方法包括:
· Hamming Distance(漢明距離)
· Manhattan Distance (曼哈頓距離)
· Minkowski Distance (閔氏距離)

K的取值

求K的值并不容易。K值較小意味著噪聲會(huì)對(duì)結(jié)果產(chǎn)生較大影響,而K值較大會(huì)使得計(jì)算成本變高。有些情況下最好是遍歷每個(gè)可能的K值,然后根據(jù)自己的實(shí)際來(lái)選擇K值。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容