Multiclass Classification
之前討論的都是2個類別的分類問題,但是大部分其實都不是布爾分類,如何使用邏輯回歸 (logistic regression) 來解決多類別分類問題是通過一個叫做"一對多" (one-vs-all)或者一對余 (one-vs-rest) 的分類算法來實現的
其原理很簡單也很弱智,可以將數據集一分為二,為正類和負類,用一對多的分類思想 我們可以將其用在多類分類問題上。
比如有三個類別,我們就可以把它分成三個二元分類問題。
對于每一個類別,將其視為正類,將其他的所有類別視為負類,這樣可以得到三個邏輯回歸分類器,(因為分類器本來算的就是某種類別發生的概率,所以我們只需要關注這種類別,而將其他類別視為多余的(一對余)即可)
所以每種情況都會對應一個新的分類器,當有新的x值輸入進的時候,我們需要將x帶入三個分類器中,選擇分類器h(x)
求得數據最大的那個值的那個分類器,就是可信度最高最好的。我們預測y(實際值)就是那個值。(因為h(x)的值相當于在給定x的情況下,出現在各分類的概率,最高的h(x)就是最有可能在這個類別。)