交叉驗證(CrossValidation)方法思想是為了在不動用測試集之前,就評估一下模型是否過于復雜而引起過度擬合
過擬合:為了得到一致假設而使假設變得過度嚴格稱為過擬合。避免過擬合是分類器設計中的一個核心任務。
常見的交叉驗證方法有
- Hold-Out Method
- K-fold Cross Validation(記為K-CV)
- Leave-One-Out Cross Validation(記為LOO-CV)
k-folder cross-validation:k個子集,每個子集均做一次測試集,其余的作為訓練集。交叉驗證重復k次,每次選擇一個子集作為測試集,并將k次的平均交叉驗證識別正確率作為結果。
參考文章: