未標記樣本 在現實任務中,會出現一部分樣本被標記而另一部分樣本未被標記的情況,那么如何利用好未標記樣本數據呢?主動學習:先用標記好的樣本數據來進行訓練,然后利用訓練出的學習器...
基礎知識 計算學習理論是機器學習的理論基礎,其目的是分析學習任務的困難本質,并根據分析結果指導算法設計。例如:在什么條件下可進行有效的學習,需要多少訓練樣本能獲得較好的精度等...
子集搜索與評價 特征選擇:在屬性集中可能存在無用的屬性,即對結果判斷不重要的屬性,被稱為“無關特征”,而有用的屬性被稱為“相關特征”,而從特征集合中選擇出相關特征子集的過程,...
k近鄰學習 kNN學習是一種常用的監督學習方法。 工作機制給定測試樣本,基于某種距離度量找出訓練集中與其最靠近的k個訓練樣本,然后根據這k個“鄰居”的信息來進行預測。對于kN...
貝葉斯分類器是一類分類算法的總稱,是各種分類器中分類錯誤概率最小的分類器,而貝葉斯定理是這類算法的核心。 貝葉斯決策論 貝葉斯決策論是概率框架下實施決策的基本方法,而貝葉斯分...