降維與度量學習

1.kNN算法:給定測試樣本,基于某種距離度量,找出訓練集中與其最近靠近的k個訓練樣本,然后基于這k個鄰居的信息進行預測.通常分類任務中,使用“投票”法;回歸任務中,使用“平均”法。

2.維數災難(curse of dimensionality):高維情形下,數據樣本稀疏、距離計算困難。

3.降維(dimension reduction)。pca一種降維方法。

4. root mean square error(RMSE):a typical performance measure for regression problems.

5. sklearn.preprocessing.OneHotEncoder:a OneHotEncoder encoder converts integer categorical values into to one-hot vectors。

6. feature scaling:min-max scaling、standardization。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容