聚類、分類

clustering

k-means法

API

>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
...               [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1.,  2.],
       [ 4.,  2.]])
批量 K-means 法 MiniBatchKMeans

API

相似性傳播 Affinity Propagation

API

適合中小型的數據集

均值漂移 MeanShift

API

回歸

用到的回歸類

regr = linear_model.LinearRegression()
線性回歸的多分類

例子

OvO 一對一

把類別兩兩配對,制造N(N-1)個分類器。所有分類器預測結果最重合的那個類別,即為此點的分類。

OvR 一對多

共有N個分類器,每個分類器把一個類別記為‘+’的,其他類別一塊記為‘-'的。預測時,若有一個分類器預測結果為+,則把它當做最終結果。

Paste_Image.png

OvO的存儲開銷比較大,時間開銷更小,由于用所有類別訓練,結果比一對多更準。

MvM 多對多

每個分類器對所有類進行劃分,分為-和+。有二元編碼和三元編碼,三元編碼多了個「停用類」。

方法稱作「糾錯輸出碼」EOOC。

這三個方法很難說出誰更強。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • Spring Cloud為開發人員提供了快速構建分布式系統中一些常見模式的工具(例如配置管理,服務發現,斷路器,智...
    卡卡羅2017閱讀 134,973評論 19 139
  • 一、實驗目的 學習使用 weka 中的常用分類器,完成數據分類任務。 二、實驗內容 了解 weka 中 explo...
    yigoh閱讀 8,638評論 5 4
  • 機器學習 經驗 數據 數據中產生模型model 的算法 學習算法 learning algorithm 數據集 d...
    時待吾閱讀 4,048評論 0 3
  • 由于昨晚的電閃雷明,狂風大作,村中停電了。 早晨,出門一看,門前一人粗的大楊村已連根拔出,斜斜的躺在路...
    王斐媽媽閱讀 159評論 0 1
  • update: 新版的豆瓣FM 竟然跟我畫的差不離! 好贊 以豆瓣為例 來聽歌 頂端有電臺信息 我要加心 往上滑 ...
    南不圖閱讀 419評論 0 2