from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0],
[4, 2], [4, 4], [4, 0]])
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
kmeans.labels_
kmeans.predict([[0, 0], [4, 4]])
kmeans.cluster_centers_
X = np.array([[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]])
X應看作是有六個元素的集合,每個元素的信息是用二維表示的
然后通過kmeans生成一個分類器,生成分類器的標志是fit()函數
然后可以拿數據去預測。
這是一般通用的要走的流程
但是kmeans要預測的就是自己本身,所有可以有另一種寫法
y_pred = [KMeans](n_clusters=3, random_state=random_state).fit_predict(X_aniso)
返回的就是要分類的數據自己的結果,結果是一個由0、1、2組成的集合