數據挖掘必須建立在原有的訓練集上得出算法模型,
然后再通過測試數據,對算法模型進行評估、檢測。
但是對于車站分類這回事情,好像沒有原始的訓練集給你,也就是說,沒有已經分好的a/b/c/d/e等等。那我們應該如何去分類呢?
—————————————我是可愛的分割線——————————————
前面所述的需要訓練集得出算法模型的方法,屬于數據挖掘的分類一支。
而數據挖掘包羅萬象。
其中聚類也屬于數據挖掘。
而聚類,它就不需要這種原先的數據集了。
在聚類中,我們可以盡可能地找出數據之間的相似性進行聚類劃分。這也是可以的。