數(shù)據(jù)挖掘必須建立在原有的訓(xùn)練集上得出算法模型,
然后再通過(guò)測(cè)試數(shù)據(jù),對(duì)算法模型進(jìn)行評(píng)估、檢測(cè)。
但是對(duì)于車(chē)站分類這回事情,好像沒(méi)有原始的訓(xùn)練集給你,也就是說(shuō),沒(méi)有已經(jīng)分好的a/b/c/d/e等等。那我們應(yīng)該如何去分類呢?
—————————————我是可愛(ài)的分割線——————————————
前面所述的需要訓(xùn)練集得出算法模型的方法,屬于數(shù)據(jù)挖掘的分類一支。
而數(shù)據(jù)挖掘包羅萬(wàn)象。
其中聚類也屬于數(shù)據(jù)挖掘。
而聚類,它就不需要這種原先的數(shù)據(jù)集了。
在聚類中,我們可以盡可能地找出數(shù)據(jù)之間的相似性進(jìn)行聚類劃分。這也是可以的。