復(fù)習(xí)一些數(shù)據(jù)名詞(筆記)

有時候莫名其妙的術(shù)語真是妨礙知識普及(比如naive哪里看出能翻譯成樸素)。。。書本知識經(jīng)常復(fù)習(xí)很有必要(而且應(yīng)用場景會自己跳出來,把高深的詞變得很接地氣,也很有槽點(diǎn))。

時間序列

一階差分,就是把序列的兩個緊鄰數(shù)據(jù)的間隔作為一個新的序列,也就是把13579變成2222。

一階差分可以把一部分非平穩(wěn)序列轉(zhuǎn)化到平穩(wěn)序列,222還真是平穩(wěn)多了。。。

這就是可以arima的時間序列,總覺得學(xué)到了假的。


聚類和離群

"相似"的計算方法是歐式距離或角度距離(余弦),對應(yīng)前幾天隨筆寫的極坐標(biāo)也是坐標(biāo),所以角度距離和歐式距離完全是一個東西。

"密集"的計算方法是最近的若干個鄰近點(diǎn)平均距離的倒數(shù),或給定距離半徑內(nèi)鄰近點(diǎn)的數(shù)量。基本還是距離。


數(shù)值規(guī)范(去量綱)

最簡單的方法是減平均數(shù)(或中位數(shù))再除標(biāo)準(zhǔn)差,思想和差分類似,作用就是把大家湊到差不多的范圍。。。。


特征的提取

用白話就是把已經(jīng)非常相關(guān)的多余內(nèi)容合并,減少列數(shù),壓縮的思想(名叫降維,怕了吧,三體看過不)。順便,小波略有不同,嗯研究一下再寫。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容