在很多研究中,我們需要的變量都不能或者不容易被直接測量,比如,假如我們要研究家庭環境和學校環境對學生成績的影響,我們要如何測量家庭環境和學校環境...

在很多研究中,我們需要的變量都不能或者不容易被直接測量,比如,假如我們要研究家庭環境和學校環境對學生成績的影響,我們要如何測量家庭環境和學校環境...
作者: 于餅喵閱讀時間:10min 有時我們需要將樣本按照特征分為不同的類,比如,金融機構需要根據客戶的特征將客戶劃分不同的等級,這時聚類算法可...
PCA用于信息壓縮,那么什么是信息呢?決策樹中,用熵代表信息,而在PCA中,用方差來衡量信息。 從高緯度的信息中提取主要信息,以此達到壓縮信息【...
15.1 時間序列--概念 15.1.1 概念 橫截面數據:在一個給定的時間點測量變量值 縱向數據:隨著時間的變化反復測量變量值 對時序數據的研...
15.4.1 平穩性(stationarity) 平穩的時間序列的性質不隨觀測時間的變化而變化【樣本時間序列所得到的擬合曲線在未來一段時間內仍能...
15.3 時間序列的預測 15.3.1 指數預測模型 單指數平滑 t+1預測值可以看成是第t期預測值和真實值的加權,也可以看成是第t期的預測值再...
日常工作中,一般我們自己使用python寫入數據時,會選擇txt、csv等文件格式,或者直接寫入數據庫,但是在幫別人寫外包爬蟲,或者職場中需要使...
項目簡述 上文【2020python數據分析項目:爬取某寶口紅數據&數據分析可視化(一)】對數據進行了收集、清洗以及從整體的角度進行分析,本文主...
項目簡述 馬云說:“未來最值錢的不是房子,也不是石油,而是數據”。阿里旗下的某寶,作為一個最大的電商平臺,其數據蘊含了巨大的價值,而不斷發展的美...
CREATED BY TAO 前言:我們掌握多種數據分析工具不是為了炫耀技能,而是為了用最快、最簡便、最適合的方法進行數據分析。 首先在pyth...