
好久沒更新了,由于疫情的原因,家里的工作一直比較忙,最近閑下來了,學校也還沒開學,正好趁著這段時間,復習一下前段時間的知識,泰坦尼克號的案例在數...
這里我們用FAO(Food and Agriculture Organization)組織提供的數據集,練習一下如何利用python進行探索性數...
一、簡介 ARIMA模型(Autoregressive Integrated Moving Average model),差分整合移動平均自回歸...
數據分析經常會遇到帶有時間序列的數據,接下來我們看一下,利用pandas如何處理這類數據。 時間序列 時間戳(timestamp) 固定周期(p...
一、簡介 EM算法 最大期望算法(Expectation-maximization algorithm,簡稱EM,又譯期望最大化算法)在統計中被...
一、簡介 Xgboost(extreme Gradient Boosting,極端梯度提升)經常被用在一些比賽中,效果顯著。它是大規模并行的bo...
一、簡介 它的目的是尋找一個超平面來對樣本進行分割,分割的原理則是間隔最大化,最終轉化為一個凸二次規劃問題來求解,由簡至繁的模型包括: 當訓練樣...
一、算法簡介 主成分分析(Principal Component Analysis,簡稱PCA)算法是降維中最常用的一種手段,降維的算法還有很多...
一、算法簡介 1、監督學習和非監督學習 監督學習 監督學習是根據已有的數據集,知道輸入和輸出結果之間的關系。根據這種已知的關系,訓練得到一個最優...