SK-Learn學習目錄

屁話不多了,此次學習筆記旨在鞏固理論,付諸代碼,知道典型的模型及算法,另外也訓練下自己的表達能力。

資料鏈接scikit-learn

1. supervised learning

2. unsupervised learning

3. model selection and evaluation

4. datasets transformations

5. datasets loading utilities

6. strategies to scale computationally: bigger data

7. computational performance

先列出大綱,共六部分

1. Classification

目標:識別物體屬于哪個類;

應用:spam detection(垃圾郵件檢測),image recognition(圖像識別)

舉例:SVM,nearest neighbour,random forest

2. Regression

目標:預測一個物體的某個屬性的連續值

應用:Drug response(藥物反應),stock prices(股票價格)

舉例: SVR,ridge regression,Lasso

3. Clustering

目標: 自動將相似的物體歸成一個集合

應用: customer segmentation(顧客分割),grouping experiment outcomes(分組實驗)

舉例:K-means,spectral clustering(譜聚類),mean shift

4. Dimensionality reduction

目標: 減少隨機變量的數量

應用:視覺化, 增加效率

舉例:PCA,feature selection, non-negative matrix factorization(非負矩陣分解)

5. Model selection

目標:比較,校驗,選擇參數和模型

應用: 通過調整參數來改善準確率

舉例:grid search, cross validation, metrics

6. Preprocessing

目標: feature extraction and normalization

應用:轉化下輸入數據,比如文字,用于ML算法

舉例:preprocessing, feature extraction

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容