屁話不多了,此次學習筆記旨在鞏固理論,付諸代碼,知道典型的模型及算法,另外也訓練下自己的表達能力。
1. supervised learning
2. unsupervised learning
3. model selection and evaluation
4. datasets transformations
5. datasets loading utilities
6. strategies to scale computationally: bigger data
7. computational performance
先列出大綱,共六部分
1. Classification
目標:識別物體屬于哪個類;
應用:spam detection(垃圾郵件檢測),image recognition(圖像識別)
舉例:SVM,nearest neighbour,random forest
2. Regression
目標:預測一個物體的某個屬性的連續值
應用:Drug response(藥物反應),stock prices(股票價格)
舉例: SVR,ridge regression,Lasso
3. Clustering
目標: 自動將相似的物體歸成一個集合
應用: customer segmentation(顧客分割),grouping experiment outcomes(分組實驗)
舉例:K-means,spectral clustering(譜聚類),mean shift
4. Dimensionality reduction
目標: 減少隨機變量的數量
應用:視覺化, 增加效率
舉例:PCA,feature selection, non-negative matrix factorization(非負矩陣分解)
5. Model selection
目標:比較,校驗,選擇參數和模型
應用: 通過調整參數來改善準確率
舉例:grid search, cross validation, metrics
6. Preprocessing
目標: feature extraction and normalization
應用:轉化下輸入數據,比如文字,用于ML算法
舉例:preprocessing, feature extraction