機(jī)器學(xué)習(xí)算法之旅

這篇文章,我們將了解最流行的機(jī)器學(xué)習(xí)算法。

用兩種方法來(lái)對(duì)機(jī)器學(xué)習(xí)算法進(jìn)行分組。

  • 按照學(xué)習(xí)風(fēng)格進(jìn)行分組
  • 按照算法的功能相似性進(jìn)行分組

兩種方法都可行,但本文更關(guān)注第二種方法。
通過(guò)閱讀本文,你將對(duì)目前流行的關(guān)于監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法以及它們之間的關(guān)系會(huì)有更好的理解。

按照學(xué)習(xí)風(fēng)格分組的機(jī)器學(xué)習(xí)算法

讓我們看看三種不同學(xué)習(xí)風(fēng)格的機(jī)器學(xué)習(xí)算法。

1.監(jiān)督學(xué)習(xí)(Supervised Learning)

輸入數(shù)據(jù)含有標(biāo)簽,例如:是否是垃圾郵件、某天的股票價(jià)格。
用帶標(biāo)簽的數(shù)據(jù)來(lái)訓(xùn)練模型,然后利用模型來(lái)預(yù)測(cè)未見(jiàn)過(guò)的數(shù)據(jù)的標(biāo)簽。
一般用來(lái)處理分類和回歸問(wèn)題。
e.g:

  • 線性回歸(Linear Regression)
  • 邏輯回歸(Logistics Regression)
  • 支持向量機(jī)(Support Vector Machine)
  • 決策樹(shù)(Decision Tree)
  • 樸素貝葉斯(naive bayes)

2.非監(jiān)督學(xué)習(xí)(Unsupervised Learning)

輸入數(shù)據(jù)不帶標(biāo)簽,模型通過(guò)推導(dǎo)輸入數(shù)據(jù)的結(jié)構(gòu)來(lái)提取數(shù)據(jù)的一般規(guī)則。
一般用來(lái)處理聚類、降維、關(guān)聯(lián)規(guī)則學(xué)習(xí)。
e.g:

  • Apriori Algorithm
  • K-Means

3.半監(jiān)督學(xué)習(xí)(Semi-Supervised Learning)

輸入數(shù)據(jù)部分有標(biāo)簽,部分沒(méi)有標(biāo)簽。
通過(guò)學(xué)習(xí)輸入數(shù)據(jù)的一般規(guī)則來(lái)更好的預(yù)測(cè)標(biāo)簽。
一般用來(lái)處理分類和回歸問(wèn)題。

目前比較火的是半監(jiān)督學(xué)習(xí),它可以對(duì)數(shù)量很大但是只有少量數(shù)據(jù)帶有標(biāo)簽的數(shù)據(jù)集進(jìn)行預(yù)測(cè),例如圖像分類問(wèn)題。

按照算法功能的相似性進(jìn)行分組

這是最常用的分組方法。
雖然本文沒(méi)有列出所有的算法,但是具有一定的代表性。

回歸算法(Regression Algorithm)

回歸算法為變量之間的關(guān)系建模。
回歸算法是統(tǒng)計(jì)機(jī)器學(xué)習(xí)的主流方法。
e.g:

  • Ordinary Least Squares Regression (OLSR)
  • Linear Regression
  • Logistic Regression
  • Stepwise Regression
  • Multivariate Adaptive Regression Splines (MARS)
  • Locally Estimated Scatterplot Smoothing (LOESS)

基于實(shí)例算法(Instance-based Algorithm)

基于實(shí)例算法不對(duì)模型進(jìn)行訓(xùn)練,只是存儲(chǔ)訓(xùn)練數(shù)據(jù)。利用相似性度量(例如KNN中的距離函數(shù))來(lái)對(duì)比新數(shù)據(jù)和訓(xùn)練數(shù)據(jù),從而找出最匹配的模式和進(jìn)行預(yù)測(cè)。
因?yàn)檫@樣,基于實(shí)例算法又叫基于記憶算法。
e.g:

  • k-Nearest Neighbor (kNN)
  • Learning Vector Quantization (LVQ)
  • Self-Organizing Map (SOM)
  • Locally Weighted Learning (LWL)

正則化算法(Regularization Algorithm)

其他算法(一般是回歸算法)的擴(kuò)展算法。
e.g:

  • Ridge Regression
  • Least Absolute Shrinkage and Selection Operator (LASSO)
  • Elastic Net
  • Least-Angle Regression (LARS)

決策樹(shù)算法(Decision Tree Algorithm)

決策樹(shù)的理論基礎(chǔ)是:信息、熵、信息增益
決策樹(shù)具有速度快和準(zhǔn)確率高的優(yōu)點(diǎn),是很受歡迎的機(jī)器學(xué)習(xí)算法,一般用于分類和回歸問(wèn)題。
e.g:

  • Classification and Regression Tree (CART)
  • Iterative Dichotomiser 3 (ID3)
  • C4.5 and C5.0 (different versions of a powerful approach)
  • Chi-squared Automatic Interaction Detection (CHAID)
  • Decision Stump
  • M5
  • Conditional Decision Trees

貝葉斯算法(Bayesian Algorithm)

貝葉斯算法是基于貝葉斯定理,一般用于分類和回歸問(wèn)題。
e.g:

  • Naive Bayes
  • Gaussian Naive Bayes
  • Multinomial Naive Bayes
  • Averaged One-Dependence Estimators (AODE)
  • Bayesian Belief Network (BBN)
  • Bayesian Network (BN)

聚類算法(Clustering Algorithm)

聚類,就是利用數(shù)據(jù)固有的結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行分組聚類,使各組數(shù)據(jù)具有最大的共性。
e.g:

  • k-Means
  • k-Medians
  • Expectation Maximisation (EM)
  • Hierarchical Clustering

關(guān)聯(lián)規(guī)則學(xué)習(xí)算法(Association Rule Learning Algorithms)

提取最能描述變量間關(guān)系的規(guī)則。
e.g:

  • Apriori algorithm
  • Eclat algorithm

人工神經(jīng)網(wǎng)絡(luò)算法(Artificial Neural Network Algorithm)

人工神經(jīng)網(wǎng)絡(luò)算法是受啟發(fā)于生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
e.g:

  • Perceptron
  • Back-Propagation
  • Hopfield Network
  • Radial Basis Function Network (RBFN)

深度學(xué)習(xí)算法(Deep Learning Algorithm)

深度學(xué)習(xí)算法是人工神經(jīng)網(wǎng)絡(luò)算法的升級(jí)版,具有更復(fù)雜的神經(jīng)網(wǎng)絡(luò),多數(shù)用于半監(jiān)督學(xué)習(xí)。
e.g:

  • Deep Boltzmann Machine (DBM)
  • Deep Belief Networks (DBN)
  • Convolutional Neural Network (CNN)
  • Stacked Auto-Encoders

降維算法(Dimensionality Reduction Algorithm)

在監(jiān)督學(xué)習(xí)算法中,常用于簡(jiǎn)化數(shù)據(jù)和可視化數(shù)據(jù),適用于分類和回歸問(wèn)題。
e.g:

  • Principal Component Analysis (PCA)
  • Principal Component Regression (PCR)
  • Partial Least Squares Regression (PLSR)
  • Sammon Mapping
  • Multidimensional Scaling (MDS)
  • Projection Pursuit
  • Linear Discriminant Analysis (LDA)
  • Mixture Discriminant Analysis (MDA)
  • Quadratic Discriminant Analysis (QDA)
  • Flexible Discriminant Analysis (FDA)

集成算法(Ensemble Algorithm)

集成方法是由多個(gè)獨(dú)立訓(xùn)練的弱學(xué)習(xí)器組成,通過(guò)某種方式(例如:多數(shù)投票法、平均法等)將各個(gè)弱學(xué)習(xí)器的預(yù)測(cè)結(jié)果結(jié)合成總體的預(yù)測(cè)。
e.g:

  • Boosting
  • Bootstrapped Aggregation (Bagging)
  • AdaBoost
  • Stacked Generalization (blending)
  • Gradient Boosting Machines (GBM)
  • Gradient Boosted Regression Trees (GBRT)
  • Random Forest(適合用隨機(jī)調(diào)參)

其他算法

支持向量機(jī)(Support Vector Machine)(間隔最大化)
各個(gè)領(lǐng)域的機(jī)器學(xué)習(xí)算法

  • Computational intelligence (evolutionary algorithms, etc.)
  • Computer Vision (CV)
  • Natural Language Processing (NLP)
  • Recommender Systems
  • Reinforcement Learning
  • Graphical Models
machine learning aigorithms mind map

引用:https://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,565評(píng)論 6 539
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,115評(píng)論 3 423
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 177,577評(píng)論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 63,514評(píng)論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,234評(píng)論 6 410
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 55,621評(píng)論 1 326
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,641評(píng)論 3 444
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 42,822評(píng)論 0 289
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,380評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,128評(píng)論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,319評(píng)論 1 371
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,879評(píng)論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,548評(píng)論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 34,970評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 36,229評(píng)論 1 291
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,048評(píng)論 3 397
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,285評(píng)論 2 376

推薦閱讀更多精彩內(nèi)容

  • 機(jī)器學(xué)習(xí)(Machine Learning)&深度學(xué)習(xí)(Deep Learning)資料(Chapter 1) 注...
    Albert陳凱閱讀 22,315評(píng)論 9 476
  • 從明天開(kāi)始跑家,學(xué)會(huì)辛苦,學(xué)會(huì)和父母相處,知道自己要的是什么,每天早上公交先計(jì)劃,后補(bǔ)覺(jué),晚上公交先上車思考,總結(jié)...
    Times刺猬兒閱讀 193評(píng)論 0 0
  • 摘要:戲劇程式內(nèi)涵與探尋,本質(zhì)屬性,方式方法,造型材料,內(nèi)容來(lái)源與推想,表現(xiàn)與體驗(yàn)。 程式,是戲劇創(chuàng)作在文學(xué)劇本,...
    張靜年閱讀 840評(píng)論 1 8
  • 漫飲黃昏霞燙酒,閑聽(tīng)夜半雨敲詩(shī)。 小荷莫笑東君老,遍撒銀鉤釣玉池。 ——魚兒
    牧魚齋主閱讀 602評(píng)論 6 5