NTU林軒田機(jī)器學(xué)習(xí)基石課程學(xué)習(xí)筆記1 -- The Learning Problem

最近在看NTU林軒田的《機(jī)器學(xué)習(xí)基石》課程,個人感覺講的非常好。整個基石課程分成四個部分:

  • When Can Machine Learn?

  • Why Can Machine Learn?

  • How Can Machine Learn?

  • How Can Machine Learn Better?

每個部分由四節(jié)課組成,總共有16節(jié)課。那么,從這篇開始,我們將連續(xù)對這門課做課程筆記,共16篇,希望能對正在看這們課的童鞋有所幫助。下面開始第一節(jié)課的筆記:The Learning Problem。

一、What is Machine Learning

什么是“學(xué)習(xí)”?學(xué)習(xí)就是人類通過觀察、積累經(jīng)驗,掌握某項技能或能力。就好像我們從小學(xué)習(xí)識別字母、認(rèn)識漢字,就是學(xué)習(xí)的過程。而機(jī)器學(xué)習(xí)(Machine Learning),顧名思義,就是讓機(jī)器(計算機(jī))也能向人類一樣,通過觀察大量的數(shù)據(jù)和訓(xùn)練,發(fā)現(xiàn)事物規(guī)律,獲得某種分析問題、解決問題的能力。

機(jī)器學(xué)習(xí)可以被定義為:Improving some performance measure with experence computed from data. 也就是機(jī)器從數(shù)據(jù)中總結(jié)經(jīng)驗,從數(shù)據(jù)中找出某種規(guī)律或者模型,并用它來解決實際問題。

什么情況下會使用機(jī)器學(xué)習(xí)來解決問題呢?其實,目前機(jī)器學(xué)習(xí)的應(yīng)用非常廣泛,基本上任何場合都能夠看到它的身影。其應(yīng)用場合大致可歸納為三個條件:

  • 事物本身存在某種潛在規(guī)律

  • 某些問題難以使用普通編程解決

  • 有大量的數(shù)據(jù)樣本可供使用

二、Applications of Machine Learning

機(jī)器學(xué)習(xí)在我們的衣、食、住、行、教育、娛樂等各個方面都有著廣泛的應(yīng)用,我們的生活處處都離不開機(jī)器學(xué)習(xí)。比如,打開購物網(wǎng)站,網(wǎng)站就會給我們自動推薦我們可能會喜歡的商品;電影頻道會根據(jù)用戶的瀏覽記錄和觀影記錄,向不同用戶推薦他們可能喜歡的電影等等,到處都有機(jī)器學(xué)習(xí)的影子。

三、Components of Machine Learning

本系列的課程對機(jī)器學(xué)習(xí)問題有一些基本的術(shù)語需要注意一下:

  • 輸入x

  • 輸出y

  • 目標(biāo)函數(shù)f,即最接近實際樣本分布的規(guī)律

  • 訓(xùn)練樣本data

  • 假設(shè)hypothesis,一個機(jī)器學(xué)習(xí)模型對應(yīng)了很多不同的hypothesis,通過演算法A,選擇一個最佳的hypothesis對應(yīng)的函數(shù)稱為矩g,g能最好地表示事物的內(nèi)在規(guī)律,也是我們最終想要得到的模型表達(dá)式。

實際中,機(jī)器學(xué)習(xí)的流程圖可以表示為:

對于理想的目標(biāo)函數(shù)f,我們是不知道的,我們手上拿到的是一些訓(xùn)練樣本D,假設(shè)是監(jiān)督式學(xué)習(xí),其中有輸入x,也有輸出y。機(jī)器學(xué)習(xí)的過程,就是根據(jù)先驗知識選擇模型,該模型對應(yīng)的hypothesis set(用H表示),H中包含了許多不同的hypothesis,通過演算法A,在訓(xùn)練樣本D上進(jìn)行訓(xùn)練,選擇出一個最好的hypothes,對應(yīng)的函數(shù)表達(dá)式g就是我們最終要求的。一般情況下,g能最接近目標(biāo)函數(shù)f,這樣,機(jī)器學(xué)習(xí)的整個流程就完成了。

四、Machine Learning and Other Fields

與機(jī)器學(xué)習(xí)相關(guān)的領(lǐng)域有:

  • 數(shù)據(jù)挖掘(Data Mining)

  • 人工智能(Artificial Intelligence)

  • 統(tǒng)計(Statistics)

其實,機(jī)器學(xué)習(xí)與這三個領(lǐng)域是相通的,基本類似,但也不完全一樣。機(jī)器學(xué)習(xí)是這三個領(lǐng)域中的有力工具,而同時,這三個領(lǐng)域也是機(jī)器學(xué)習(xí)可以廣泛應(yīng)用的領(lǐng)域,總得來說,他們之間沒有十分明確的界線。

五、總結(jié)

本節(jié)課主要介紹了什么是機(jī)器學(xué)習(xí),什么樣的場合下可以使用機(jī)器學(xué)習(xí)解決問題,然后用流程圖的形式展示了機(jī)器學(xué)習(xí)的整個過程,最后把機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘、人工智能、統(tǒng)計這三個領(lǐng)域做個比較。本節(jié)課的內(nèi)容主要是概述性的東西,比較簡單,所以筆記也相對比較簡略。

這里附上林軒田(Hsuan-Tien Lin)關(guān)于這門課的主頁:
http://www.csie.ntu.edu.tw/~htlin/

原文CSDN博客地址:
http://blog.csdn.net/red_stone1/article/details/72899485

注明:
文章中所有的圖片均來自NTU林軒田《機(jī)器學(xué)習(xí)基石課程》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容