單變量的線性回歸模型--概述

前言


圖片發(fā)自簡(jiǎn)書App



上次只是籠統(tǒng)的概述了機(jī)器學(xué)習(xí)是什么以及能解決什么問題,這一篇就開始正式探討機(jī)器學(xué)習(xí)使用的算法了。

背景

假如我們有一組數(shù)據(jù),它是關(guān)于房子的大小和最終成交價(jià)格的數(shù)據(jù)。我們最后要做到的就是通過(guò)讓機(jī)器對(duì)這些數(shù)據(jù)的‘學(xué)習(xí)’,最后能對(duì)新的房子也能正確預(yù)測(cè)出它大概的成交價(jià)格。

如何進(jìn)行預(yù)測(cè)

現(xiàn)在假設(shè)x,y變量,x表示房子的面積,y表示房子的成交價(jià)格。那么每個(gè)房子的(x,y)就對(duì)應(yīng)坐標(biāo)軸上的一個(gè)點(diǎn)。例如房子面積是100,價(jià)格1000000。那么這個(gè)點(diǎn)就是(100,1000000)。把這些點(diǎn)都畫在坐標(biāo)軸上就會(huì)得到如下的樣子

橫坐標(biāo)是房子面積,縱坐標(biāo)是房子價(jià)格

對(duì)于這么大堆密密麻麻的點(diǎn),下一步該做什么呢,既然有x又有y,能不能找出x和y之間的關(guān)聯(lián),換句話說(shuō)就是找到個(gè)函數(shù)能盡可能多的擬合這些點(diǎn),讓這些點(diǎn)盡可能多的落在我們的線上。這就是線性回歸(概率論大佬正在趕來(lái)QAQ)。

所以擬合后的樣子應(yīng)該是這樣的


可以看到這條線已經(jīng)讓盡可能多的點(diǎn)落在了它身上。說(shuō)到這里,如何進(jìn)行預(yù)測(cè)是不是就變得顯而易見了。只要找到這樣一條直線,盡可能多的擬合了自己的數(shù)據(jù),那么對(duì)于新來(lái)的x值,它在圖上的坐標(biāo)就確定了,也就是y(房?jī)r(jià))確定了(換句話說(shuō)也就是找到y(tǒng)關(guān)于x的函數(shù)啦,就像y=10+x這樣)。那么我們的這個(gè)模型就可以比較正確預(yù)測(cè)房?jī)r(jià)了。想想還有點(diǎn)小激動(dòng)呢~

對(duì)于這個(gè)模型需要注意什么

由上面的圖其實(shí)不難看出來(lái),還是有部分的點(diǎn)偏離在我們的線外面的。但是我們畢竟不可能找到符合所有點(diǎn)的函數(shù),只能少數(shù)服從多數(shù),對(duì)于偏離的點(diǎn),我們不需要在意他們(還可以用一些曲線來(lái)擬合,不過(guò)這里只用線性的)。基于這個(gè)原因,模型成熟后,對(duì)于新房?jī)r(jià)的預(yù)測(cè)只是大概的,可以理解為它只是代表了一個(gè)趨勢(shì),房子面積越大,它的價(jià)格就越高。只不過(guò)我們基于這個(gè)趨勢(shì),可以給出大約的預(yù)測(cè)值。

結(jié)尾

對(duì)于這些枯燥的東西,并不想一口氣寫一堆,看到就讓人難受。所以這篇文章還并不算真正開始學(xué)習(xí)了它的算法。下面就會(huì)開始真正進(jìn)入算法的細(xì)節(jié),當(dāng)模型處于初始狀態(tài)怎樣判斷它與我們的最終模型有多大差距呢,以及如何縮小這些差距,這都是需要解決的問題。當(dāng)這兩個(gè)問題解決了,那么我們的模型就會(huì)逐漸變得成熟,預(yù)測(cè)房?jī)r(jià),登上人生巔峰指日可待~


這些都是基于我最近自己學(xué)習(xí)整理的,希望加強(qiáng)自己的理解,也方便以后查看。希望大佬目睹過(guò)后給予指正。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,646評(píng)論 6 533
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,595評(píng)論 3 418
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,560評(píng)論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,035評(píng)論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,814評(píng)論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,224評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,301評(píng)論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,444評(píng)論 0 288
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,988評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,804評(píng)論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,998評(píng)論 1 370
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,544評(píng)論 5 360
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,237評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,665評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,927評(píng)論 1 287
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,706評(píng)論 3 393
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,993評(píng)論 2 374

推薦閱讀更多精彩內(nèi)容