關(guān)于神經(jīng)網(wǎng)絡(luò)中單個(gè)神經(jīng)元損失函數(shù)和成本函數(shù)的推導(dǎo)

1.損失函數(shù)

說(shuō)明:這里的閾值函數(shù)為二分輸出,即y輸出為1或者為0,在某些早期書籍中你可能會(huì)看到損失函數(shù)的公式為1/2(y'-y)^2,定義上來(lái)看確實(shí)沒(méi)問(wèn)題,但是我發(fā)現(xiàn)用他來(lái)進(jìn)行梯度下降,反向傳播的時(shí)候得到的函數(shù)將是一個(gè)非凸函數(shù),有多個(gè)極值點(diǎn),這是在計(jì)算中是很致命的,尤其是x的維度很大時(shí),你的程序的時(shí)間復(fù)雜度會(huì)十分大;

另外推導(dǎo)過(guò)程用到概率論和線性代數(shù),統(tǒng)計(jì)學(xué)中的相關(guān)知識(shí),但不用擔(dān)心,我會(huì)給不是很了解的朋友寫出過(guò)程,當(dāng)然,如果的你的數(shù)學(xué)功底很扎實(shí),請(qǐng)略過(guò)那一部分,現(xiàn)在,開始吧:


首先,定義y' = p(y = 1| x)

公式說(shuō)明:這里的x是訓(xùn)練數(shù)據(jù)中的某個(gè)特征值,他可以是單個(gè)數(shù),也可以是向量,矩陣取決于你所要解決問(wèn)題所建立的模型,y = 1即閾值函數(shù)輸出為1,y'即對(duì)于x輸入,y為1的概率0 <= y' <=1;

為便于討論在這里我把x設(shè)為一個(gè)列向量,其他情況基本類似:

根據(jù)上文,我可以得到一個(gè)分段函數(shù):

當(dāng) y = 1時(shí):p(y|x) = y'

當(dāng)y = 0:p(y|x) = 1 - y'

在這里,我把兩種情況聯(lián)合可寫成p(y|x) = pow(y',y)pow(1 - y',1 - y)? ? ? 其中pow(x,y)為x的y次方

我的最終目的是讓p(y|x)的值為最大,這樣可以使得估計(jì)值和實(shí)際值得誤差最小,這也就是損失函數(shù)的書面意義,接下來(lái)的過(guò)程就用到數(shù)學(xué)里的萬(wàn)能大哥log了(許多推導(dǎo)過(guò)程都可以用他,因?yàn)樗菄?yán)格單調(diào)的,而且可以把多次化成一次形式),如下:

令G(x,y) = logp(x|y) = ylogy' + (1 - y)log(1 - y') 前面提到log嚴(yán)格單調(diào),所以G越大P(x|y)越大,說(shuō)到這里有同學(xué)會(huì)問(wèn)了,損失函數(shù)不是越小越好么?別急,推導(dǎo)還沒(méi)完

在討論更加復(fù)雜的神經(jīng)網(wǎng)絡(luò)時(shí),我們傾向于損失函數(shù)小越好,因?yàn)檫@在問(wèn)題的解決中會(huì)提供極大的便利,所以,怎么辦呢,加個(gè)負(fù)號(hào)就好啦!所以最終

? ? 損失函數(shù):Lost(y,y') = -G(x,y)

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? = -[ylogy' + (1-y)log(1-y')]

2.成本函數(shù)

先給出成本函數(shù):J(θ) = 1/mΣLost(y,y')? 其中Σ上為m,下為0,m為訓(xùn)練的數(shù)據(jù)量大小文章,最后附件我會(huì)給出θ的推導(dǎo)過(guò)程,但現(xiàn)在這不影響證明

許多初學(xué)者錯(cuò)誤的認(rèn)為成本函數(shù)J(θ)的由來(lái)就是簡(jiǎn)單的對(duì)于損失函數(shù)求和取平均,確實(shí)他給的公式第一眼看過(guò)去就是取平均值(包括我自己剛學(xué)的時(shí)候也搞錯(cuò)了)但是仔細(xì)分析成本函數(shù)的定義,他的意義在于對(duì)應(yīng)給定的訓(xùn)練數(shù)據(jù){(x1,y1),(x2,y2) .......(xm,ym)}(再次強(qiáng)調(diào),這里的x并不一定是一個(gè)實(shí)數(shù),也可以是一個(gè)矩陣,向量等,取決于你建立的模型),我們要使得發(fā)生x1->y1,x2->y2.......xm->ym的概率達(dá)到一個(gè)最大值,如果簡(jiǎn)單的取平均完全不符合定義,聰明的的你肯定想到了,用極大似然函數(shù)!根據(jù)極大似然函數(shù)的定義:我得到

? ? L(θ) = P(x1|y1)P(x2|y2).....P(xm|ym) = ΠP(xi|yi)

萬(wàn)能的log再次出現(xiàn)了:

U = log(L(θ)) = ΣP(xi|yi),

同損失函數(shù)的原理,加上一個(gè)負(fù)號(hào)讓我們?cè)谇蟮脮r(shí)候求得最小值、

U = -U

在后續(xù)更加復(fù)雜的神經(jīng)網(wǎng)絡(luò)的討論中,U會(huì)顯得十分臃腫所以這里加上一個(gè)1/m進(jìn)行調(diào)節(jié),這樣,我們使得他和損失函數(shù)在一個(gè)數(shù)量級(jí),討論的時(shí)候也就更加方便,即:

J(θ) = 1/mΣLost(y,y')

附:關(guān)于θ的討論

學(xué)習(xí)閾值函數(shù)時(shí),我們知道當(dāng)w'X >= b時(shí)可以定義輸出為1,

公式做適當(dāng)變換,w'X - b >= 0其中w'為w的轉(zhuǎn)置,在這里x為列向量,w也是,我們對(duì)于X向量進(jìn)行擴(kuò)充,加入x0 = 1元素,同時(shí),w也擴(kuò)充,加入w0 = -b,這樣,設(shè)新的w為θ,得到.

θ'X = w'X - b,兩者雖然只是形勢(shì)不同,但在進(jìn)行后續(xù)更加復(fù)雜的討論時(shí),只需要兩個(gè)向量進(jìn)行運(yùn)算,而不用考慮實(shí)數(shù)b,我相信會(huì)很好的簡(jiǎn)化問(wèn)題

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,333評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,491評(píng)論 3 416
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,263評(píng)論 0 374
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,946評(píng)論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,708評(píng)論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,186評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,255評(píng)論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,409評(píng)論 0 288
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,939評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,774評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,976評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,518評(píng)論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,209評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,641評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,872評(píng)論 1 286
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,650評(píng)論 3 391
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,958評(píng)論 2 373

推薦閱讀更多精彩內(nèi)容