三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

<sub id="uz5zn"></sub>

<cite id="uz5zn"><track id="uz5zn"></track></cite>

登錄注冊寫文章

神經(jīng)網(wǎng)絡(luò)

不會停的蝸牛

神經(jīng)網(wǎng)絡(luò)

Udacity
Machine Learning
Neural Networks

什么是 Neural Networks？

Perception：

如下圖，Input Xi 乘以相應的權(quán)重 wi，然后求和得到 activation，再與 UNIT里的Theta ，大于等于這個閾值則 y＝1，否則 y＝0.

可以看到權(quán)重 wi 決定了最后的分類，下圖就是 perception 達到的效果，它可以求出 halfplane 來把 (x1,x2) 分為兩類。

Neural Network 可以表示 boolean function，

AND

OR

NOT

也就是可以用 perception 來表示 AND，OR，NOT，那么怎么用它來表示 anything。

XOR

XOR=OR-AND
所以要先把 AND 和 OR 都寫在下面的表格里
先考慮 OR 的話，w1=1,w3=1,theta=1
但是 AND 對應的 w2 不能直接＝-1，因為當 x1 和 x2 同時為 1 時，此時的值等于theta，就無法得到XOR的0了，所以 w2=-2.

我們希望建立一個 system，輸入數(shù)據(jù)之后，就可以訓練出 weights

為了訓練出這些 weights，有兩個規(guī)則：

Perception Rules (Use threshold values)
Gradient Descent/Delta Rules(Use unthreshold values)

1. Perception Rules

目標是要訓練 weights，得到的 y 可以和 Threshold 比較進而歸類，閾值 Theta 可以被換到表達式左邊的權(quán)重里，所以右邊是0

我們就是要通過改變 wi 來找到最優(yōu)的權(quán)重，也就是要找到 delta wi，就可以找到 wi。

y 是實際值，y hat 是用 wi 計算出來的，二者相減的結(jié)果有下面四種可能，如果 y hat 是正確的，那就意味著 wi 不需要改變，但如果是錯誤的，比如 y＝0，y hat＝1，那說明 y hat 過大了，那么由 delta wi 的公式可以看出，xi 向負方向偏離太遠，

不想讓 y hat 過大或者過小，這個時候 learning rate 就起作用了，也就是可以在某個方向一點一點地走。

如果一個數(shù)據(jù)集可以找到線性的 half plane，那么 Perception Rule 就一定能找到這個平面。

需要一個算法 robust to non-linear separability，這個算法就是

2. Gradient Descent

為什么用 a，而不用 y hat，因為 y hat 不可導。

兩個 Rules 的比較：

Sigmoid 是什么？

求導后的形式也很簡單，

Back Propagation

信息是從前向后傳，Error 從后向前回溯

其中的 Sigmoid Units 也可以換成其他可微的函數(shù)，
這個 Error function 可以有很多局部最優(yōu)，但不一定是全局最優(yōu)。

Negative Attributes：

更多的節(jié)點，更多的層，更大的權(quán)重，這三條會導致問題變得很復雜

每次引用一個新的 Supervised Learning Algorithm 時，就想想它的 Restriction Bias 和 Preference Bias。

Restriction Bias：

可以告訴你這個模型的 Representational Power

只要 Neural Networks 足夠復雜，也就是有足夠多的層和節(jié)點，就不會受到這些限制，但是問題是可能 Overfitting，為了解決過擬合問題，會加一些邊界條件來限制層數(shù)和節(jié)點數(shù)，這時可以用 Cross Validation 來決定用多少層，每層多少個節(jié)點，何時停止。
not very restrictive in terms of their bias

我們不會選擇最多的迭代次數(shù)，而是選擇 Cross Validation Error 最小的點停止。

Preference Bias：

告訴你你將要用的算法，你為什么選擇這個算法而不是別的。

到底是選擇 Gradient Descent 還是 Back Propagation。
該如何初始化權(quán)重。簡單，隨機

小結(jié)

最后編輯于：2017.12.03 06:58:36

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容

神經(jīng)網(wǎng)絡(luò)：改進神經(jīng)網(wǎng)絡(luò)的學習方法（下）
改進神經(jīng)網(wǎng)絡(luò)的學習方法（下）權(quán)重初始化創(chuàng)建了神經(jīng)網(wǎng)絡(luò)后，我們需要進行權(quán)重和偏差的初始化。到現(xiàn)在，我們一直是根據(jù)...
nightwish夜愿閱讀 1,920評論 0贊 0
李理：Theano tutorial和卷積神經(jīng)網(wǎng)絡(luò)的Theano實現(xiàn) Part1
本系列文章面向深度學習研發(fā)者，希望通過Image Caption Generation，一個有意思的具體任務(wù)，深入...
imGeek閱讀 1,839評論 0贊 8
【轉(zhuǎn)載】BP神經(jīng)網(wǎng)絡(luò)理論
www.cnblogs.com/hellope/archive/2012/07/05/2577814.html 科...
dopami閱讀 1,165評論 0贊 2
硅谷鋼鐵俠
出生地非洲：冒險無極限的基因埃隆·馬斯克出生于1971年，在南非東北部的大城市比勒陀利亞長大。他的父親埃羅...
此生未完成1994閱讀 506評論 0贊 0
給老婆留著，對剛生完小孩的孕婦有用！
1.只能喝紅棗水，不能喝溫開水。喝了溫開水，坐月后，面色會好差的。 2.全身不能碰涼水，只能碰溫水，洗手洗面洗衣服...
Acymer元元閱讀 766評論 2贊 8

3贊4贊

贊賞

手機看全文

主站蜘蛛池模板：罗山县| 五华县| 垣曲县| 左贡县| 西充县| 峨山| 山东省| 缙云县| 凤翔县| 赞皇县| 方正县| 高安市| 阳谷县| 洛浦县| 达日县| 牡丹江市| 吉木萨尔县| 涟水县| 长岛县| 余江县| 莲花县| 昆山市| 定州市| 布尔津县| 乐东| 江华| 普安县| 丰都县| 会昌县| 霍林郭勒市| 济源市| 惠安县| 读书| 仁布县| 固始县| 武义县| 城市| 平山县| 浑源县| 玉林市| 福安市|

<style id="zb57d"></style>