三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

<cite id="vhjc3"></cite>

<sub id="vhjc3"><p id="vhjc3"></p></sub>

<meter id="vhjc3"><dfn id="vhjc3"></dfn></meter>

<sup id="vhjc3"><rt id="vhjc3"></rt></sup>

<sub id="vhjc3"><p id="vhjc3"></p></sub>

登錄注冊寫文章

關于原點對稱的輸入和中心對稱的輸出，網絡會收斂地更好?

關于原點對稱的輸入和中心對稱的輸出，網絡會收斂地更好?

**本文作者： **Liam Huang
本文鏈接： https://liam.page/2018/04/17/zero-centered-active-function/
**版權聲明： **本博客所有文章除特別聲明外，均采用 BY-NC-SA 許可協議。轉載請注明出處！

今天在討論神經網絡中的激活函數時，陸同學提出 Sigmoid 函數的輸出不是以零為中心的（non-zero-centered），這會導致神經網絡收斂較慢。關于這一點，過去我只是將其記下，卻并未理解背后的原因。此篇談談背后的原因。

神經元

神經元

Sigmoid 與 tanh

此篇集中討論激活函數輸出是否以零為中心的問題，因而不對激活函數做過多的介紹，而只討論 Sigmoid 與 tanh 兩個激活函數。

Sigmoid 函數

tanh 函數

一些性質

Sigmoid 和 tanh 兩個函數非常相似，具有不少相同的性質。簡單羅列如下

優點：平滑
優點：易于求導
缺點：冪運算相對耗時
缺點：導數值小于 1，反向傳播易導致梯度消失（Gradient Vanishing）

對于 Sigmoid 函數來說，它的值域是 (0,1)，因此又有如下特點

優點：可以作為概率，輔助模型解釋
缺點：輸出值不以零為中心，可能導致模型收斂速度慢

此篇重點講 Sigmoid 函數輸出值不以零為中心的這一缺點。

收斂速度

這里首先需要給收斂速度做一個詮釋。模型的最優解即是模型參數的最優解。通過逐輪迭代，模型參數會被更新到接近其最優解。這一過程中，迭代輪次多，則我們說模型收斂速度慢；反之，迭代輪次少，則我們說模型收斂速度快。

參數更新

以零為中心的影響

如圖，模型參數走綠色箭頭能夠最快收斂，但由于輸入值的符號總是為正，所以模型參數可能走類似紅色折線的箭頭。如此一來，使用 Sigmoid 函數作為激活函數的神經網絡，收斂速度就會慢上不少了。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

推薦閱讀更多精彩內容

【轉載】神經網絡梯度消失和梯度爆炸及解決辦法
https://blog.csdn.net/program_developer/article/details/8...
dopami閱讀 2,118評論 0贊 1
神經網絡：改進神經網絡的學習方法（下）
改進神經網絡的學習方法（下）權重初始化創建了神經網絡后，我們需要進行權重和偏差的初始化。到現在，我們一直是根據...
nightwish夜愿閱讀 1,904評論 0贊 0
前饋神經網絡-神經元
人工神經元(Artificial Neuron)，簡稱神經元(Neuron)，是構成神經網絡的基本單元，其主要是模...
魏鵬飛閱讀 1,234評論 0贊 1
[譯] 第三章改進神經網絡的學習方式（下）
Neil Zhu，簡書ID Not_GOD，University AI 創始人 & Chief Scientist...
朱小虎XiaohuZhu閱讀 2,652評論 0贊 7
從ReLU到Sinc，26種神經網絡激活函數可視化
姓名：周雪寧學號：1702110196 轉載：https://mp.weixin.qq.com/s/7DgiXC...
周雪寧閱讀 4,780評論 3贊 12

2贊3贊

贊賞

手機看全文

主站蜘蛛池模板：临安市| 靖远县| 泰安市| 凌海市| 改则县| 阿巴嘎旗| 扎鲁特旗| 大田县| 务川| 张家口市| 阜康市| 安平县| 宝丰县| 棋牌| 射洪县| 遵义市| 甘肃省| 武乡县| 增城市| 湖口县| 凉城县| 寿阳县| 武清区| 吉林市| 泸水县| 湾仔区| 商丘市| 喀什市| 武汉市| 务川| 莒南县| 蓝田县| 建湖县| 西昌市| 额济纳旗| 曲水县| 介休市| 禹州市| 托克托县| 霍城县| 青川县|

<style id="7jy33"><li id="7jy33"></li></style>

<legend id="7jy33"><track id="7jy33"></track></legend>

<sub id="7jy33"><p id="7jy33"></p></sub>

<s id="7jy33"></s>

<sub id="7jy33"><p id="7jy33"></p></sub>