三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

<pre id="a92pt"><fieldset id="a92pt"></fieldset></pre>

^{<blockquote id="a92pt"></blockquote>}

登錄注冊寫文章

GD(梯度下降)和SGD(隨機梯度下降)

GD(梯度下降)和SGD(隨機梯度下降)

相同點

在GD和SGD中，都會在每次迭代中更新模型的參數，使得代價函數變小。

不同點

GD

在GD中，每次迭代都要用到全部訓練數據。
假設線性模型

Paste_Image.png

θ是參數

代價函數：

Paste_Image.png

那么每次GD的更新算法為：

Paste_Image.png

由此算法可知，在對代價函數求偏導時，是需要用到全部的訓練數據的。

SGD

在SGD中，每次迭代可以只用一個訓練數據來更新參數。
回到GD的更新算法，假設此時我們此時訓練數據就只有一條(x,y)，

Paste_Image.png

所以此時的更新參數的算法變為：

Paste_Image.png

此時更新的算法，只用到了一個樣本。
其實具象的理解下，就是來了一條訓練數據，算下此時根據模型算出的值和實際值的差距，如果差距大，那么參數更新的幅度大，反之則小。

總結

當訓練數據過大時，用GD可能造成內存不夠用，那么就可以用SGD了，SGD其實可以算作是一種online-learning。另外SGD收斂會比GD快，但是對于代價函數求最小值還是GD做的比較好，不過SGD也夠用了。

最后編輯于：2017.12.03 04:47:48

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

推薦閱讀更多精彩內容

淺談深度學習基礎（上）
第二個Topic講深度學習，承接前面的《淺談機器學習基礎》。深度學習簡介前面也提到過，機器學習的本質就是尋找最...
我偏笑_NSNirvana閱讀 15,740評論 7贊 49
sklearn文檔 — 1.5. 隨機梯度下降
原文章為scikit-learn中"用戶指南"-->"監督學習的第五節：Stochastic Gradient D...
HabileBadger閱讀 5,938評論 0贊 3
梯度下降綜述
前言梯度下降算法現在變的越來越流行，但是對于使用者來說，它的優化過程變的越來越黑盒。本文我們介紹下不通梯度下降算...
wendaJ閱讀 1,589評論 0贊 1
線性回歸-梯度下降法
梯度下降法求解最小二乘 1、批量梯度下降法（1）構造損失函數（2）求梯度對J(theta)關于theta求偏導...
wlj1107閱讀 2,601評論 0贊 0
梯度下降優化算法綜述
轉自http://blog.csdn.net/heyongluoyao8/article/details/5247...
扎Zn了老Fe閱讀 1,644評論 0贊 10

23贊24贊

贊賞

手機看全文

主站蜘蛛池模板：钦州市| 牙克石市| 洛隆县| 东乡县| 奈曼旗| 南木林县| 蒲江县| 多伦县| 桂阳县| 达尔| 星子县| 鄯善县| 蕲春县| 蓝田县| 清苑县| 福安市| 昂仁县| 科技| 全椒县| 祁阳县| 资兴市| 峨眉山市| 黔南| 锡林浩特市| 千阳县| 本溪| 旬邑县| 聂拉木县| 富宁县| 高碑店市| 勃利县| 将乐县| 阳东县| 余庆县| 白水县| 湛江市| 黔江区| 团风县| 龙游县| 凌源市| 二手房|

<sub id="8aj8k"><s id="8aj8k"></s></sub>

<sub id="8aj8k"></sub>

<cite id="8aj8k"></cite>

<cite id="8aj8k"><track id="8aj8k"></track></cite>

^{<blockquote id="8aj8k"></blockquote>}