三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

<del id="0su0z"><sup id="0su0z"></sup></del>

<thead id="0su0z"><option id="0su0z"><em id="0su0z"></em></option></thead>

<bdo id="0su0z"><table id="0su0z"></table></bdo>

登錄注冊寫文章

lstm 調節超參數的注意事項

lstm 調節超參數的注意事項

以下是手動優化RNN超參數時需要注意的一些事：

小心出現過擬合，這通常是因為神經網絡在“死記”定型數據。過擬合意味著定型數據的表現會很好，但網絡的模型對于樣例以外的預測則完全無用。
正則化有好處：正則化的方法包括l1、l2和丟棄法等。
保留一個神經網絡不作定型的單獨測試集。
網絡越大，功能越強，但也更容易過擬合。不要嘗試用10,000個樣例來學習一百萬個參數參數 > 樣例數 = 問題。
數據基本上總是越多越好，因為有助于防止過擬合。
定型應當包括多個epoch（使用整個數據集定型一次）。
每個epoch之后，評估測試集表現，判斷何時停止（提前停止）。
學習速率是最為重要的超參數。
總體而言，堆疊層是有好處的。
對于LSTM，可使用softsign（而非softmax）激活函數替代tanh（更快且更不容易出現飽和（約0梯度））。
更新器：RMSProp、AdaGrad或momentum（Nesterovs）通常都是較好的選擇。AdaGrad還能衰減學習速率，有時會有幫助。
最后，記住數據標準化、MSE損失函數 + 恒等激活函數用于回歸、Xavier權重初始化

(https://deeplearning4j.org/cn/lstm)

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

推薦閱讀更多精彩內容

BAT機器學習面試1000題系列（二）
101.深度學習（CNN RNN Attention）解決大規模文本分類問題。用深度學習（CNN RNN Att...
大黃大黃大黃閱讀 13,981評論 2贊 42
淺談深度學習基礎（上）
第二個Topic講深度學習，承接前面的《淺談機器學習基礎》。深度學習簡介前面也提到過，機器學習的本質就是尋找最...
我偏笑_NSNirvana閱讀 15,740評論 7贊 49
跟劉潤老師學互聯網營銷之“單客經濟”
這是劉潤老師“五分鐘商學院”第十二周的第三篇學習筆記：互聯網營銷之“單客經濟”。概念：單客經濟定義：利用移動互...
田小丫_Stella閱讀 5,551評論 0贊 8
世界上最遙遠的距離是你的手機壞了竟沒有修
世界上最遠的距離不是天各一方，而是你的手機壞了竟然沒有及時修。 2017年9月16日星期六多云微信大學好友群...
林秋千閱讀 603評論 2贊 4
2017年的正式開始
今天大年初四，是今年我上班的第一天，休假8天，8年沒有這么的休閑懶散，放松過了。睡了8天的懶覺，但是每天早...
慈樸守中閱讀 291評論 0贊 0

1贊2贊

贊賞

手機看全文

主站蜘蛛池模板：稻城县| 渝中区| 宁都县| 德昌县| 黄石市| 东兰县| 登封市| 库伦旗| 出国| 昭平县| 塔河县| 昭觉县| 彰武县| 思南县| 苏州市| 崇文区| 监利县| 三穗县| 张家港市| 凤山市| 犍为县| 永济市| 湘阴县| 宽城| 木兰县| 金堂县| 石林| 砀山县| 周口市| 德昌县| 巴中市| 扶绥县| 呈贡县| 福海县| 文化| 安达市| 巴东县| 扶绥县| 孟州市| 渝中区| 射洪县|

<pre id="h3wzw"><span id="h3wzw"></span></pre>

<output id="h3wzw"></output>

<abbr id="h3wzw"><optgroup id="h3wzw"></optgroup></abbr>