0
7
3
827
9
Q-learning 決策: 根據Q表,選擇reward較大的action. Q-learning 更新: 代碼如下
強化學習方法匯總 (Reinforcement Learning): (1)Model-free 和 Model-based: model-fr...
一. 大致流程如下 股票歷史數據 股票技術指標 股吧文本數據 1.特征選擇 2.股吧文本情感分析 2.1文本數據預處理 2.2 基于LSTM的情...