photo

泽宇


Last seen: oltre un anno fa Attivo dal 2024

Followers: 0   Following: 0

Statistica

MATLAB Answers

2 Domande
0 Risposte

RANK
296.633
of 300.829

REPUTAZIONE
0

CONTRIBUTI
2 Domande
0 Risposte

ACCETTAZIONE DELLE RISPOSTE
0.0%

VOTI RICEVUTI
0

RANK
 of 21.088

REPUTAZIONE
N/A

VALUTAZIONE MEDIA
0.00

CONTRIBUTI
0 File

DOWNLOAD
0

ALL TIME DOWNLOAD
0

RANK

of 171.210

CONTRIBUTI
0 Problemi
0 Soluzioni

PUNTEGGIO
0

NUMERO DI BADGE
0

CONTRIBUTI
0 Post

CONTRIBUTI
0 Pubblico Canali

VALUTAZIONE MEDIA

CONTRIBUTI
0 Punti principali

NUMERO MEDIO DI LIKE

Feeds

Visto da

Domanda


When using the reinforcement learning toolbox, when training the agent, there will be a problem that action is the boundary.
我在用深matlab强化学习工具箱进行自定义环境智能体训练,在第一次训练时(未得到奖励时),智能体给出的action是action约束范围内的值,然而在第二次训练时(得到第一次训练的奖励后),智能体给出的action是action却是约束范围的边界值?并且...

oltre un anno fa | 0 risposte | 0

0

risposte

Domanda


TD3算法训练时动作总是输出边界值
我在使用TD3算法训练完成后,无论训练过程中奖励曲线是否收敛,动作总是输出边界值或者输出完全不正确。我的state的值在0-20000,动作边界在0-15000.是哪里出了问题,是自定义环境创建的不正确还是哪里?需要对输入输出进行归一化吗

quasi 2 anni fa | 1 risposta | 0

1

risposta