Community Profile

photo


Last seen: 12 mesi fa Attivo dal 2022

Followers: 0   Following: 0

Statistiche

  • First Answer

Visualizza badge

Feeds

Visto da

Domanda


使用PPO和TRPO算法在reinforcement learning design app输出连续动作时,动作值不在设定好的区间内
%Open model mdl='FCEV'; blk='FCEV/RL Agent'; %open_system(mdl); %(s,a) obsInfo = rlNumericSpec([3 1]); obsInfo.Name = ...

circa un anno fa | 1 risposta | 1

1

risposta