Apprendimento di rinforzo
L'apprendimento di rinforzo è un approccio di calcolo orientato agli obiettivi in cui un agente impara a svolgere un’attività interagendo con un ambiente dinamico sconosciuto. Durante l'addestramento, l'algoritmo di apprendimento aggiorna i parametri della politica dell'agente. L'obiettivo dell'algoritmo di apprendimento è trovare una politica ottimale che massimizzi il riconoscimento a lungo termine ricevuto durante l’attività.
A seconda del tipo di agente, la politica è rappresentata da una o più rappresentazioni della politica e della funzione di valore. È possibile implementare queste rappresentazioni utilizzando le reti neurali profonde. È quindi possibile addestrare queste reti utilizzando il software Reinforcement Learning Toolbox™.
Per ulteriori informazioni, vedere .