Reinforcement Learning Toolbox fornisce un'applicazione, funzioni e un blocco Simulink per l'addestramento di politiche utilizzando algoritmi di Reinforcement Learning, inclusi DQN, PPO, SAC e DDPG. È possibile utilizzare queste politiche per implementare controller e algoritmi decisionali per applicazioni complesse come l'allocazione delle risorse, la robotica e i sistemi autonomi.
Il toolbox consente di rappresentare politiche e funzioni di valore utilizzando reti neurali profonde o tabelle di look-up e di addestrarle attraverso interazioni con ambienti modellati in MATLAB o Simulink. È possibile valutare gli algoritmi di Reinforcement Learning a uno o più agenti forniti nel toolbox o svilupparne di nuovi. È possibile sperimentare le impostazioni degli iperparametri, monitorare il progresso dell'addestramento e simulare gli agenti addestrati in modo interattivo tramite l'applicazione o in modo programmatico. Per migliorare le prestazioni di addestramento, le simulazioni possono essere eseguite in parallelo su più CPU, GPU, cluster di computer e sul cloud (con Parallel Computing Toolbox e MATLAB Parallel Server).
Il formato del modello ONNX™ consente di importare le politiche esistenti da framework di Deep Learning come TensorFlow™ Keras e PyTorch (con Deep Learning Toolbox). È possibile generare codice ottimizzato C, C++ e CUDA® per distribuire le politiche addestrate su microcontrollori e GPU. Il toolbox include esempi di riferimento per aiutarti a muovere i primi passi.
Agenti di Reinforcement Learning
Crea agenti di Reinforcement Learning senza modello e basati su modello, utilizzando algoritmi popolari come DQN, PPO e SAC. In alternativa, è possibile sviluppare algoritmi personalizzati con i modelli forniti. Utilizza il blocco RL Agent per portare gli agenti in Simulink.
App Reinforcement Learning Designer
Progetta, addestra e simula in modo interattivo gli agenti di Reinforcement Learning. Esporta gli agenti addestrati in MATLAB per un utilizzo e distribuzione futuri.
Segnali di ricompensa
Crea segnali di ricompensa in grado di misurare il successo dell'agente nel raggiungere il suo obiettivo. Genera le funzioni di ricompensa automaticamente dalle specifiche di controllo definite in Model Predictive Control Toolbox o Simulink Design Optimization.
Rappresentazione delle politiche
Inizia velocemente ad utilizzare le architetture di rete neurale suggerite dal toolbox. In alternativa, esplora le tabelle di ricerca o definisci manualmente le politiche della rete neurale con gli strati di Deep Learning Toolbox e l'applicazione Deep Network Designer.
Reinforcement Learning
Addestra gli agenti attraverso le interazioni con l'ambiente o utilizzando i dati esistenti. Esplora l'addestramento a uno o più agenti. Registra e visualizza i dati dell'allenamento e monitora i progressi man mano che procedi.
Calcolo distribuito
Accelera l’addestramento utilizzando computer multicore e risorse cloud o calcola cluster con Parallel Computing Toolbox e MATLAB Parallel Server. Sfrutta le GPU per accelerare operazioni come il calcolo del gradiente e la predizione.
Modellazione ambientale
Modella ambienti che interagiscono perfettamente con gli agenti di Reinforcement Learning utilizzando MATLAB e Simulink. Interfaccia con strumenti di modellazione di terze parti.
Generazione e distribuzione di codici
Genera automaticamente codice C/C++ e CUDA da politiche addestrate per la distribuzione su dispositivi embedded. Utilizza MATLAB Compiler e MATLAB Production Server per distribuire le politiche addestrate ai sistemi di produzione come applicazioni standalone, librerie condivise C/C++ e altro ancora.
Esempi di riferimento
Progetta controller e algoritmi decisionali per la robotica, la guida autonoma, la calibrazione, la pianificazione e altre applicazioni. Consulta i nostri esempi di riferimento per iniziare a lavorare rapidamente.
Risorse di prodotto:
"Il 5G è un'infrastruttura critica che dobbiamo proteggere dagli attacchi avversari. Reinforcement Learning Toolbox ci consente di valutare rapidamente le vulnerabilità del 5G e di identificare i metodi di mitigazione".
Richiedi una versione di prova gratuita
30 giorni di prova a tua disposizione.
Pronto per acquistare?
Richiedi una quotazione e scopri i prodotti correlati.
Sei uno studente?
È possibile che la tua scuola già fornisca accesso a MATLAB, Simulink e ad altri prodotti complementari mediante una Campus-Wide License.