Reinforcement Learning Toolbox

Progettazione e apprendimento di politiche mediante Reinforcement Learning

Domande? Contatta l’ufficio addetto alle vendite

Reinforcement Learning Toolbox fornisce un'applicazione, funzioni e un blocco Simulink per l'addestramento di politiche utilizzando algoritmi di Reinforcement Learning, inclusi DQN, PPO, SAC e DDPG. È possibile utilizzare queste politiche per implementare controller e algoritmi decisionali per applicazioni complesse come l'allocazione delle risorse, la robotica e i sistemi autonomi.

Il toolbox consente di rappresentare politiche e funzioni di valore utilizzando reti neurali profonde o tabelle di look-up e di addestrarle attraverso interazioni con ambienti modellati in MATLAB o Simulink. È possibile valutare gli algoritmi di Reinforcement Learning a uno o più agenti forniti nel toolbox o svilupparne di nuovi. È possibile sperimentare le impostazioni degli iperparametri, monitorare il progresso dell'addestramento e simulare gli agenti addestrati in modo interattivo tramite l'applicazione o in modo programmatico. Per migliorare le prestazioni di addestramento, le simulazioni possono essere eseguite in parallelo su più CPU, GPU, cluster di computer e sul cloud (con Parallel Computing Toolbox e MATLAB Parallel Server).

Il formato del modello ONNX™ consente di importare le politiche esistenti da framework di Deep Learning come TensorFlow™ Keras e PyTorch (con Deep Learning Toolbox). È possibile generare codice ottimizzato C, C++ e CUDA^® per distribuire le politiche addestrate su microcontrollori e GPU. Il toolbox include esempi di riferimento per aiutarti a muovere i primi passi.

Raccolta di algoritmi di addestramento, come DDPG, DQN, SAC e PPO, disponibili in Reinforcement Learning Toolbox.

Agenti di Reinforcement Learning

Crea agenti di Reinforcement Learning senza modello e basati su modello, utilizzando algoritmi popolari come DQN, PPO e SAC. In alternativa, è possibile sviluppare algoritmi personalizzati con i modelli forniti. Utilizza il blocco RL Agent per portare gli agenti in Simulink.

Politiche e algoritmi di apprendimento | Reinforcement Learning, parte 3 (17:51)

Documentazione

App Reinforcement Learning Designer

Progetta, addestra e simula in modo interattivo gli agenti di Reinforcement Learning. Esporta gli agenti addestrati in MATLAB per un utilizzo e distribuzione futuri.

Documentazione | Esempio

Segnali di ricompensa

Crea segnali di ricompensa in grado di misurare il successo dell'agente nel raggiungere il suo obiettivo. Genera le funzioni di ricompensa automaticamente dalle specifiche di controllo definite in Model Predictive Control Toolbox o Simulink Design Optimization.

Documentazione

Rappresentazione delle politiche

Inizia velocemente ad utilizzare le architetture di rete neurale suggerite dal toolbox. In alternativa, esplora le tabelle di ricerca o definisci manualmente le politiche della rete neurale con gli strati di Deep Learning Toolbox e l'applicazione Deep Network Designer.

Documentazione

Reinforcement Learning

Addestra gli agenti attraverso le interazioni con l'ambiente o utilizzando i dati esistenti. Esplora l'addestramento a uno o più agenti. Registra e visualizza i dati dell'allenamento e monitora i progressi man mano che procedi.

Introduzione al Reinforcement Learning a più agenti (14:43)

Documentazione | Esempio

Lavoratori multipli che generano dati in parallelo per il Reinforcement Learning distribuito.

Calcolo distribuito

Accelera l’addestramento utilizzando computer multicore e risorse cloud o calcola cluster con Parallel Computing Toolbox e MATLAB Parallel Server. Sfrutta le GPU per accelerare operazioni come il calcolo del gradiente e la predizione.

Documentazione | Esempio

Schermata di un modello Simulink per un robot quadrupede.

Modellazione ambientale

Modella ambienti che interagiscono perfettamente con gli agenti di Reinforcement Learning utilizzando MATLAB e Simulink. Interfaccia con strumenti di modellazione di terze parti.

Guida introduttiva al Reinforcement Learning (9:30)

Generazione e distribuzione di codici

Genera automaticamente codice C/C++ e CUDA da politiche addestrate per la distribuzione su dispositivi embedded. Utilizza MATLAB Compiler e MATLAB Production Server per distribuire le politiche addestrate ai sistemi di produzione come applicazioni standalone, librerie condivise C/C++ e altro ancora.

Documentazione | Esempio

Esempi di riferimento

Progetta controller e algoritmi decisionali per la robotica, la guida autonoma, la calibrazione, la pianificazione e altre applicazioni. Consulta i nostri esempi di riferimento per iniziare a lavorare rapidamente.

Esempi

Risorse di prodotto:

Documentazione Esempi Video Articoli tecnici Funzioni Blocchi Requisiti Note di release

"Il 5G è un'infrastruttura critica che dobbiamo proteggere dagli attacchi avversari. Reinforcement Learning Toolbox ci consente di valutare rapidamente le vulnerabilità del 5G e di identificare i metodi di mitigazione".

Visualizza altri casi dei clienti