Reinforcement Learning Toolbox
Progettazione e apprendimento di politiche mediante Reinforcement Learning
Domande? Contatta l’ufficio addetto alle vendite.
Domande? Contatta l’ufficio addetto alle vendite.
Reinforcement Learning Toolbox™ fornisce un'applicazione, funzioni e un blocco Simulink® per l'addestramento di politiche utilizzando algoritmi di Reinforcement Learning, inclusi DQN, PPO, SAC e DDPG. È possibile utilizzare queste politiche per implementare controller e algoritmi decisionali per applicazioni complesse come l'allocazione delle risorse, la robotica e i sistemi autonomi.
Il toolbox consente di rappresentare politiche e funzioni di valore utilizzando reti neurali profonde o tabelle di look-up e di addestrarle attraverso interazioni con ambienti modellati in MATLAB® o Simulink. È possibile valutare gli algoritmi di Reinforcement Learning a uno o più agenti forniti nel toolbox o svilupparne di nuovi. È possibile sperimentare le impostazioni degli iperparametri, monitorare il progresso dell'addestramento e simulare gli agenti addestrati in modo interattivo tramite l'applicazione o in modo programmatico. Per migliorare le prestazioni di addestramento, le simulazioni possono essere eseguite in parallelo su più CPU, GPU, cluster di computer e sul cloud (con Parallel Computing Toolbox™ e MATLAB Parallel Server™).
Il formato del modello ONNX™ consente di importare le politiche esistenti da framework di Deep Learning come TensorFlow™ Keras e PyTorch (con Deep Learning Toolbox™). È possibile generare codice ottimizzato C, C++ e CUDA® per distribuire le politiche addestrate su microcontrollori e GPU. Il toolbox include esempi di riferimento per aiutarti a muovere i primi passi.
Crea agenti utilizzando Deep Q-Network (DQN), Deep Deterministic Policy Gradient (DDPG), Proximal Policy Optimization (PPO) e altri algoritmi integrati. Utilizza template per sviluppare agenti personalizzati per le politiche di addestramento.
Progetta, addestra e simula in modo interattivo gli agenti di Reinforcement Learning. Esporta gli agenti addestrati in MATLAB per un utilizzo e distribuzione futuri.
Per sistemi complessi con ampi spazi stato-azione, definisci le politiche delle reti neurali profonde in modo programmatico utilizzando gli strati di Deep Learning Toolbox o in modo interattivo con Deep Network Designer. In alternativa, utilizza l'architettura di rete predefinita suggerita dal toolbox. Inizializza la politica utilizzando l’Imitation Learning per accelerare l'addestramento. Importa ed esporta modelli ONNX per l’interoperabilità con altri framework di Deep Learning.
Crea e addestra agenti di Reinforcement Learning in Simulink con il blocco RL Agent. Addestra più agenti simultaneamente (Reinforcement Learning a più agenti) in Simulink utilizzando più istanze del blocco RL Agent.
Utilizza Simulink e Simscape™ per creare il modello di un ambiente. Specifica i segnali di osservazione, azione e ricompensa all'interno del modello.
Utilizza funzioni e classi MATLAB per modellare un ambiente. Specifica le variabili di osservazione, azione e ricompensa nel file MATLAB.
Accelera l’addestramento eseguendo simulazioni parallele su computer multicore, risorse cloud o calcola cluster utilizzando Parallel Computing Toolbox e MATLAB Parallel Server.
Accelera l’addestramento e l'inferenza delle reti neurali profonde con le GPU NVIDIA® ad alte prestazioni. Utilizza MATLAB con Parallel Computing Toolbox e la maggior parte delle GPU NVIDIA abilitate per CUDA che presentano una capacità di elaborazione pari o superiore a 3.0.
Utilizza GPU Coder™ per generare codice CUDA ottimizzato dal codice MATLAB che rappresenta le politiche addestrate. Utilizza MATLAB Coder™ per generare codice C/C++ per distribuire le politiche.
Utilizza MATLAB Compiler™ e MATLAB Compiler SDK™ per distribuire politiche addestrate come applicazioni standalone, librerie condivise C/C++, assembly Microsoft® .NET, classi Java® e pacchetti Python®.
Scopri come sviluppare politiche di Reinforcement Learning per problemi come l'inversione di un pendolo semplice, la navigazione di un mondo a griglia, il bilanciamento di un sistema carrello-palo e la risoluzione dei processi decisionali di Markov (MDP) generici.
Progetta politiche di Reinforcement Learning per applicazioni di guida autonoma come il cruise control adattivo, l'assistenza al mantenimento della corsia e il parcheggio automatico.
Progetta politiche di Reinforcement Learning per applicazioni di robotica.
Progetta politiche di Reinforcement Learning per applicazioni di sincronizzazione, calibrazione e pianificazione.
Guarda i video di questa serie per saperne di più sul Reinforcement Learning.