Reinforcement Learning Toolbox

 

Reinforcement Learning Toolbox

Progettare e addestrare politiche utilizzando il reinforcement learning

 

Reinforcement Learning Toolbox™ fornisce funzioni e blocchi per le politiche di addestramento utilizzando algoritmi di reinforcement learning tra cui DQN, A2C e DDPG. È possibile utilizzare questi algoritmi per implementare controllori e algoritmi di decision-making per sistemi complessi come robot e sistemi autonomi. È possibile implementare queste politiche utilizzando reti neurali profonde, polinomi o look-up table.

Il toolbox ti permette di addestrare politiche grazie all’interazione con ambienti rappresentati da modelli MATLAB® o Simulink®. È possibile valutare algoritmi, sperimentare le impostazioni degli iperparametri e monitorare il progresso dell’addestramento. Per migliorare le prestazioni di addestramento, è possibile eseguire simulazioni in parallelo nel cloud, in cluster di computer e GPU (con Parallel Computing Toolbox™ e MATLAB Parallel Server™).

Attraverso il formato del modello ONNX™, è possibile importare politiche esistenti da framework di deep learning come TensorFlow™ Keras e PyTorch (con Deep Learning Toolbox™). È possibile generare codice C, C++ e CUDA ottimizzati per distribuire politiche addestrate su microcontrollore e GPU.

Il toolbox include esempi di riferimento per l’uso del reinforcement learning per progettare controllori per applicazioni di robotica e di guida autonoma.

Agenti di reinforcement learning

Implementa agenti MATLAB e Simulink per addestrare politiche rappresentate da reti neurali profonde. Utilizza algoritmi di reinforcement learning integrati e personalizzati.

Algoritmi di reinforcement learning

Implementa agenti utilizzando Deep Q-Network (DQN), Advantage Actor Critic (A2C), Deep Deterministic Policy Gradients (DDPG) e altri algoritmi integrati. Utilizza template per implementare agenti personalizzati per le politiche di addestramento.

Gli agenti comprendono una politica e un algoritmo.

Rappresentazione della funzione del valore e della politica utilizzando reti neurali profonde

Utilizza le politiche di una rete neurale profonda per sistemi complessi con ampi spazi azione-stato. Definisci le politiche utilizzando reti e architetture dal Deep Learning Toolbox. Importa modelli ONNX per l’interoperabilità con altri framework di deep learning.

Blocchi Simulink per agenti

Implementa e addestra agenti di reinforcement learning in Simulink.

Blocco Agente di reinforcement learning per Simulink.

Modellazione dell’ambiente

Crea modelli di ambiente in MATLAB e Simulink. Descrivi le dinamiche dei sistemi e fornisci segnali di osservazione e compensazione per gli agenti di addestramento.

Ambienti Simulink e Simscape

Utilizza modelli Simulink e Simscape™ per rappresentare un ambiente. Specifica i segnali di osservazione, azione e compensazione all’interno del modello.

Modello di ambiente Simulink per un pendolo inverso.

Ambienti MATLAB

Utilizza funzioni e classi MATLAB per rappresentare un ambiente. Specifica variabili di osservazione, azione e compensazione all’interno del file MATLAB.

Ambiente MATLAB per il sistema cart-pole.

Accelerazione dell’addestramento

Accelera l’addestramento utilizzando GPU, cloud e funzioni di calcolo distribuito

Calcolo distribuito e accelerazione multicore

Accelera l’addestramento eseguendo simulazioni parallele su computer multicore, risorse cloud o cluster di computer utilizzando Parallel Computing Toolbox e MATLAB Parallel Server.

Accelera l’addestramento utilizzando il calcolo parallelo.

Accelerazione GPU

Accelera l’addestramento delle reti neurali profonde e l’inferenza con GPU NVIDIA® ad alte prestazioni. Utilizza MATLAB con Parallel Computing Toolbox e la maggior parte delle GPU NVIDIA abilitate per CUDA® che hanno una capacità di elaborazione pari o superiore a 3.0.

Accelerazione dell’addestramento utilizzando GPU.

Generazione e distribuzione di codici

Distribuisci politiche addestrate su dispositivi embedded o integrale con una vasta gamma di sistemi di produzione.

Generazione di codice

Utilizza GPU Coder™ per generare codice CUDA ottimizzato dal codice MATLAB che rappresenta le politiche addestrate. Utilizza MATLAB Coder™ per generare codice C/C++ per distribuire politiche.

Generazione di codice CUDA utilizzando GPU Coder.

Supporto per MATLAB Compiler

Utilizza MATLAB Compiler™ e MATLAB Compiler SDK™ per distribuire politiche addestrate come librerie condivise C/C++, assembly Microsoft® .NET, classi Java® e pacchetti Python®.

Pacchetto e condivisione di politiche come programmi standalone.

Esempi di riferimento

Progetta un controllore utilizzando il reinforcement learning per robot, automobili a guida autonoma e altri sistemi.

Per iniziare

Implementa controllori basati sul reinforcement learning per problemi come il bilanciamento di un pendolo inverso, la navigazione in un problema di rete globale e il bilanciamento di un sistema cart-pole.

Risoluzione di un problema di rete globale.

Applicazioni per la guida autonoma

Progetta controllori per sistemi antisbandamento e cruise control adattivo.

Addestramento di un sistema antisbandamento.

Robotica

Progetta controllori per robot utilizzando il reinfrocement learning.

Addestrare un robot a camminare utilizzando il reinforcement learning.

Guarda i video di questa serie per scoprirne di più sul reinforcement learning

Hai domande?

Contatta Emmanouil Tzorakoleftherakis, esperto tecnico di Reinforcement Learning Toolbox

Latest Features

PPO Agent

Train policies using a proximal policy optimization algorithm for improved training stability

Parallel Agent Simulation

Verify trained policies by running multiple agent simulations in parallel

Reference Examples

Train reinforcement learning policies for robotics and control design applications

See the release notes for details on any of these features and corresponding functions.

Prova gratuita

30 giorni di esplorazione a tua disposizione.

Scarica ora

Pronto per acquistare?

Richiedi una quotazione ed esplora i prodotti correlati.

Sei uno Studente?

Acquista MATLAB e Simulink per studenti.

Scopri di più