Reinforcement Learning Toolbox
Progettare e addestrare politiche utilizzando il reinforcement learning
Reinforcement Learning Toolbox™ fornisce funzioni e blocchi per le politiche di addestramento utilizzando algoritmi di reinforcement learning tra cui DQN, A2C e DDPG. È possibile utilizzare questi algoritmi per implementare controllori e algoritmi di decision-making per sistemi complessi come robot e sistemi autonomi. È possibile implementare queste politiche utilizzando reti neurali profonde, polinomi o look-up table.
Il toolbox ti permette di addestrare politiche grazie all’interazione con ambienti rappresentati da modelli MATLAB® o Simulink®. È possibile valutare algoritmi, sperimentare le impostazioni degli iperparametri e monitorare il progresso dell’addestramento. Per migliorare le prestazioni di addestramento, è possibile eseguire simulazioni in parallelo nel cloud, in cluster di computer e GPU (con Parallel Computing Toolbox™ e MATLAB Parallel Server™).
Attraverso il formato del modello ONNX™, è possibile importare politiche esistenti da framework di deep learning come TensorFlow™ Keras e PyTorch (con Deep Learning Toolbox™). È possibile generare codice C, C++ e CUDA ottimizzati per distribuire politiche addestrate su microcontrollore e GPU.
Il toolbox include esempi di riferimento per l’uso del reinforcement learning per progettare controllori per applicazioni di robotica e di guida autonoma.
Inizia ora:
E-book gratuito
Reinforcement learning con MATLAB e Simulink
Algoritmi di reinforcement learning
Implementa agenti utilizzando Deep Q-Network (DQN), Advantage Actor Critic (A2C), Deep Deterministic Policy Gradients (DDPG) e altri algoritmi integrati. Utilizza template per implementare agenti personalizzati per le politiche di addestramento.
Rappresentazione della funzione del valore e della politica utilizzando reti neurali profonde
Utilizza le politiche di una rete neurale profonda per sistemi complessi con ampi spazi azione-stato. Definisci le politiche utilizzando reti e architetture dal Deep Learning Toolbox. Importa modelli ONNX per l’interoperabilità con altri framework di deep learning.
Blocchi Simulink per agenti
Implementa e addestra agenti di reinforcement learning in Simulink.
Ambienti Simulink e Simscape
Utilizza modelli Simulink e Simscape™ per rappresentare un ambiente. Specifica i segnali di osservazione, azione e compensazione all’interno del modello.
Ambienti MATLAB
Utilizza funzioni e classi MATLAB per rappresentare un ambiente. Specifica variabili di osservazione, azione e compensazione all’interno del file MATLAB.
Calcolo distribuito e accelerazione multicore
Accelera l’addestramento eseguendo simulazioni parallele su computer multicore, risorse cloud o cluster di computer utilizzando Parallel Computing Toolbox e MATLAB Parallel Server.
Accelerazione GPU
Accelera l’addestramento delle reti neurali profonde e l’inferenza con GPU NVIDIA® ad alte prestazioni. Utilizza MATLAB con Parallel Computing Toolbox e la maggior parte delle GPU NVIDIA abilitate per CUDA® che hanno una capacità di elaborazione pari o superiore a 3.0.
Generazione di codice
Utilizza GPU Coder™ per generare codice CUDA ottimizzato dal codice MATLAB che rappresenta le politiche addestrate. Utilizza MATLAB Coder™ per generare codice C/C++ per distribuire politiche.
Supporto per MATLAB Compiler
Utilizza MATLAB Compiler™ e MATLAB Compiler SDK™ per distribuire politiche addestrate come librerie condivise C/C++, assembly Microsoft® .NET, classi Java® e pacchetti Python®.
Per iniziare
Implementa controllori basati sul reinforcement learning per problemi come il bilanciamento di un pendolo inverso, la navigazione in un problema di rete globale e il bilanciamento di un sistema cart-pole.
Applicazioni per la guida autonoma
Progetta controllori per sistemi antisbandamento e cruise control adattivo.
Robotica
Progetta controllori per robot utilizzando il reinfrocement learning.
Reinforcement Learning a più agenti
Addestramento simultaneo di più agenti in un ambiente Simulink
Agente Soft Actor-Critic
Addestramento di politiche a basso numero di campioni per ambienti con spazi d’azione continui utilizzando l’esplorazione aumentata
Agenti predefiniti
Possibilità di evitare la formulazione di politiche a livello manuale, creando agenti con una struttura di rete neurale predefinita
Consulta le note di rilascio per ulteriori informazioni su queste caratteristiche e sulle funzioni corrispondenti.
Reinforcement Learning Video Series
Watch the videos in this series to learn about reinforcement learning.