Cosa sono le reti neurali informate dalla fisica (PINN)?

Le reti neurali informate dalla fisica (PINN) sono reti neurali che incorporano le leggi fisiche descritte da equazioni differenziali nelle loro funzioni di perdita per guidare il processo di apprendimento verso soluzioni più coerenti con la fisica sottostante. Le PINN possono essere utilizzate per:

Approssimare soluzioni a equazioni differenziali alle derivate parziali (PDE) e a equazioni differenziali ordinarie (ODE).
Risolvere problemi inversi, come stimare i parametri dei modelli a partire da dati limitati.

Con Deep Learning Toolbox™, è possibile creare e addestrare PINN per abilitare l’analisi predittiva rapida. È possibile integrare le PINN con MATLAB^® e Simulink^® per la simulazione a livello di sistema, la progettazione dei controllo e l’ottimizzazione dei progetti.

Diagramma che mostra come il Deep Learning e le conoscenze nell’ambito della fisica si combinano per formare le PINN. — Le reti neurali informate dalla fisica (PINN) includono le leggi di governo della fisica nell’addestramento dei modelli di Deep Learning per abilitare la previsione e la modellazione di fenomeni complessi promuovendo, al contempo, il rispetto dei principi fisici fondamentali.

I vantaggi delle PINN

Le PINN sono una classe di metodi di Machine Learning basati sulla fisica che integrano perfettamente le conoscenze nel campo della fisica ai dati. Le PINN vengono spesso messe a confronto con metodi puramente basati sui dati e metodi numerici tradizionali per risolvere problemi che coinvolgono PDE e ODE.

A differenza degli approcci basati puramente sui dati, i quali apprendono le relazioni matematiche esclusivamente a partire da dati di input e di output, le PINN:

Sfruttano conoscenze pregresse nel campo della fisica.
Fanno previsioni più precise al di fuori del set di dati di addestramento.
Sono più efficaci in presenza di dati di addestramento limitati o affetti da errori.

A differenza dei metodi numerici tradizionali per risolvere le equazioni differenziali, come l’analisi agli elementi finiti per le PDE, le PINN:

Non usano le mesh.
Sono in grado di approssimare soluzioni di PDE di grandi dimensioni.
Sono in grado di trovare soluzioni in caso di parametri del modello mancanti, come coefficienti di PDE o ODE non noti.
Sono in grado di risolvere problemi mal posti in cui non esistono dati limite.
Sono in grado di integrare con facilità misurazioni sparse o affette da errore.

Sebbene le PINN offrano dei potenziali vantaggi rispetto ai metodi puramente basati sui dati e ai metodi numerici tradizionali, presentano anche alcune limitazioni e pongono delle sfide, tra cui:

Teoria della convergenza limitata
Mancanza di una strategia di addestramento unificata
Costo computazionale per il calcolo delle derivate di ordine superiore
Difficoltà nell’apprendimento di componenti multiscala e ad alta frequenza di soluzioni di PDE

Tuttavia, le PINN sono un’area di ricerca dinamica in cui vengono continuamente fatti dei progressi che dovrebbero risolvere e superare le limitazioni e le difficoltà esistenti.

La scelta tra PINN, un approccio basato sui dati e un metodo numerico tradizionale dipende dalla propria applicazione. Nella tabella che segue sono riepilogati i vantaggi e i limiti di ogni metodo.

Caratteristiche delle PINN confrontate con approcci basati puramente sui dati, che apprendono le relazioni matematiche esclusivamente da dati di input-output, e con metodi numerici tradizionali, come la FEA per l’approssimazione di soluzioni alle PDE.
	Approcci basati puramente sui dati	Metodi numerici tradizionali	PINN
Integrano la fisica nota
Generalizzano bene con dati di addestramento limitati o affetti da errore
Risolvono contemporaneamente problemi diretti e inversi
Risolvono PDE di grandi dimensioni
Consentono una rapida previsione “online”
Non usano mesh
Hanno una teoria della convergenza consolidata
Sono scalabili con PDE multiscala e ad alta frequenza

Differenze tra le PINN e le reti neurali tradizionali

Le PINN differiscono dalle reti neurali tradizionali perché sono in grado di integrare una conoscenza del dominio a priori del problema sotto forma di equazioni differenziali. Queste informazioni aggiuntive consentono alle PINN di fare previsioni più accurate al di fuori dei dati di misurazione forniti. Per di più, queste conoscenze aggiuntive sulla fisica regolarizzano la soluzione prevista in presenza di dati di misurazione affetti da errore, consentendo alle PINN di apprendere il vero segnale sottostante invece di effettuare l’overfitting dei dati rumorosi.

Per esempio, consideriamo uno scenario in cui sono state raccolte le misurazioni affette da errore, \( θ_{meas} \), di un sistema di interesse e l’obiettivo è quello di prevedere i valori futuri del sistema, \( θ_{pred} \), con una rete neurale artificiale feed-forward. La rete viene addestrata con le misurazioni disponibili e sarà utilizzata per prevedere i valori futuri inosservati. Per addestrare una rete neurale di regressione in genere occorre minimizzare l’errore quadratico medio tra le previsioni della rete neurale e le misurazioni fornite.

Illustrazione grafica di una rete neurale che raffigura i dati misurati e la verità di base (ground truth), oltre a una funzione di perdita dell’errore quadratico medio. — Le reti neurali tradizionali regolano i loro parametri per minimizzare l’errore tra la previsione della rete e le misurazioni osservate.

La rete neurale ha difficoltà a prevedere in modo accurato i valori del sistema al di fuori dei dati di addestramento.

Una rete neurale semplice, addestrata con la funzione trainnet di Deep Learning Toolbox, esegue l’overfitting delle misurazioni affette da errore e ottiene risultati scarsi per t al di fuori dell’intervallo disponibile. (Cfr. codice MATLAB.)

Sebbene l’acquisizione di un maggior numero di dati potrebbe ottimizzare le previsioni, questo approccio potrebbe risultare eccessivamente costoso o impossibile per molte applicazioni. Tuttavia, spesso l’esperto del settore è in possesso di conoscenze più approfondite in merito al processo fisico sottostante che governa il sistema oggetto di studio. Nello specifico, in questo scenario, le misurazioni rappresentano lo spostamento angolare dalla verticale di un carico oscillante da una gru. Questo processo può essere rappresentato in maniera semplicistica da un pendolo smorzato, che può essere modellato in modo approssimativo per angoli piccoli mediante un’equazione differenziale di secondo ordine lineare:

\( θ^{''}(t)+2βθ^{′}(t)+ω^{2}_{0}θ(t)=0 \)

Piuttosto che ignorare queste conoscenze, le PINN integrano l’equazione differenziale come termine aggiuntivo informato dalla fisica nella funzione di perdita. Le PINN valutano il residuo dell’equazione differenziale in corrispondenza di punti aggiuntivi nel dominio, il che fornisce ulteriori informazioni alla PINN senza che siano necessarie altre misurazioni. Sebbene questo semplice esempio possa essere risolto in modo analitico, illustra i concetti che sono alla base delle PINN.

Diagramma di una rete neurale informata dalla fisica, equazioni differenziali del pendolo e rappresentazione grafica dei dati misurati e della verità di base (ground truth). — Le PINN, disponibili in Deep Learning Toolbox, regolano i propri parametri per controbilanciare la minimizzazione dell’errore tra la previsione della rete e le misurazioni osservate e la perdita nella fisica.

Durante l’addestramento, le PINN trovano un equilibrio tra il fitting delle misurazioni date e del processo fisico sottostante.

Una PINN, creata e addestrata con Deep Learning Toolbox, fa previsioni migliori al di fuori dei dati di misurazione ed è più efficace in presenza di rumore rispetto alla rete neurale tradizionale. (Cfr. codice MATLAB.)

Incorporando un termine di perdita nella fisica extra, le PINN ottengono risultati migliori rispetto alle reti neurali tradizionali nel fare previsioni in presenza di misurazioni affette da errore e in regimi di dati senza misurazioni.

Come funzionano le PINN

Le PINN usano gli algoritmi di ottimizzazione per aggiornare in modo iterativo i parametri di una rete neurale fino a quando il valore di una funzione di perdita specificata informata dalla fisica diminuisce fino a un livello accettabile, portando la rete verso la soluzione dell’equazione differenziale.

Diagramma di una rete neurale informata dalla fisica con equazioni di addestramento per pendolo, condizioni iniziali, dati di misurazione aggiuntivi e funzione di perdita. — Nell’addestramento delle PINN per una ODE come l’equazione del pendolo, un algoritmo di ottimizzazione regola i parametri della rete neurale per ridurre una funzione di perdita (compreso il residuo dell’equazione differenziale dalla differenziazione automatica (AD), le condizioni limite e iniziali ed eventualmente altri dati etichettati) a un livello accettabile.

Le PINN hanno delle funzioni di perdita, \( L \), composte da vari termini: il termine di perdita informato dalla fisica, \( L_{Physics} \), facoltativamente termini che valutano l’errore tra i valori previsti dalla rete e qualsivoglia valore stabilito da dati iniziali e/o limite, \( L_{Conds} \) e altre misurazioni aggiuntive, \( L_{Data} \). Il termine di perdita informato dalla fisica valuta il residuo dell’equazione differenziale in corrispondenza di punti nel dominio usando la differenziazione automatica (AD) o altre tecniche di differenziazione numerica. Poiché il termine informato dalla fisica non calcola l’errore tra una previsione e un valore bersaglio, può essere considerato un termine di perdita senza supervisione, il che significa che la rete può essere addestrata con qualsiasi punto del dominio, anche in assenza di misurazioni in corrispondenza di tali punti.

Introdotte per la prima volta nel 2017, oggi le PINN sono disponibili in numerose varianti, tra cui:

PINN Bayesiane (BPINN), che usano il framework bayesiano per la quantificazione dell’incertezza
PINN variazionali (VPINN), che integrano la forma debole di una PDE nella funzione di perdita
PINN addestrate con formulazione di primo ordine (FO-PINN), che possono essere più rapide e precise nel risolvere le PDE di ordine superiore rispetto alle PINN standard

In più, le PINN possono essere usate con diverse architetture di rete neurale, come ad esempio le reti neurali a grafo (GNN), gli operatori neurali di Fourier (FNO), le architetture di rete profonde (DeepONet), fino a giungere alle cosiddette versioni informate dalla fisica di queste architetture.

MATLAB e Deep Learning Toolbox supportano in modo esaustivo lo sviluppo delle PINN, dalla creazione o importazione di svariate architetture di rete neurale, alla definizione di funzioni di perdita informate dalla fisica personalizzate con AD, l’addestramento tramite algoritmi di ottimizzazione basati su gradienti quali ADAM o L-BFGS, fino a giungere alla visualizzazione di soluzioni con la grafica avanzata di MATLAB.

Applicazioni delle PINN

Le PINN sfruttano il Deep Learning migliorando al contempo la conformità alle leggi fisiche, il che le rende uno strumento versatile per applicazioni in cui la fisica è nota a livello totale o parziale, come nel caso di una PDE o una ODE con coefficienti sconosciuti. Esempi di applicazioni delle PINN:

Trasferimento di calore, nello specifico per la modellazione dei processi di distribuzione e trasferimento del calore. Le PINN possono incorporare le equazioni di governo che modellano i processi termici in materiali e sistemi, come l’equazione del calore, nella funzione di perdita. Adottando questo approccio ci si assicura che le soluzioni rispetteranno queste leggi fisiche, in modo tale da ottenere previsioni fisicamente plausibili. In più, le PINN possono sostituire le costose simulazioni numeriche per approssimare rapidamente le distribuzioni della temperatura su geometrie parametrizzate nelle applicazioni di ottimizzazione dei progetti. Le PINN possono essere utilizzate anche nei problemi inversi per identificare delle proprietà sconosciute dei materiali, come la conduttività termica.
Fluidodinamica computazionale (CFD), in particolare per l’approssimazione dei campi di velocità, pressione e temperatura dei fluidi, grazie all’integrazione delle equazioni Navier-Stokes nella funzione di perdita. Le PINN possono essere impiegate nelle simulazioni predittive senza mesh per prevedere con precisione queste quantità o nei problemi inversi in cui l’obiettivo consiste nell’inferire parametri o input sconosciuti, come le condizioni limite, i termini sorgente o le proprietà dei fluidi, a partire dai dati osservati.
Meccanica strutturale, per risolvere sia i problemi diretti che quelli inversi incorporando le leggi di governo della fisica, come le equazioni di elasticità e dinamica strutturale, direttamente nella funzione di perdita. Questa integrazione consente alle PINN di prevedere con precisione le risposte strutturali, quali le deformazioni, le sollecitazioni e le tensioni in condizioni e con carichi differenti, oltre a riconoscere proprietà non note dei materiali o carichi esterni sulla base dei dati osservati. Le PINN, particolarmente utili in scenari in cui le soluzioni analitiche sono impraticabili o i dati sono scarsi, riducono la dipendenza da set di dati di grandi dimensioni sfruttando i principi della fisica per guidare il processo di apprendimento. La flessibilità delle PINN ne consente l’utilizzo nella gestione di problemi complessi, come il comportamento dei materiali non lineare e la modellazione multifisica.

Una volta create e addestrate con Deep Learning Toolbox, le PINN possono essere integrate con estrema facilità con Optimization Toolbox™ per l’ottimizzazione dei progetti, collegate a Simulink per la simulazione a livello di sistema e impiegate in numerose altre applicazioni.

Esempi e consigli pratici

Riferimenti software

dlgradient: calcolare i gradienti per loop di addestramento personalizzati con la differenziazione automatica - Funzione
dlnetwork: rete neurale per Deep Learning - Oggetto
Loop di addestramento personalizzati - Documentazione
adamupdate: aggiornare i parametri con la stima adattiva del momento (Adam) - Funzione
lbfgsupdate: aggiornare i parametri con BFGS a memoria limitata (L-BFGS) - Funzione

Vedere anche: Deep Learning Toolbox, Partial Differential Equation Toolbox, analisi agli elementi finiti, modellazione di ordine ridotto, rete neurale Hamiltoniana, modellazione di sistemi dinamici con ODE neurali, Deep Learning, reti neurali convoluzionali (CNN), reti generative avversarie (GAN), reti Long Short-Term Memory (LSTM), reti neurali ricorrenti (RNN), reti neurali

Prova gratis

Prova MATLAB, Simulink e molto altro ancora.

Inizia subito

Reti neurali informate dalla fisica (PINN)