Descrizione di relazioni matematiche ed elaborazione di previsioni a partire da dati sperimentali

La regressione lineare è una tecnica di modellazione statistica utilizzata per descrivere una varabile di risposta continua in funzione di una o più variabili (predittori). Può contribuire a comprendere e a prevedere il comportamento di sistemi complessi, nonché ad analizzare dati sperimentali, finanziari e biologici.

Le tecniche di regressione lineare vengono usate per creare un modello lineare. Il modello descrive la relazione tra una variabile dipendente \(y\) (chiamata anche “risposta”) in funzione di una o più variabili indipendenti \(X_i\) (chiamate anche “predittori”). L’equazione generale per un modello di regressione lineare è la seguente:

\[Y = \beta_0 + \sum \ \beta_i X_i + \epsilon_i\]

dove \(\beta\) rappresenta le stime per i parametri lineari da calcolare e \(\epsilon\) rappresenta i termini di errore.

Tipi di regressione lineare

Regressione lineare semplice: modelli che usano un solo predittore. L’equazione generale è la seguente:

\[Y = \beta_0 + \beta_i X+ \epsilon_i\]

Esempio di regressione lineare semplice che mostra come prevedere il numero di incidenti stradali fatali in uno stato (variabile di risposta, \(Y\)) rispetto alla popolazione dello stato (variabile predittiva, \(X\).). (Guarda l’esempio di codice MATLAB® e scopri come usare l’operatore mldivide per stimare i coefficienti per una regressione lineare semplice.)

Regressione lineare multipla: modelli che usano più predittori. Questa regressione si serve di più \(X_i\) per prevedere la risposta, \(Y\). Un esempio di questa equazione è il seguente:

\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2+ \epsilon\]

Esempio di regressione lineare multipla, che prevede il numero di miglia per gallone (MPG) di diverse automobili (variabile di risposta, \(Y\)) in base al peso e alla cilindrata (variabili predittive, \(X_j\)). (Guarda l’esempio di codice MATLAB, scopri come usare la funzione regress e determinare la significatività della relazione di regressione lineare multipla.)

Regressione lineare multivariata: modelli per multiple variabili di risposta. Questa regressione ha più \(Y_i\) che derivano dagli stessi dati \(Y\). Vengono usate diverse forme per esprimerle. Un esempio di questo sistema con 2 equazioni è il seguente:

\[Y_1 = \beta_{01} + \beta_{11} X_1 + \epsilon_1\]

\[Y_2 = \beta_{02} + \beta_{1 2}X_1 + \epsilon_2\]

Esempio di regressione lineare multivariata che mostra come prevedere le stime di casi di influenza per 9 regioni (variabili di risposta, \(Y_i\)), in base alla settimana dell’anno (variabile predittiva, \(X\)). (Guarda l’esempio di codice MATLAB e scopri come usare la funzione mvregress per determinare i coefficienti stimati per una regressione lineare multivariata.)

Regressione lineare multipla multivariata: modelli che usano più predittori per multiple variabili di risposta. Questa regressione ha più \(X_i\) per prevedere più risposte \(Y_i\). Una generalizzazione dell’equazione è la seguente:

Esempio di regressione lineare multipla multivariata che calcola il valore MPG in città e in autostrada (come variabili di risposta, \(Y_1\) e \(Y_2\)) a partire da tre variabili: passo, massa a vuoto in ordine di marcia e tipo di carburante (variabili predittive, \(X_1\), \(X_2\) e \(X_3\)). (Guarda l’esempio di codice MATLAB e scopri come usare la funzione mvregress per stimare i coefficienti.).

Applicazioni della regressione lineare

Le regressioni lineari hanno delle proprietà che le rendono particolarmente utili per le seguenti applicazioni:

  • Predizioni o previsioni – Usa un modello di regressione per creare un modello di previsione per un set di dati specifico. Dal modello, è possibile usare la regressione per prevedere i valori di risposta quando sono noti solo i predittori.
  • Forza della regressione – Usa un modello di regressione per determinare se esiste una relazione tra una variabile e un predittore e quanto è forte quella relazione.

Regressione lineare con MATLAB

Gli ingegneri creano frequentemente dei modelli di regressione lineare semplice con MATLAB. Per la regressione lineare multipla e multivariata, è possibile utilizzare Statistics and Machine Learning Toolbox™ di MATLAB. Consente di procedere a una regressione multivariata, robusta e graduale per:

  • Generare previsioni
  • Confrontare il fitting dei modelli lineari
  • Creare grafici con i residui
  • Valutare la bontà del fitting
  • Rilevare anomalie

Per creare un modello lineare idoneo al fitting di curve e superfici in base ai dati, è possibile usare Curve Fitting Toolbox™.