Linear Regression

Che cos’è la regressione lineare?

La regressione lineare è una tecnica di modellazione statistica utilizzata per descrivere una varabile di risposta continua in funzione di una o più variabili (predittori). Può contribuire a comprendere e a prevedere il comportamento di sistemi complessi, nonché ad analizzare dati sperimentali, finanziari e biologici.

Le tecniche di regressione lineare vengono usate per creare un modello lineare. Il modello descrive la relazione tra una variabile dipendente \(y\) (chiamata anche “risposta”) in funzione di una o più variabili indipendenti \(X_i\) (chiamate anche “predittori”). L’equazione generale per un modello di regressione lineare è la seguente:

\[Y = \beta_0 + \sum \ \beta_k X_k + \epsilon_i\]

dove \(\beta\) rappresenta le stime per i parametri lineari da calcolare e \(\epsilon\) rappresenta i termini di errore.

Tipi di regressione lineare

Regressione lineare semplice: modelli che usano un solo predittore. L’equazione generale è la seguente:

\[Y = \beta_0 + \beta_1 X+ \epsilon\]

Grafico che mostra la linea della regressione lineare, valori di risposta (incidenti stradali fatali per stato) e valori predittivi (popolazione dello stato).

Esempio di regressione lineare semplice che mostra come prevedere il numero di incidenti stradali fatali in uno stato (variabile di risposta, \(Y\)) rispetto alla popolazione dello stato (variabile predittiva, \(X\).). (Guarda l’esempio di codice MATLAB® e scopri come usare l’operatore mldivide per stimare i coefficienti per una regressione lineare semplice.)

Regressione lineare multipla: modelli che usano più predittori. Questa regressione si serve di più \(X_i\) per prevedere la risposta, \(Y\). Un esempio di questa equazione è il seguente:

\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2+ \epsilon\]

Grafico che mostra la regressione lineare multipla, valori di risposta (MPG) e valori predittivi (peso e potenza).

Esempio di regressione lineare multipla, che prevede il numero di miglia per gallone (MPG) di diverse automobili (variabile di risposta, \(Y\)) in base al peso e alla cilindrata (variabili predittive, \(X_j\)). (Guarda l’esempio di codice MATLAB, scopri come usare la funzione regress e determinare la significatività della relazione di regressione lineare multipla.)

Regressione lineare multivariata: modelli per multiple variabili di risposta. Questa regressione ha più \(Y_i\) che derivano dagli stessi dati \(Y\). Vengono usate diverse forme per esprimerle. Un esempio di questo sistema con 2 equazioni è il seguente:

\[Y_1 = \beta_{01} + \beta_{11} X_1 + \epsilon_1\]

\[Y_2 = \beta_{02} + \beta_{1 2}X_1 + \epsilon_2\]

Grafico che mostra la regressione lineare multivariata, valori di risposta (stime dell’influenza per 9 regioni) e valori predittivi (settimana dell’anno).

Esempio di regressione lineare multivariata che mostra come prevedere le stime di casi di influenza per 9 regioni (variabili di risposta, \(Y_i\)), in base alla settimana dell’anno (variabile predittiva, \(X\)). (Guarda l’esempio di codice MATLAB e scopri come usare la funzione mvregress per determinare i coefficienti stimati per una regressione lineare multivariata.)

Regressione lineare multipla multivariata: modelli che usano più predittori per multiple variabili di risposta. Questa regressione ha più \(X_i\) per prevedere più risposte \(Y_i\). Una generalizzazione dell’equazione è la seguente:

Equazione per calcolare risposte multiple Yi a partire da predittori multipli Xi usando la regressione lineare multivariata.

Esempio di regressione lineare multipla multivariata che calcola il valore MPG in città e in autostrada (come variabili di risposta, \(Y_1\) e \(Y_2\)) a partire da tre variabili: passo, massa a vuoto in ordine di marcia e tipo di carburante (variabili predittive, \(X_1\), \(X_2\) e \(X_3\)). (Guarda l’esempio di codice MATLAB e scopri come usare la funzione mvregress per stimare i coefficienti.).

Applicazioni della regressione lineare

Le regressioni lineari hanno delle proprietà che le rendono particolarmente utili per le seguenti applicazioni:

  • Predizioni o previsioni – Usa un modello di regressione per creare un modello di previsione per un set di dati specifico. Dal modello, è possibile usare la regressione per prevedere i valori di risposta quando sono noti solo i predittori.
  • Forza della regressione – Usa un modello di regressione per determinare se esiste una relazione tra una variabile e un predittore e quanto è forte quella relazione.

Regressione lineare con MATLAB

Gli ingegneri creano frequentemente dei modelli di regressione lineare semplice con MATLAB. Per la regressione lineare multipla e multivariata, è possibile utilizzare Statistics and Machine Learning Toolbox™ di MATLAB. Consente di procedere a una regressione multivariata, robusta e graduale per:

  • Generare previsioni
  • Confrontare il fitting dei modelli lineari
  • Creare grafici con i residui
  • Valutare la bontà del fitting
  • Rilevare anomalie

Per creare un modello lineare idoneo al fitting di curve e superfici in base ai dati, è possibile usare Curve Fitting Toolbox™.