Che cos’è la regressione lineare? - MATLAB & Simulink

Regresión lineal

Che cos’è la regressione lineare?

La regressione lineare è una tecnica di modellazione statistica utilizzata per descrivere una varabile di risposta continua in funzione di una o più variabili (predittori). Può contribuire a comprendere e a prevedere il comportamento di sistemi complessi, nonché ad analizzare dati sperimentali, finanziari e biologici.

Le tecniche di regressione lineare vengono usate per creare un modello lineare. Il modello descrive la relazione tra una variabile dipendente y (chiamata anche “risposta”) in funzione di una o più variabili indipendenti Xi (chiamate anche “predittori”). L’equazione generale per un modello di regressione lineare è la seguente:

Y=β0+ βkXk+ϵi

dove β rappresenta le stime per i parametri lineari da calcolare e ϵ rappresenta i termini di errore.

Tipi di regressione lineare

Regressione lineare semplice: modelli che usano un solo predittore. L’equazione generale è la seguente:

Y=β0+β1X+ϵ

Plot showing linear regression line, response values (fatal traffic accidents per state), and predictor values (population of state).

Esempio di regressione lineare semplice che mostra come prevedere il numero di incidenti stradali fatali in uno stato (variabile di risposta, Y) rispetto alla popolazione dello stato (variabile predittiva, X). (Guarda l’esempio di codice MATLAB®e scopri come usare l’operatore mldivide per stimare i coefficienti per una regressione lineare semplice.)

Regressione lineare multipla: modelli che usano più predittori. Questa regressione si serve di più Xi per prevedere la risposta, Y. Un esempio di questa equazione è il seguente:

Y=β0+β1X1+β2X2+ϵ

Plot showing multiple linear regression, response values (MPG), and predictor values (Weight and Horsepower).

Esempio di regressione lineare multipla, che prevede il numero di miglia per gallone (MPG) di diverse automobili (variabile di risposta, Y) in base al peso e alla cilindrata (variabili predittive, Xj). (Guarda l’esempio di codice MATLAB, scopri come usare la funzione regress e determinare la significatività della relazione di regressione lineare multipla.)

Regressione lineare multivariata: modelli per multiple variabili di risposta. Questa regressione ha più Yi che derivano dagli stessi dati X. Vengono usate diverse forme per esprimerle. Un esempio di questo sistema con 2 equazioni è il seguente:

Y1=β01+β11X1+ϵ1

Y2=β02+β12X1+ϵ2

Plot showing multivariate linear regression, response values (flu estimates for 9 regions), and predictor values (week of the year).

Esempio di regressione lineare multivariata che mostra come prevedere le stime di casi di influenza per 9 regioni (variabili di risposta, Yi), in base alla settimana dell’anno (variabile predittiva, X). (Guarda l’esempio di codice MATLAB e scopri come usare la funzione mvregress per determinare i coefficienti stimati per una regressione lineare multivariata.)

Regressione lineare multipla multivariata: modelli che usano più predittori per multiple variabili di risposta. Questa regressione ha più Xi per prevedere più risposte Yi. Una generalizzazione dell’equazione è la seguente:

Equation for computing multiple responses Yi from multiple predictors Xi by using linear multivariate linear regression.

Esempio di regressione lineare multipla multivariata che calcola il valore MPG in città e in autostrada (come variabili di risposta, Y1 e Y2) a partire da tre variabili: passo, massa a vuoto in ordine di marcia e tipo di carburante (variabili predittive, X1X2 e X3). (Guarda l’esempio di codice MATLAB e scopri come usare la funzione mvregress per stimare i coefficienti).

Applicazioni della regressione lineare

Le regressioni lineari hanno delle proprietà che le rendono particolarmente utili per le seguenti applicazioni:

  • Predizioni o previsioni – Usa un modello di regressione per creare un modello di previsione per un set di dati specifico. Dal modello, è possibile usare la regressione per prevedere i valori di risposta quando sono noti solo i predittori.
  • Forza della regressione – Usa un modello di regressione per determinare se esiste una relazione tra una variabile e un predittore e quanto è forte quella relazione.

Regressione lineare con MATLAB

Gli ingegneri creano frequentemente dei modelli di regressione lineare semplice con MATLAB. Per la regressione lineare multipla e multivariata, è possibile utilizzare Statistics and Machine Learning Toolbox™ di MATLAB. Consente di procedere a una regressione multivariata, robusta e graduale per:

  • Generare previsioni
  • Confrontare il fitting dei modelli lineari
  • Creare grafici con i residui
  • Valutare la bontà del fitting
  • Rilevare anomalie

Per creare un modello lineare idoneo al fitting di curve e superfici in base ai dati, è possibile usare Curve Fitting Toolbox™.


Vedere anche: Regressione di serie storiche