Costruire modelli predittivi e riconoscere i pattern nei dati

Gli algoritmi di machine learning utilizzano metodi computazionali volti ad «apprendere» e ricavare le informazioni direttamente dai dati, senza assumere un'equazione predeterminata come modello. Essi possono migliorare le loro prestazioni all'aumento del numero di campioni disponibili per l'apprendimento.

Gli algoritmi di machine learning, che sviluppano delle regole di classificazione utilizzando per l’addestramento dei dati classificati, sono conosciuti con il nome di algoritmi di «apprendimento supervisionato». Gli algoritmi di «apprendimento non supervisionato» cercano di individuare delle strutture/informazioni utili contenute all'interno dei dati non classificati in precedenza.

I modelli di machine learning sono utilizzati in numerose applicazioni, come ad esempio in finanza computazionale (valutazione della solvibilitá delle controparti, trading algoritmico), in biologia computazionale (rilevazione di tumori, identificazione farmacologica e sequenziazione del DNA), nella produzione di energia (previsione dei prezzi e della curva di carico), processing automatico del linguaggio naturale, riconoscimento di immagini e suoni, marketing o per il suggerimento automatico. Il «machine learning» viene spesso utilizzato nell'applicazione su dati voluminosi (Big Data).

Questi dati sono caratterizzati da numerosi predittori e sono troppo complessi per un modello parametrico semplice. Ad esempio, le tecniche di apprendimento automatico sono utilizzate per prevedere la curva di carico elettrico con una rete neurale o classificare il rischio di credito utilizzando un insieme di alberi decisionali.

Algoritmi di apprendimento supervisionato comuni

Tecniche di apprendimento supervisionato per costruire modelli predittivi a partire dai dati di input e output noti:

  • Alberi decisionali con boosting e bagging
  • Support vector machine (SVM)
  • Classificatore Bayesiano Naive
  • Classificazione k-Nearest Neighbor
  • Analisi discriminante
  • Reti neurali

Algoritmi di apprendimento non supervisionato comuni

Tecniche di apprendimento non supervisionato per trovare pattern nascosti o strutture intrinseche dei dati:

  • k-mean e clustering gerarchico
  • Misture di gaussiane (tramite l’algoritmo EM – Expectation Maximization)
  • Catene di Markov nascoste
  • Mappe auto-organizzanti (SOM)
  • Reti neurali
  • Reti neurali supervisionate con apprendimento competitivo LVQ