Statistics and Machine Learning Toolbox

Analizzare e modellare i dati con la statistica e le tecniche di machine learning

 

Statistics and Machine Learning Toolbox™ offre funzioni e app per la descrizione, l’analisi e la modellazione di dati. Puoi utilizzare la statistica e i grafici descrittivi per l’analisi esplorativa dei dati, il fitting di distribuzioni di probabilità sui dati, generare numeri casuali per simulazioni Monte Carlo e condurre test di ipotesi. Gli algoritmi di regressione e classificazione consentono di fare deduzioni da dati e costruire modelli predittivi.

Per l’analisi dei dati multidimensionali, Statistics and Machine Learning Toolbox fornisce metodi di selezione delle feature, di regressione graduale, di analisi dei componenti principali (PCA), di regolarizzazione e altri metodi di riduzione della dimensionalità che permettono di identificare le variabili o feature che influenzano il modello.

Il toolbox fornisce algoritmi per il machine learning con e senza supervisione, compresi support vector machine (SVM), alberi decisionali con boosting e bagging, k-nearest neighbor, k-means, k-medoids, clustering gerarchico, misture di gaussiane e modelli di tipo hidden Markov. È possibile utilizzare molte delle statistiche e degli algoritmi di machine learning per eseguire calcoli sui set di dati troppo grandi per essere archiviati in memoria.

Analisi esplorativa dei dati

Esplora i dati tramite rappresentazione statistica con grafici interattivi e statistiche descrittive. Individua i pattern e le feature con il clustering.

Visualizzazioni

Esplora visivamente i dati con grafici di probabilità, grafici a scatola, istogrammi, grafici quantile-quantile e grafici avanzati per l’analisi multivariata, come i dendrogrammi, i biplot e i grafici di Andrews.

Usa uno scatter plot multidimensionale per studiare i rapporti tra le variabili.

Statistica descrittiva

Comprendi e descrivi quantità di dati potenzialmente grandi in modo rapido attraverso alcuni numeri altamente significativi.

Esplora i dati usando le varianze e le medie raccolte.

Cluster Analysis

Scopri i pattern raggruppando i dati con k-means, k-medoids, DBSCAN, il clustering gerarchico, modelli di misture gaussiane e di tipo hidden Markov.

Applicazione di DBSCAN a due gruppi concentrici.

Estrazione di feature e riduzione di dimensionalità

Trasforma i dati non elaborati in feature più adatte al machine learning. Esplora e crea nuove feature in modo iterativo, poi seleziona quelle che ottimizzano le prestazioni.

Estrazione di feature

Estrai le feature dai dati usando tecniche di apprendimento non supervisionato come il filtraggio sparso e l’ICA di ricostruzione. Puoi anche utilizzare tecniche specializzate per estrarre feature da immagini, segnali, testo e dati numerici.

Estrazione delle feature dai segnali trasmessi da dispositivi mobili. 

Selezione delle feature

Individua automaticamente il sottogruppo di feature che fornisce il migliore potere predittivo nella modellazione dei dati. I metodi di selezione delle feature comprendono la regressione graduale, la selezione sequenziale delle feature, la regolarizzazione e i metodi di ensemble.

La NCA aiuta a selezionare le feature che conservano gran parte della precisione del modello.

Trasformazione delle feature e riduzione della dimensionalità

Riduci la dimensionalità trasformando le feature esistenti (non categoriche) in nuove variabili esplicative (predittori) in cui è possibile eliminare le feature meno descrittive. I metodi di trasformazione delle feature comprendono la PCA, l’analisi fattoriale e la fattorizzazione matrice non negativa.

Con la PCA vengono proiettate diverse variabili su alcune variabili ortogonali che preservano gran parte delle informazioni.

Machine learning

Costruisci modelli di regressione e classificazione predittiva con le app interattive. Seleziona automaticamente le feature e affina i modelli tramite l’ottimizzazione degli iperparametri.

Addestrare, convalidare e affinare i modelli predittivi

Confronta i vari algoritmi di machine learning, seleziona le feature, regola gli iperparametri e valuta le prestazioni predittive.

Classificazione

Modella una variabile di risposta categorica in funzione di uno o più predittori. Usa una varietà di algoritmi di classificazione parametrici e non parametrici, tra cui la regressione logistica, le SVM, gli alberi decisionali con boosting e bagging, Naïve Bayes, l’analisi discriminante e k-Nearest Neighbor.

Addestramento interattivo dei classificatori con l’app Classification Learner.

Ottimizzazione automatica dei modelli

Aumenta le prestazioni dei modelli affinando automaticamente gli iperparametri, selezionando le feature e occupandoti degli squilibri dei set di dati con le matrici dei costi.

Ottimizzazione efficace dei parametri con l’ottimizzazione bayesiana.

Regressione e ANOVA

Modella una variabile di risposta continua in funzione di uno o più predittori, usando la regressione lineare e non lineare, i modelli a effetti misti, i modelli lineari generalizzati e la regressione non parametrica. Assegna la varianza a fonti diverse con ANOVA.

Regressione lineare e non lineare

Modella il comportamento di sistemi complessi con più predittori o variabili di risposta scegliendo tra svariati algoritmi di regressione lineare e non lineare. Esegui il fitting di modelli multilivello o gerarchici, lineari, non lineari e lineari generalizzati a effetti misti con effetti casuali nidificati e/o incrociati, per procedere ad analisi longitudinali o di tipo panel, a misurazioni ripetute e alla modellazione della crescita.

Esegui il fitting dei modelli di regressione in modo interattivo con l’app Regression Learner.

Regressione non parametrica

Genera un fitting accurato senza specificare un modello che descriva la relazione tra predittori e risposta, comprese le SVM, le Random Forest, i processi gaussiani e i kernel gaussiani.

 Identifica gli outlier usando la regressione quantile.

Analisi di varianza (ANOVA)

Assegna la varianza campione a diverse sorgenti e determina se la variazione compare all’interno o tra diversi gruppi di popolazione. Usa l’ANOVA a una via, a due vie, a più vie, multivariata e non parametrica, oltre all’analisi di covarianza (ANOCOVA) e all’analisi della varianza a misure ripetute (RANOVA).

Test di gruppi con ANOVA a più vie.

Distribuzioni di probabilità e test di ipotesi

Adatta le distribuzioni ai dati. Analizza se le differenze da campione a campione sono significative o coerenti con la variazione dei dati casuali. Genera numeri casuali da svariate distribuzioni.

Distribuzioni di probabilità

Esegui il fitting di distribuzioni continue e discrete, utilizza grafici statistici per valutare la bontà del fitting e calcola le funzioni di densità di probabilità e le funzioni di distribuzione cumulativa per più di 40 distribuzioni diverse.

Esegui il fitting delle distribuzioni in modo interattivo con l’app Distribution Fitter.

Generazione di numeri casuali

Genera sequenze di numeri pseudo-casuali e quasi-casuali da distribuzioni di probabilità sottoposte a fitting o costruite.

Genera numeri casuali in modo interattivo.

Test di ipotesi

Esegui test T, test di distribuzione (chi-quadrato, Jarque-Bera, Lilliefors e Kolmogorov-Smirnov) e test non parametrici per campioni singoli, accoppiati o indipendenti. Testa l’autocorrezione e la casualità, poi confronta le distribuzioni (Kolmogorov-Smirnov a due campioni).

Regione di rifiuto in un test T unidirezionale.

Statistica industriale

Analizza statisticamente effetti e trend di dati. Implementa tecniche di statistica industriale, quali la progettazione personalizzata di esperimenti e il controllo dei processi basato sulla statistica.

Progettazione di esperimenti (DOE)

Definisci, analizza e visualizza una DOE (progettazione di esperimenti) personalizzata. Crea e testa dei piani pratici su come manipolare i dati in ingresso in tandem per generare informazioni circa i loro effetti sui dati in uscita.

Applica una progettazione Box-Behnken per generare superfici di risposta di ordine superiore.

Controllo statistico di processo (SPC)

Monitora e migliora prodotti o processi valutando la variabilità del processo. Crea grafici di controllo, stima la funzionalità del processo ed esegui studi di ripetibilità e riproducibilità.

Monitoraggio dei processi di produzione mediante i grafici di controllo.

Analisi di affidabilità e sopravvivenza

Visualizza e analizza i dati relativi ai guasti con o senza censura eseguendo la regressione di Cox (dei rischi proporzionali) e adatta le distribuzioni. Calcola le funzioni di distribuzione cumulativa, di sopravvivenza e di rischio empirico, oltre alle stime kernel di densità.

Dati di guasto come esempio di valori “censurati”.

Passaggio ai big data e al cloud

Applica tecniche statistiche e di machine learning ai dati out of memory. Accelera i calcoli statistici e l’addestramento dei modelli di machine learning su cluster e istanze cloud.

Analizzare i big data con i tall array

Utilizza tall array e tabelle con svariati algoritmi di classificazione, regressione e clustering per addestrare i modelli su set di dati troppo grandi per la memoria senza dover modificare il codice.

Velocizza i calcoli con Parallel Computing Toolbox o MATLAB Parallel Server™.

Cloud e distributed computing

Usa le istanze cloud per accelerare i calcoli statistici e di machine learning. Esegui il flusso di lavoro completo di machine learning in MATLAB Online™.

Esegui i calcoli sulle istanze cloud di Amazon o Azure.

Distribuzione e generazione di codice

Distribuisci le operazioni di statistica e machine learning su sistemi embedded, accelera i calcoli computazionalmente onerosi con il codice C e integra sistemi enterprise.

Generazione di codice

Genera codice C o C++ leggibile e portabile per l’inferenza di algoritmi di classificazione e regressione, statistiche descrittive e distribuzioni di probabilità con MATLAB CoderTM. Accelera il processo di verifica e convalida delle tue simulazioni ad alta fedeltà con modelli di machine learning usando i blocchi MATLAB Function e MATLAB System.

Due percorsi per la distribuzione: generazione di codice C o compilazione di codice MATLAB.

Integrazione di applicazioni e sistemi enterprise

Distribuisci modelli statistici e di machine learning come applicazioni standalone, di tipo MapReduce e Spark™, app web e add-in per Microsoft® Excel® con MATLAB Compiler™. Costruisci librerie condivise C/C++, assembly Microsoft .NET, classi Java® e pacchetti Python® con MATLAB Compiler SDK™.

Usa MATLAB Compiler per integrare un modello per la classificazione della qualità dell’aria.

Aggiornamento dei modelli distribuiti

Aggiorna i parametri dei modelli distribuiti senza dover rigenerare codice di previsione C/C++.

Flusso di lavoro per la generazione di codice e l’aggiornamento del modello.

Funzionalità recenti

App di apprendimento automatico

ottimizzazione degli iperparametri in Classification Learner e Regression Learner e definizione dei costi di errata classificazione in Classification Learner

Generazione di codice

aggiornamento di un albero decisionale o di un modello lineare distribuito senza rigenerare il codice e generazione di codice C/C ++ per funzioni di distribuzione della probabilità (richiede MATLAB Coder)

Generazione di codice

generazione di codice C/C ++ in virgola fissa per la previsione di un modello SVM (richiede MATLAB Coder e Fixed-Point Designer)

Clustering spettrale

esecuzione del clustering spettrale utilizzando spectralcluster

Classificazione delle funzionalità

classificazione delle funzionalità numeriche e categoriche in base alla rispettiva importanza utilizzando un algoritmo di minima ridondanza e massima rilevanza (MRMR) e classificazione delle funzionalità per l’apprendimento senza supervisione utilizzando i punteggi Laplaciani

Guarda le note di rilascio per ulteriori informazioni su queste caratteristiche e sulle funzioni corrispondenti.

Prova gratuita

30 giorni di esplorazione a tua disposizione.

Scarica ora

Pronto per acquistare?

Richiedi una quotazione ed esplora i prodotti correlati.

Sei uno Studente?

Acquista MATLAB e Simulink per studenti.

Scopri di più