Statistics and Machine Learning Toolbox™ offre funzioni e app per la descrizione, l’analisi e la modellazione di dati. È possibile utilizzare la statistica e i grafici descrittivi per l’analisi esplorativa dei dati, fitting di distribuzioni di probabilità dei dati, generare numeri casuali per simulazioni Monte Carlo e condurre test di ipotesi. Gli algoritmi di regressione e classificazione consentono di fare deduzioni da dati e costruire modelli predittivi.
Per l'analisi dei dati multidimensionali, Statistics ande Machine Learning Toolbox fornisce metodi di selezione offre la selezione sequenziale delle feature, la regressione graduale, l’analisi del alle componente principale (PCA), la regolarizzazione e altri metodi di riduzione della dimensionalità che permettono di identificare le variabili o feature che influenzano il modello.
Il toolbox fornisce algoritmi per l'apprendimento automatico con e senza supervisione, compresi support vector machine (SVM), alberi decisionali con boosting e bagging, k-nearest neighbor, k-means, k-medoids, clustering gerarchico, misture di gaussiane e modelli di tipo hidden Markov. È possibile utilizzare molte delle statistiche e degli algoritmi di machine learning per eseguire calcoli sui set di dati troppo grandi per essere archiviati in memoria.