Data clustering con l’app Neural Net Clustering

Apri live script

Questo esempio mostra come addestrare una rete neurale superficiale per eseguire il data clustering con l’app Neural Net Clustering.

Apri l’app Neural Net Clustering tramite nctool.

nctool

Selezione dei dati

L’app Neural Net Clustering contiene dei dati esemplificativi che ti aiuteranno ad iniziare ad addestrare una rete neurale.

Per importare i dati esemplificativi per il clustering del fiore Iris, seleziona Import > Import Iris Flowers Data Set (Importare > Importare set di dati fiori Iris). Se si importano dati propri da un file o da workspace, occorre specificare i predittori e se le osservazioni siano distribuite in righe o colonne.

Le informazioni sui dati importati compaiono nel Model Summary (Riepilogo modello). Questo set di dati contiene 150 osservazioni, con quattro feature ciascuna.

Creazione della rete

Per i problemi di clustering, la mappa auto-organizzante (SOM, self-organizing map) delle feature è la rete più utilizzata. Questa rete ha un unico livello e i neuroni organizzati in una griglia. Le mappe auto-organizzanti imparano a raggruppare i dati in base alle loro similarità. Per ulteriori informazioni sulle mappe SOM, vedere Cluster with Self-Organizing Map Neural Network.

Per creare la rete, specifica le dimensioni della mappa, che coincidono con il numero di righe e colonne della griglia. Per questo esempio, imposta il valore delle Map size (Dimensioni mappa) su 10, che corrisponde a una griglia con 10 righe e 10 colonne. Il numero totale di neuroni è pari al numero di punti sulla griglia. In questo esempio, la mappa ha 100 neuroni. È possibile vedere l’architettura di rete nel pannello Network.

Addestramento della rete

Per addestrare la rete, fai clic su Train (Addestrare). Nel pannello Training (Addestramento) si possono vedere i progressi dell’addestramento. L’addestramento continua fino al raggiungimento di uno dei criteri di arresto. In questo esempio, l’addestramento continua fino al raggiungimento del numero massimo di epoche.

Analisi dei risultati

Per analizzare i risultati dell’addestramento si generano dei grafici. Per l’addestramento di alcune SOM, il vettore di peso associato ad ogni neurone si sposta per diventare il centro di un cluster di vettori di input. Inoltre, anche i neuroni adiacenti l’uno all’altro nella topologia dovrebbero spostarsi l’uno vicino all’altro nello spazio di input, pertanto è possibile visualizzare uno spazio di input con elevata precisione dimensionale nelle due dimensioni della topologia di rete. La topologia predefinita per la SOM è esagonale.

Per tracciare i SOM Sample Hits, nella sezione Plots (Grafici), fai clic su Sample Hits (Hit campione). Questa figura mostra le posizioni dei neuroni all’interno della topologia e indica quante delle osservazioni sono associate ad ogni neurone (centri di cluster). La topologia è una griglia 10x10, quindi ci sono 100 neuroni. Il numero massimo di hit associati a qualunque neurone è 5. Pertanto ci sono 5 vettori di input in quel cluster.

Traccia i piani dei pesi (definiti anche piani dei componenti). Nella sezione Plots (Grafici), fai clic su Weight Planes (Piani dei pesi). Questa figura mostra un piano del peso per ciascun elemento delle feature di input (quattro nell’esempio). Il grafico mostra i pesi che collegano ogni input a ciascuno dei neuroni; i colori più scuri rappresentano i pesi più grandi. Se i modelli di connessione di due feature sono molto simili, si può presupporre che le feature siano altamente correlate.

Se non si è soddisfatti delle prestazioni della rete, si può procedere in uno dei seguenti modi:

Addestrare nuovamente la rete. Ogni addestramento ha pesi e bias iniziali della rete diversi e può produrre una rete migliore a seguito del riaddestramento.
Aumentare il numero di neuroni aumentando le dimensioni della mappa.
Usare un set più ampio di dati di addestramento.

Si può anche valutare la performance della rete su un ulteriore set di test. Per caricare ulteriori dati di test con cui valutare la rete, nella sezione Test, fai clic su Test. Generare dei grafici per analizzare i risultati di ulteriori test.

Generazione di codice

Seleziona Generate Code > Generate Simple Training Script (Generare codice > Generare script di addestramento semplice) per creare un codice MATLAB in grado di riprodurre le fasi precedenti dalla riga di comando. La creazione di codice MATLAB può essere utile se si desidera imparare come utilizzare la funzionalità della riga di comando del toolbox per personalizzare il processo di addestramento. In Data clustering con le funzioni della riga di comando, potrai esaminare più dettagliatamente gli script generati.

Esportazione della rete

Una volta addestrata, la rete può essere esportata nel workspace o in Simulink®. È anche possibile distribuire la rete con gli strumenti di MATLAB Compiler™ e altri strumenti di generazione di codice MATLAB. Per esportare la rete addestrata e i risultati, seleziona Export Model > Esport to Workspace (Esportare modello > Esportare in Workspace).

Vedi anche

Neural Net Fitting | Neural Net Time Series | Neural Net Pattern Recognition | Neural Net Clustering | train