Visualizzazione dei dati

 

Che cos’è la visualizzazione dei dati?

3 cose da sapere

La visualizzazione dei dati è un processo che consiste nel tradurre dei dati in rappresentazioni grafiche come i tracciati, i grafici, le mappe e le visualizzazioni 3D, che ti aiutano a identificare con facilità pattern, tendenze e outlier nei dati.

Queste visualizzazioni dei dati consentono di vedere le relazioni che sarebbe difficile, se non impossibile, osservare guardando semplicemente i dati grezzi, soprattutto con grandi set di dati provenienti da fonti quali sensori, data logger, cartelle cliniche, criteri di ricerca sul web e modelli di acquisto. La visualizzazione dei dati svolge un ruolo centrale nella conversione dei dati in informazioni utilizzabili.

Perché è utile la visualizzazione dei dati?

Le tecniche di visualizzazione dei dati variano da un dominio all’altro.

Finanza computazionale

Nei settori che usano dati di mercato storici o in tempo reale, la visualizzazione dei dati è utile a identificare rapidamente pattern e tendenze, a rilevare le anomalie e a ottenere informazioni utili. La visualizzazione dei dati aiuta a effettuare analisi, sviluppare modelli predittivi, valutare i rischi e formalizzare strategie di trading.

Il grafico riportato qui sotto simula il comportamento futuro del prezzo spot dell’energia elettrica a partire da un modello di serie storica adattato ai dati storici.

Grafico dei prezzi spot dell’energia elettrica che mostra i prezzi spot e i trend storici e i prezzi spot e i trend simulati. Le date sono riportate sull’asse x e il prezzo spot sull’asse y.

Grafico dei prezzi spot dell’energia elettrica che mostra i dati storici con il trend deterministico previsto.

Elaborazione di segnali

L’elaborazione di segnali viene impiegata in applicazioni quali l’analisi vocale, il monitoraggio del battito cardiaco, le comunicazioni wireless, il telerilevamento, il monitoraggio dello stato del clima e il GPS. Tra le attività più comuni compaiono la pre-elaborazione e il confronto di segnali, la progettazione di filtri digitali, la trasformazione di segnali, l’esecuzione di misurazioni e il rilevamento di pattern ed eventi. Le visualizzazioni dei dati vengono utilizzate per analizzare segnali di interesse nel dominio della frequenza, del tempo e del tempo-frequenza.

Il grafico riportato qui sotto rappresenta dati audio di una balenottera azzurra del Pacifico. La visualizzazione viene creata in MATLAB® utilizzando l’app Signal Analyzer, che aiuta a visualizzare i segnali nel dominio del tempo e della frequenza.

Screenshot dell’app Signal Analyzer con dati di segnali estratti dall’audio di una balenottera azzurra del Pacifico e grafico dei dati.

Regione di interesse estratta dall’audio di una balenottera azzurra del Pacifico.

Elaborazione di immagini e visione artificiale

L’elaborazione di immagini e video aiuta a individuare forme, contare oggetti, identificare colori, misurare le proprietà degli oggetti e a trovare altre informazioni di rilievo. Le tecniche di elaborazione di immagini sono spesso applicate come fase di pre-elaborazione nel workflow della visione artificiale. Le applicazioni in questo dominio comprendono il riconoscimento facciale per gli smartphone, l’evitamento di pedoni e veicoli nei veicoli a guida autonoma, la videosorveglianza, il rilevamento di tumori nelle MRI mediche e altri sistemi di recupero immagini.

Ad esempio, BMW utilizza le funzionalità di visione artificiale nell'Assisted Driving View (ADV) per raffigurare i veicoli circostanti e identificarne il tipo.

Screenshot di B M W Assisted Driving View che dimostra il rilevamento oggetti.

BMW Assisted Driving View. MATLAB è stato utilizzato per la verifica automatizzata, tra cui la registrazione di immagini, il rilevamento oggetti, l’etichettatura di verità di base (ground truth) e il test di una scena ADV rispetto all’output di test.

Intelligenza artificiale (IA)

La visualizzazione dei dati svolge un ruolo cruciale nello sviluppo di modelli di IA, tramite l’uso del Machine Learning o del Deep Learning, in quanto i modelli vengono costruiti sulla base di set di dati di grandi dimensioni, che sono difficili da interpretare. Nel Machine Learning, l’analisi dei cluster aiuta a rilevare le anomalie e a pre-elaborare i dati nell’apprendimento supervisionato. L’analisi dei componenti principali (PCA) e t-distributed Stochastic Neighbor Embedding (t-SNE) sono le due tecniche di visualizzazione dei dati più utilizzate in quanto aiutano a ridurre le dimensioni dei dati per potersi focalizzare sulle dimensioni di differenziazione chiave.

Nel Deep Learning, è possibile monitorare i progressi dell’addestramento utilizzando delle visualizzazioni dei dati come i grafici di accuratezza e perdita di rete e analizzare le reti addestrate usando tecniche di visualizzazione quali Grad-CAM (Gradient-weighted Class Activation Mapping), sensibilità all’occlusione, LIME (Local Interpretable Model-agnostic Explanation) e Deep Dream.

Grafico della distanza di Mahalanobis, della funzione coseno, di Chebyshev ed euclideo di tre specie diverse di iris.

Grafici di specie diverse di iris usando il dataset Iris di Fisher. Visualizzazioni rappresentate graficamente con la funzione tsne.

Come funziona la visualizzazione dei dati?

I pacchetti software dispongono di funzionalità per trasformare dati grezzi in visualizzazioni composite, come i tracciati, i grafici e i diagrammi. Quello che segue è un esempio illustrativo di dati di densità del flusso di biciclette. Tramite una semplice ispezione visiva dei dati grezzi è difficile stabilire il rapporto che lega i vari dati.

Anteprima dei dati di densità del flusso di biciclette.
Data/ora Giorno Totale Direzione ovest Direzione est Ora
‘24-06-2015 07:00:00’ ‘Mercoledì’ 141 13 128 7
‘24-06-2015 08:00:00’ ‘Mercoledì’ 327 44 283 8
‘24-06-2015 09:00:00’ ‘Mercoledì’ 184 32 152 9
‘24-06-2015 10:00:00’ ‘Mercoledì’ 94 30 64 10
‘24-06-2015 11:00:00’ ‘Mercoledì’ 67 24 43 11
‘24-06-2015 12:00:00’ ‘Mercoledì’ 66 32 34 12
‘24-06-2015 13:00:00’ ‘Mercoledì’ 67 32 35 13

Il grafico a barre qui sotto mostra che la densità del flusso di biciclette aumenta e diminuisce nel corso della settimana. È ora chiaro che il numero di ciclisti è maggiore tra settimana rispetto ai weekend. Questa visualizzazione ci consente di inferire che i ciclisti in strada sono prevalentemente persone che si spostano per andare al lavoro.

Grafico a barre del numero medio di ciclisti ogni giorno della settimana.

Dati relativi al flusso di biciclette rappresentati tramite un grafico a barre.

Per ottenere informazioni più approfondite a partire dagli stessi dati è possibile usare un grafico a dispersione. Il grafico riportato qui sotto mostra il numero totale di biciclette dirette a est e a ovest a orari specifici della giornata. In base a questo grafico, è possibile concludere che i percorsi diretti a est portano alle aree lavorative mentre quelli diretti a ovest portano ad aree residenziali. Inoltre, è possibile stabilire che le ore di punta sono dalle 8:00 alle 10:00 in direzione est e dalle 16:00 alle 18:00 in direzione ovest.

Grafico a dispersione del flusso di biciclette a Boston. L’orario è indicato sull’asse x e il numero totale di biciclette sull’asse y. I puntini blu rappresentano i ciclisti che si muovono in direzione est mentre quelli arancioni i ciclisti che si muovono in direzione ovest.

Flusso di biciclette in direzione est e ovest in base all’orario. 

Il grafico a sciame è un tipo particolare di grafico a dispersione in grado di mostrare i pattern di densità del flusso di biciclette in base ai diversi orari della giornata, al giorno della settimana e alla direzione.

Grafico a sciame del flusso di biciclette a Boston in cui sono raffigurati il giorno della settimana, l’orario e la direzione di movimento in modo tale da mostrare la densità del numero di biciclette noleggiate.

Densità del flusso di biciclette in base al giorno e alla direzione.

Nell’esempio relativo al flusso di biciclette, visualizzare i dati con diverse tipologie di grafici come quello a barre, a dispersione e a sciame ci aiuta a estrarre informazioni utili dal set di dati come i giorni con i picchi di traffico, la direzione di movimento e l’orario di punta della giornata.

Visualizzazione dei dati con MATLAB

MATLAB è una piattaforma di programmazione e di calcolo numerico usata per analizzare dati, sviluppare algoritmi e creare modelli. Supporta l’intero workflow di analisi dei dati, comprese le attività di acquisizione dei dati direttamente in MATLAB, l’analisi e la visualizzazione di detti dati e l’esportazione dei risultati. È possibile utilizzare mappe interattive per visualizzare i dati senza dover scrivere neanche una riga di codice; le app generano automaticamente il codice MATLAB appropriato, il che consente di automatizzare e riutilizzare il proprio lavoro.

Creazione di visualizzazioni dei dati

MATLAB offre un’ampia gamma di tipi di grafici integrati come quelli a linee, a dispersione, di distribuzione e geografici, per visualizzare i dataset provenienti da un insieme diversificato di applicazioni. È possibile creare visualizzazioni in modo interattivo oppure programmatico utilizzando il linguaggio MATLAB.

Analisi delle visualizzazioni dei dati

È possibile esplorare in modo interattivo la propria visualizzazione svolgendo le seguenti attività:

  • Ingrandimento e riduzione di una sezione specifica del set di dati
  • Rotazione e inclinazione interattiva delle visualizzazioni
  • Rappresentazione di linee di tendenza o di valori di dati direttamente sulla visualizzazione
  • Oscuramento ed evidenziazione di punti dati
  • Passaggio da un dominio all’altro (ad es., dominio del tempo, della frequenza, S e Z)

Annotazione e personalizzazione delle visualizzazioni dei dati

È possibile annotare in modo interattivo le proprie visualizzazioni evidenziando le informazioni essenziali che si vogliono mostrare, ad esempio:

  • Annotando i punti dati principali
  • Aggiungendo suggerimenti sui dati
  • Aggiungendo etichette agli assi
  • Creando raggruppamenti in base a colori e pattern diversi
  • Aggiungendo indicatori di dati, stili di linea e colori

MATLAB genera automaticamente il codice a partire dalle tue modifiche interattive apportate ai grafici. Questo codice creato può essere riutilizzato aggiungendolo allo script.

Grafico di un tracciato del segnale I-Q. x è sull’asse x e l’ampiezza normalizzata è sull’asse y. Vengono visualizzati un segnale in fase e uno in quadratura.

Opzione “Aggiorna codice” in fase di modifica della visualizzazione.

I set di dati complessi possono essere difficili da visualizzare tramite grafici semplici. MATLAB consente di creare grafici personalizzati in base alle esigenze della propria visualizzazione e di aggiungervi interazioni personalizzate. 

Alcuni esempi comprendono:

  • Componente di grafici Sparkline: crea dei piccoli grafici a linee in grado di mostrare la tendenza generale di ogni vettore in un set di dati multi-vettore come una tabella. Osserva e confronta le tendenze dei dati per ciascuna riga/colonna.
  • Grafico a dispersione della densità: usa il colore (o la trasparenza) per identificare la densità dei punti.
Screenshot di un componente di un grafico sparkline e di un grafico a dispersione della densità, entrambi raffiguranti dati non etichettati.

Sparkline (a sinistra) e grafico a dispersione della densità (a destra).

Scopri altri esempi di contenitori grafici personalizzati su File Exchange su MATLAB Central.

Esportazione delle visualizzazioni dei dati

È possibile esportare direttamente le proprie visualizzazioni personalizzate e annotate da utilizzare sul web e in presentazioni e report.

Screenshot che mostra il salvataggio di una figura in una determinata posizione.

Esportazione di una figura.

Integrazione tra visualizzazione dei dati e analisi dei dati

La visualizzazione dei dati è spesso abbinata all’analisi e alla pre-elaborazione dei dati. Le app di MATLAB, come Data Cleaner e Signal Analyzer, combinano questi passaggi.

I comandi interattivi consentono di specificare le operazioni senza dover scrivere alcuna riga di codice e le visualizzazioni dei dati corrispondenti vengono direttamente integrate nell’app. Ciò consente di vedere immediatamente i risultati di una determinata attività. Una volta completate l’analisi e la pre-elaborazione, le app possono generare automaticamente il codice MATLAB corrispondente in modo tale da poter automatizzare i vari passaggi, anche con dati diversi.

Visualizzazioni per applicazioni specifiche

I toolbox di MATLAB mettono a disposizione delle visualizzazioni specifiche in base alle applicazioni, oltre ad app interattive che abbinano la visualizzazione alla pre-elaborazione e all’analisi dei dati.

Screenshot dell’app Econometric Modeler.

App Econometric Modeler per visualizzare e analizzare dati di serie storiche univariati o multivariati (in Econometrics Toolbox™).

Screenshot di un grafico della risposta in ampiezza con la frequenza in MHz sull’asse x e l’ampiezza sull’asse y.

Risposta in frequenza dei singoli stadi di un convertitore digitale multistadio (in DSP System Toolbox™).

Screenshot di un grafico che rappresenta uno spettro di segnali desiderati e di interferenza con indicazione della frequenza in GHz sull’asse x e di dBm sull’asse y.

Test di blocco, intermodulazione e prestazioni portante-interferenza di Bluetooth LE (in Bluetooth® Toolbox).

Screenshot di un grafico di beamforming di un sistema phased array che misura la potenza normalizzata in dB per diverse dimensioni.

Beamforming per un sistema phased array (in Phased Array System Toolbox™).

Connessione di MATLAB con altri strumenti di visualizzazione dei dati

È possibile utilizzare le funzionalità di calcolo e di elaborazione dei dati di MATLAB per creare visualizzazioni e dashboard con altri strumenti di business intelligence, come:

Sezione dedicata ai Case Study

Applicazioni interessanti della visualizzazione dei dati

Le funzionalità di visualizzazione dei dati in MATLAB hanno consentito alle organizzazioni di raggiungere in modo efficace i propri obiettivi in ambito di ricerca.

Ford sviluppa uno strumento per analizzare i risultati di test svolti sul ciclo di guida

Il team Ford addetto all’ingegneria della gestione dell’energia dei veicoli ha utilizzato MATLAB per sviluppare CycleTool, uno strumento per valutare le emissioni, il risparmio di carburante e le prestazioni dei veicoli. Lo strumento consente di valutare le prestazioni del sistema tramite la visualizzazione dei risultati dei test sull’hardware rispetto alle previsioni e alle simulazioni del modello.

Leggi la storia

Screenshot di MATLAB che dimostra le funzionalità per visualizzare i risultati dei testi sull’hardware rispetto alle previsioni e alle simulazioni del modello.

Brushing dei dati per individuare le tendenze nell’applicazione riepilogativa.

Decodifica del volo di una farfalla con telecamere ad alta velocità e galleria del vento

I ricercatori dell’Università di Lund hanno scoperto cosa rende il volo delle farfalle così caratteristico e hanno utilizzato MATLAB per l’elaborazione delle immagini, l’analisi dei dati, la modellazione e le visualizzazioni. Studiando il volo delle farfalle, gli ingegneri riescono a costruire droni volanti, o addirittura subacquei, più efficienti. I ricercatori hanno utilizzato le funzionalità di visualizzazione dei dati MATLAB per analizzare e confrontare le prestazioni delle ali progettate ispirandosi alle analisi del volo delle farfalle.

Leggi la storia

Quattro grafici che mostrano diverse tipologie di ali per dimostrare l’impulso e l’energia nel tempo normalizzato.

Un’ala flessibile migliora la forza e l’efficienza del battito delle ali.

State Street Global Advisors sviluppa un modello di scoring per garantire trasparenza in ambito di investimenti ESG

Il team di sviluppo di State Street Global Advisors ha generato istogrammi, grafici a dispersione, grafici BoxPlot e altre visualizzazioni per affinare i propri algoritmi nell’ambito dello sviluppo di R-Factor™, un sistema capace di aiutare gli investitori a prendere decisioni consapevoli e a migliorare il proprio punteggio nel settore ambientale, sociale e di governance (ESG).

Leggi la storia

Dodici grafici formano un istogramma che mostra i punteggi ESG in R-Factor suddivisi per settore di M S C I World.

Istogramma che mostra i punteggi ESG in R-Factor suddivisi per settore.

Bosch sviluppa una piattaforma unica per l’analisi e la visualizzazione dei dati di test automobilistici

Bosch ha utilizzato MATLAB per sviluppare ENValyzer (Engineering Test Data Visualizer and Analyzer), uno strumento per visualizzare, elaborare, analizzare e generare report per i dati di test acquisiti da dispositivi di misurazione, test bench e veicoli. Gli ingegneri di Bosch sono riusciti a eseguire il rendering dei dati in viste singole, secondarie, con grafico di matrice e a più assi.

Leggi la storia

Grafico ENValyzer che mostra il Prominence Ratio (P R) rispetto ai risultati dello spettro R P M.

Grafico ENValyzer che mostra il Prominence Ratio (PR) rispetto ai risultati dello spettro RPM.