Che cos’è la visualizzazione dei dati?
3 cose da sapere
La visualizzazione dei dati è un processo che consiste nel tradurre dei dati in rappresentazioni grafiche come i tracciati, i grafici, le mappe e le visualizzazioni 3D, che ti aiutano a identificare con facilità pattern, tendenze e outlier nei dati.
Queste visualizzazioni dei dati consentono di vedere le relazioni che sarebbe difficile, se non impossibile, osservare guardando semplicemente i dati grezzi, soprattutto con grandi set di dati provenienti da fonti quali sensori, data logger, cartelle cliniche, criteri di ricerca sul web e modelli di acquisto. La visualizzazione dei dati svolge un ruolo centrale nella conversione dei dati in informazioni utilizzabili.
Le tecniche di visualizzazione dei dati variano da un dominio all’altro.
Finanza computazionale
Nei settori che usano dati di mercato storici o in tempo reale, la visualizzazione dei dati è utile a identificare rapidamente pattern e tendenze, a rilevare le anomalie e a ottenere informazioni utili. La visualizzazione dei dati aiuta a effettuare analisi, sviluppare modelli predittivi, valutare i rischi e formalizzare strategie di trading.
Il grafico riportato qui sotto simula il comportamento futuro del prezzo spot dell’energia elettrica a partire da un modello di serie storica adattato ai dati storici.
Elaborazione di segnali
L’elaborazione di segnali viene impiegata in applicazioni quali l’analisi vocale, il monitoraggio del battito cardiaco, le comunicazioni wireless, il telerilevamento, il monitoraggio dello stato del clima e il GPS. Tra le attività più comuni compaiono la pre-elaborazione e il confronto di segnali, la progettazione di filtri digitali, la trasformazione di segnali, l’esecuzione di misurazioni e il rilevamento di pattern ed eventi. Le visualizzazioni dei dati vengono utilizzate per analizzare segnali di interesse nel dominio della frequenza, del tempo e del tempo-frequenza.
Il grafico riportato qui sotto rappresenta dati audio di una balenottera azzurra del Pacifico. La visualizzazione viene creata in MATLAB® utilizzando l’app Signal Analyzer, che aiuta a visualizzare i segnali nel dominio del tempo e della frequenza.
Elaborazione di immagini e visione artificiale
L’elaborazione di immagini e video aiuta a individuare forme, contare oggetti, identificare colori, misurare le proprietà degli oggetti e a trovare altre informazioni di rilievo. Le tecniche di elaborazione di immagini sono spesso applicate come fase di pre-elaborazione nel workflow della visione artificiale. Le applicazioni in questo dominio comprendono il riconoscimento facciale per gli smartphone, l’evitamento di pedoni e veicoli nei veicoli a guida autonoma, la videosorveglianza, il rilevamento di tumori nelle MRI mediche e altri sistemi di recupero immagini.
Ad esempio, BMW utilizza le funzionalità di visione artificiale nell'Assisted Driving View (ADV) per raffigurare i veicoli circostanti e identificarne il tipo.
Intelligenza artificiale (IA)
La visualizzazione dei dati svolge un ruolo cruciale nello sviluppo di modelli di IA, tramite l’uso del Machine Learning o del Deep Learning, in quanto i modelli vengono costruiti sulla base di set di dati di grandi dimensioni, che sono difficili da interpretare. Nel Machine Learning, l’analisi dei cluster aiuta a rilevare le anomalie e a pre-elaborare i dati nell’apprendimento supervisionato. L’analisi dei componenti principali (PCA) e t-distributed Stochastic Neighbor Embedding (t-SNE) sono le due tecniche di visualizzazione dei dati più utilizzate in quanto aiutano a ridurre le dimensioni dei dati per potersi focalizzare sulle dimensioni di differenziazione chiave.
Nel Deep Learning, è possibile monitorare i progressi dell’addestramento utilizzando delle visualizzazioni dei dati come i grafici di accuratezza e perdita di rete e analizzare le reti addestrate usando tecniche di visualizzazione quali Grad-CAM (Gradient-weighted Class Activation Mapping), sensibilità all’occlusione, LIME (Local Interpretable Model-agnostic Explanation) e Deep Dream.
I pacchetti software dispongono di funzionalità per trasformare dati grezzi in visualizzazioni composite, come i tracciati, i grafici e i diagrammi. Quello che segue è un esempio illustrativo di dati di densità del flusso di biciclette. Tramite una semplice ispezione visiva dei dati grezzi è difficile stabilire il rapporto che lega i vari dati.
Data/ora | Giorno | Totale | Direzione ovest | Direzione est | Ora |
‘24-06-2015 07:00:00’ | ‘Mercoledì’ | 141 | 13 | 128 | 7 |
‘24-06-2015 08:00:00’ | ‘Mercoledì’ | 327 | 44 | 283 | 8 |
‘24-06-2015 09:00:00’ | ‘Mercoledì’ | 184 | 32 | 152 | 9 |
‘24-06-2015 10:00:00’ | ‘Mercoledì’ | 94 | 30 | 64 | 10 |
‘24-06-2015 11:00:00’ | ‘Mercoledì’ | 67 | 24 | 43 | 11 |
‘24-06-2015 12:00:00’ | ‘Mercoledì’ | 66 | 32 | 34 | 12 |
‘24-06-2015 13:00:00’ | ‘Mercoledì’ | 67 | 32 | 35 | 13 |
Il grafico a barre qui sotto mostra che la densità del flusso di biciclette aumenta e diminuisce nel corso della settimana. È ora chiaro che il numero di ciclisti è maggiore tra settimana rispetto ai weekend. Questa visualizzazione ci consente di inferire che i ciclisti in strada sono prevalentemente persone che si spostano per andare al lavoro.
Per ottenere informazioni più approfondite a partire dagli stessi dati è possibile usare un grafico a dispersione. Il grafico riportato qui sotto mostra il numero totale di biciclette dirette a est e a ovest a orari specifici della giornata. In base a questo grafico, è possibile concludere che i percorsi diretti a est portano alle aree lavorative mentre quelli diretti a ovest portano ad aree residenziali. Inoltre, è possibile stabilire che le ore di punta sono dalle 8:00 alle 10:00 in direzione est e dalle 16:00 alle 18:00 in direzione ovest.
Il grafico a sciame è un tipo particolare di grafico a dispersione in grado di mostrare i pattern di densità del flusso di biciclette in base ai diversi orari della giornata, al giorno della settimana e alla direzione.
Nell’esempio relativo al flusso di biciclette, visualizzare i dati con diverse tipologie di grafici come quello a barre, a dispersione e a sciame ci aiuta a estrarre informazioni utili dal set di dati come i giorni con i picchi di traffico, la direzione di movimento e l’orario di punta della giornata.
MATLAB è una piattaforma di programmazione e di calcolo numerico usata per analizzare dati, sviluppare algoritmi e creare modelli. Supporta l’intero workflow di analisi dei dati, comprese le attività di acquisizione dei dati direttamente in MATLAB, l’analisi e la visualizzazione di detti dati e l’esportazione dei risultati. È possibile utilizzare mappe interattive per visualizzare i dati senza dover scrivere neanche una riga di codice; le app generano automaticamente il codice MATLAB appropriato, il che consente di automatizzare e riutilizzare il proprio lavoro.
Creazione di visualizzazioni dei dati
MATLAB offre un’ampia gamma di tipi di grafici integrati come quelli a linee, a dispersione, di distribuzione e geografici, per visualizzare i dataset provenienti da un insieme diversificato di applicazioni. È possibile creare visualizzazioni in modo interattivo oppure programmatico utilizzando il linguaggio MATLAB.
Analisi delle visualizzazioni dei dati
È possibile esplorare in modo interattivo la propria visualizzazione svolgendo le seguenti attività:
- Ingrandimento e riduzione di una sezione specifica del set di dati
- Rotazione e inclinazione interattiva delle visualizzazioni
- Rappresentazione di linee di tendenza o di valori di dati direttamente sulla visualizzazione
- Oscuramento ed evidenziazione di punti dati
- Passaggio da un dominio all’altro (ad es., dominio del tempo, della frequenza, S e Z)
Annotazione e personalizzazione delle visualizzazioni dei dati
È possibile annotare in modo interattivo le proprie visualizzazioni evidenziando le informazioni essenziali che si vogliono mostrare, ad esempio:
MATLAB genera automaticamente il codice a partire dalle tue modifiche interattive apportate ai grafici. Questo codice creato può essere riutilizzato aggiungendolo allo script.
I set di dati complessi possono essere difficili da visualizzare tramite grafici semplici. MATLAB consente di creare grafici personalizzati in base alle esigenze della propria visualizzazione e di aggiungervi interazioni personalizzate.
Alcuni esempi comprendono:
- Componente di grafici Sparkline: crea dei piccoli grafici a linee in grado di mostrare la tendenza generale di ogni vettore in un set di dati multi-vettore come una tabella. Osserva e confronta le tendenze dei dati per ciascuna riga/colonna.
- Grafico a dispersione della densità: usa il colore (o la trasparenza) per identificare la densità dei punti.
Scopri altri esempi di contenitori grafici personalizzati su File Exchange su MATLAB Central.
Esportazione delle visualizzazioni dei dati
È possibile esportare direttamente le proprie visualizzazioni personalizzate e annotate da utilizzare sul web e in presentazioni e report.
Integrazione tra visualizzazione dei dati e analisi dei dati
La visualizzazione dei dati è spesso abbinata all’analisi e alla pre-elaborazione dei dati. Le app di MATLAB, come Data Cleaner e Signal Analyzer, combinano questi passaggi.
I comandi interattivi consentono di specificare le operazioni senza dover scrivere alcuna riga di codice e le visualizzazioni dei dati corrispondenti vengono direttamente integrate nell’app. Ciò consente di vedere immediatamente i risultati di una determinata attività. Una volta completate l’analisi e la pre-elaborazione, le app possono generare automaticamente il codice MATLAB corrispondente in modo tale da poter automatizzare i vari passaggi, anche con dati diversi.
Visualizzazioni per applicazioni specifiche
I toolbox di MATLAB mettono a disposizione delle visualizzazioni specifiche in base alle applicazioni, oltre ad app interattive che abbinano la visualizzazione alla pre-elaborazione e all’analisi dei dati.
App Econometric Modeler per visualizzare e analizzare dati di serie storiche univariati o multivariati (in Econometrics Toolbox™).
Risposta in frequenza dei singoli stadi di un convertitore digitale multistadio (in DSP System Toolbox™).
Test di blocco, intermodulazione e prestazioni portante-interferenza di Bluetooth LE (in Bluetooth® Toolbox).
Beamforming per un sistema phased array (in Phased Array System Toolbox™).
Applicazioni interessanti della visualizzazione dei dati
Le funzionalità di visualizzazione dei dati in MATLAB hanno consentito alle organizzazioni di raggiungere in modo efficace i propri obiettivi in ambito di ricerca.
Ford sviluppa uno strumento per analizzare i risultati di test svolti sul ciclo di guida
Il team Ford addetto all’ingegneria della gestione dell’energia dei veicoli ha utilizzato MATLAB per sviluppare CycleTool, uno strumento per valutare le emissioni, il risparmio di carburante e le prestazioni dei veicoli. Lo strumento consente di valutare le prestazioni del sistema tramite la visualizzazione dei risultati dei test sull’hardware rispetto alle previsioni e alle simulazioni del modello.
Decodifica del volo di una farfalla con telecamere ad alta velocità e galleria del vento
I ricercatori dell’Università di Lund hanno scoperto cosa rende il volo delle farfalle così caratteristico e hanno utilizzato MATLAB per l’elaborazione delle immagini, l’analisi dei dati, la modellazione e le visualizzazioni. Studiando il volo delle farfalle, gli ingegneri riescono a costruire droni volanti, o addirittura subacquei, più efficienti. I ricercatori hanno utilizzato le funzionalità di visualizzazione dei dati MATLAB per analizzare e confrontare le prestazioni delle ali progettate ispirandosi alle analisi del volo delle farfalle.
State Street Global Advisors sviluppa un modello di scoring per garantire trasparenza in ambito di investimenti ESG
Il team di sviluppo di State Street Global Advisors ha generato istogrammi, grafici a dispersione, grafici BoxPlot e altre visualizzazioni per affinare i propri algoritmi nell’ambito dello sviluppo di R-Factor™, un sistema capace di aiutare gli investitori a prendere decisioni consapevoli e a migliorare il proprio punteggio nel settore ambientale, sociale e di governance (ESG).
Bosch sviluppa una piattaforma unica per l’analisi e la visualizzazione dei dati di test automobilistici
Bosch ha utilizzato MATLAB per sviluppare ENValyzer (Engineering Test Data Visualizer and Analyzer), uno strumento per visualizzare, elaborare, analizzare e generare report per i dati di test acquisiti da dispositivi di misurazione, test bench e veicoli. Gli ingegneri di Bosch sono riusciti a eseguire il rendering dei dati in viste singole, secondarie, con grafico di matrice e a più assi.