Partiamo da un presupposto: i grafici non sono tutti uguali. Questa affermazione può sembrare banale, ma è in realtà fondamentale per comprendere che quando scegliamo un grafico non ci riferiamo solo alla sua parte visiva, ma anche ai contenuti che vengono veicolati. Eppure troppo spesso la scelta del grafico viene effettuata in maniera quasi casuale, ad esempio scegliendo tra le opzioni consigliate dal software che utilizziamo o in base allo spazio a disposizione. Oppure per evitare di utilizzare sempre la stessa tipologia di grafico scegliamo un’alternativa solo allo scopo di variare un po’. Tutto questo però non è corretto dal punto di vista della data visualization: ogni grafico è il più adatto a mostrare particolari tipi di relazioni, esattamente come, se vogliamo dipingere un quadro, scegliamo pennelli diversi a seconda del tratto, delle dimensioni e dei colori degli elementi che vogliamo rappresentare.
La data visualization è l’anello di congiunzione che permette di collegare le informazioni da cui partiamo, ovvero i dati, allo scopo dell’analisi, ovvero la ricerca dell’insight. Ma perché questo avvenga in modo efficace, i dati devono essere visualizzati nel modo giusto. Definiamo giusto quando la visualizzazione raggiunge il suo scopo, ovvero comunicare visivamente e coerentemente il punto di vista dell’analisi e consentire una comprensione migliore dei dati presentati.
Gli esseri umani riescono a processare e prestare attenzione simultaneamente solo a una quantità limitata di informazioni. Di base siamo molto efficienti nell’identificare le differenze visive, come lunghezza, posizione e colore degli oggetti. Infatti è molto più facile interpretare un grafico a barre che guardare enormi quantità di numeri in un foglio di calcolo.
Detto ciò, esistono molteplici tipologie di grafici e scegliere quello più adatto ai dati che abbiamo a disposizione e alla nostra analisi potrebbe non essere una scelta facile. In questo articolo vogliamo fornire delle linee guida per orientarsi nella scelta più importante di tutte in tema di data visualization.
L’importanza della visualizzazione dei dati
Abbiamo detto che la visualizzazione dei dati è la rappresentazione grafica dei dati stessi realizzata allo scopo di comprendere le informazioni in essi contenute in un modo migliore.
Osserviamo i dati che vengono visualizzati nell’immagine seguente:
Probabilmente avremo avuto difficoltà nel capire di cosa si stia parlando e quali siano i valori significativi.
Adesso osserviamo questa immagine:
Il grafico presente nell’immagine è la visualizzazione dei dati prima elencati. Guardando questa rappresentazione è più facile comprendere i dati.
Come iniziare? Visual Analytics
Senza avere un piano chiaro in mente, la creazione di una visualizzazione può diventare molto complessa. Anche se il processo è iterativo (dai dati grezzi definiamo una struttura, poi creiamo una visualizzazione da cui ricaviamo un’informazione che viene poi condivisa, ma ci possono essere delle inversioni di marcia nel percorso), avere una buona strategia evita vicoli ciechi o malintesi.
Prima di iniziare a esaminare i diversi tipi di grafico a nostra disposizione, è necessario porsi 5 domande. Queste domande ci aiuteranno a comprendere meglio i nostri dati e, quindi, scegliere il tipo di grafico perfetto per rappresentarli.
1. Qual è la storia che i tuoi dati stanno cercando di raccontare?
I dati sono una storia raccontata in numeri.
Quindi, la prima cosa che dobbiamo sapere sui nostri dati è, quale storia stiamo cercando raccontare? Perché sono stati raccolti questi dati e come? I nostri dati vengono raccolti per trovare tendenze? Per confrontare diverse opzioni? Vogliamo mostrare una certa distribuzione? O li utilizziamo per osservare la relazione tra diversi insiemi di valori?
Comprendere l’origine dei dati e sapere cosa descrivono renderà la scelta di un tipo di grafico un’attività molto più semplice.
2. A chi presenterai i tuoi risultati?
Una volta che abbiamo capito la storia dietro i nostri dati è importante sapere a chi verranno presentati e chi li utilizzerà. Ad esempio, se stiamo analizzando le tendenze del mercato azionario dobbiamo capire se il nostro target è composto da persone che conoscono bene l’argomento e hanno bisogno di esplorarlo nel dettaglio o se sono persone alle prime armi e hanno potenzialmente bisogno di una visione più generale.
Come detto in precedenza, lo scopo della visualizzazione dei dati è quello di rendere più semplice la comunicazione dei dati stessi.
Per questo motivo è necessario conoscere il pubblico in modo da poter scegliere il tipo di grafico migliore da utilizzare quando si rappresentano i dati per loro.
3. In che modo i diversi elementi dei tuoi dati sono correlati tra loro?
È bene capire come si relazionano i diversi elementi dei nostri dati. Si basano su qualche fattore come tempo, dimensioni, tipologia? I dati sono una serie temporale (ovvero dati che cambiano nel tempo)? O è più una distribuzione?
Il modo in cui i dati si relazionano tra loro può aiutare a capire meglio quale tipo di grafico utilizzare.
4. Che cosa voglio mostrare?
Qual è la cosa che vogliamo notare quando leggo il grafico?
Possiamo iniziare dando un buon titolo al grafico. I titoli aiutano a capire cosa viene mostrato nel grafico, ma fanno anche concentrare l’attenzione sulla dichiarazione iniziale
5. Quale tipo di relazione voglio analizzare?
Nel pensare alla visualizzazione, dobbiamo scegliere il miglior tipo di grafico e il modo migliore per utilizzare gli elementi visivi nel grafico. Inoltre, per aiutare l’utente a leggere correttamente la visualizzazione, possiamo sfruttare strumenti come le descrizioni, le etichette e le legende.
Scegli la visualizzazione giusta per i tuoi dati
I grafici a disposizione per la rappresentazione dei dati sono innumerevoli.
Scegliere la giusta visualizzazione è fondamentale per poter comunicare al meglio i propri dati, in maniera chiara ed efficace. Una rappresentazione errata può portare a una distorsione dell’informazione che vogliamo comunicare (se non addirittura ad un completo errore!).
In linea generale, in base al tipo di dati, è possibile suddividere i grafici in macro tipologie. Queste categorie prendono vita dal progetto di ricerca di Jon Schwabish, The Graphic.
- Distribuzione: rappresentazione grafica della distribuzione dei dati
- Tempo: evidenzia i cambiamenti nel tempo
- Categorie: confronta i valori tra le categorie
- Geospaziali: associa i dati a livello spaziale
- Parte di un intero: visualizzazioni che mettono in relazione la parte di una variabile con il suo totale
- Relazioni: illustra le correlazioni o le relazioni tra variabili