Nell’articolo di oggi, ci soffermiamo sulle novità della versione Tableau Prep 2024.1, uno strumento di preparazione dei dati, progettato per aiutare gli utenti a pulire, trasformare e organizzare i dati prima dell’analisi.
Se ti sei perso l’ultimo aggiornamento di Tableau, la versione 2024.1, dai un’occhiata al nostro articolo dedicato dove ti raccontiamo tutte le novità più interessanti.
1. Selezione delle righe iniziali
Uno degli strumenti più potenti dei prodotti Tableau è l’interprete, particolarmente utile quando ci imbattiamo in fonti dati formattate in maniera particolare.
Immaginiamo di trovarci in una situazione del genere:
In questo foglio Excel, oltre ai numerosi titoli e sottotitoli, sotto le intestazioni di colonna troviamo i metadati: descrizioni dettagliate dei dati stessi, fondamentali per comprendere appieno il contenuto della tabella.
Sebbene sia consigliato fornire un titolo chiaro e descrizioni adeguate per comprendere i dati in modo ottimale, inserirli direttamente all’interno del foglio di lavoro Excel non è raccomandabile. Fortunatamente, in situazioni di formattazione non ideale, viene in soccorso l’interprete dei dati di Tableau per risolvere il problema, anche se la sua affidabilità non è sempre garantita.
Spesso, in questi casi, l’interprete riesce a identificare ed eliminare titoli e sottotitoli, ma non si accorge dei metadati presenti nella riga inferiore alle intestazioni di colonna, causando disordine nei dati.
La versione Tableau Prep 2024.1 introduce una soluzione: la possibilità di settare manualmente l’header e l’inizio dei nostri dati.
Dopo aver trascinato la nostra tabella nel Canva di Tableau Prep 2024.1, direttamente nel primo input step, selezioniamo la dicitura “Imposta Intestazione” e indichiamo il numero della riga in cui sono presenti le intestazioni e l’inizio dei dati.
Il risultato sarà il seguente:
2. Individuazione delle righe duplicate
Lavorare con dati duplicati può spesso essere un problema per la qualità dell’analisi, oltre a costituire uno spreco di spazio di memoria. Dunque rimuovere i duplicati garantisce l’unicità di ogni valore, assicurando una rappresentazione accurata dei nostri dati.
Nelle versioni precedenti di Tableau Prep, l’individuazione e l’eliminazione delle righe duplicate erano già possibili, ma con le novità del 2024, questo processo è stato reso decisamente più veloce e funzionale. Vediamo come, continuando ad analizzare la nostra tabella:
Aprendo uno step di pulizia, clicchiamo su “Identifica righe duplicate”.
Selezionando questa opzione, viene creato automaticamente un campo calcolato booleano (di tipo True/False) utilizzando il seguente codice:
IF ({PARTITION [[Field 1]], [[Field 2]], [[Field 3]]: { ORDERBY [[Field 3]] DESC: ROW_NUMBER() } } = 1) THEN ‘Unica’ ELSE ‘Duplica’ END
Questo campo etichetterà come “Duplicato” tutte le righe che presentano duplicazioni basandosi sui campi specificati e come “Unico” quelle che non hanno duplicati.
A questo punto non ci resta che eliminare le righe duplicate:
Click sul tasto destro sulla stringa “Duplica”, poi “Escludi” e otterremo il risultato desiderato:
Conclusioni
Le novità di Tableau Prep 2024.1 introducono miglioramenti significativi nella preparazione dei dati. La funzionalità di selezione delle righe iniziali permette una gestione più precisa dei dati all’importazione, evitando confusione causata da titoli e metadati non necessari. L’aggiunta dell’individuazione delle righe duplicate semplifica la pulizia dei dati, assicurando un’analisi più accurata e efficiente. Questi aggiornamenti rendono Tableau Prep uno strumento ancora più potente per gli analisti, facilitando la preparazione dei dati e permettendo di concentrarsi sull’estrazione di insight significativi.
Leggi tutti i nostri articoli su Tableau
Vuoi scoprire le ultime novità o approfondire alcune funzionalità per diventare un esperto?
Visualitics Team
Questo articolo è stato scritto e redatto da uno dei nostri consulenti.
Condividi ora sui tuoi canali social o via email: