In questo nuovo articolo ci concentreremo sul data blending in Tableau Desktop.
Ci sono diversi metodi con cui utilizzare dati provenienti da diverse fonti. Nella maggior parte dei casi, la scelta tra l’uno e l’altro dipende dalle conseguenze che vogliamo ottenere e dall’obiettivo per cui stiamo operando: per esempio, la soluzione che avrà le migliori prestazioni nell’esecuzione delle query non sarà quella preferibile per altre ragioni. O ancora, se avremo la necessità di mantenere delle connessioni live, alcuni metodi ci saranno preclusi.
Come anticipato, oggi approfondiremo il metodo che ci permette l’utilizzo di dati provenienti da differenti data source, che in Tableau Desktop viene definito data blending. Come suggerisce il nome, in questo modo possiamo portare nelle nostre visualizzazioni informazioni aggiuntive provenienti da una seconda data source e farli interagire con i dati della nostra data source primaria. La specificità del data blending, rispetto alle Join, è che le data source restano a sé stanti, quindi separate.
Questo è particolarmente utile quando la granularità dei dati delle due data source è differente, perché il meccanismo del Data Blending, in sintesi, opera ogni singola query indipendentemente su ogni singola data source. I risultati vengono aggregati e, solo in un secondo momento, vengono poi inseriti nella view.
Questo comporta che tutti i dati inseriti dalla seconda data source devono essere aggregati. Va ricordato quindi che, se i dati importati saranno Dimension, la funzione sarà l’”ATTR” e laddove ci saranno più valori Tableau Desktop riporterà un asterisco.
Come eseguire il Data Blending
Data Source primaria e secondaria
Come abbiamo già accennato, nel data blending è necessario stabilire una data source primaria e almeno una data source secondaria.
Questa relazione si crea quando in una visualizzazione decidiamo di usare una delle due data source per prima. Questa sarà la fonte principiale, nonché la data source primaria, e verrà indicata con la spunta blu . La data source secondaria sarà identificata invece da una spunta arancione .
Va ricordato che, in base a come saranno strutturate le data source, questo potrà limitare i dati che potremo utilizzare della seconda data source: solo i valori che avranno una corrispondenza con la data source primaria potranno essere visualizzati nella view, in modo similare a una left join.
Per esempio, se nella fonte primaria è presente un campo Mese che assume solo certi valori (Marzo, Aprile, Maggio), qualsiasi data che sarà dipendente dal campo mese anche nella fonte secondaria verrà automaticamente filtrata per i valori che corrisponderanno a questi tre mesi. Per ottenere le informazioni relative a tutti i 12 mesi sarà necessario reimpostare la visualizzazione, cambiando la data source primaria.
Questo perché esiste un campo che definisce la relazione tra le due data source, detto “di collegamento”.
Definire la relazione tra le due data source
Perché Tableau Desktop possa far interagire i dati tra data source multiple utilizzando il Data Blending, è necessario stabilire almeno un campo di collegamento. Questo altro non è che un campo comune a entrambe le fonti ed è identificato nel data pane della data source secondaria con l’icona ; tutti i campi che invece Tableau Desktop rileva come potenziali collegamenti, ma che non sono in questo momento utilizzati, vengono indicati dall’icona .
Per sapere come Tableau stabilisce questi collegamenti automaticamente e per sapere come modificarli, abbiamo trattato l’argomento nel paragrafo dedicato dell’articolo sui filtri cross data source, che trovate qui.
Quando scegliere il data blending e i suoi limiti
Per avere più informazioni sul mondo della Business Intelligence, puoi visitare la pagina ufficiale Tableau. Continua a seguirci sul nostro blog e sui nostri canali social Facebook e LinkedIn!