Nonostante le difficoltà, anche quest’anno la Serie A di calcio è iniziata ed è sempre molto interessante per i tifosi osservare le statistiche relative a goal, assist e così via. Considerato lo strapotere di alcuni giocatori all’interno dei principali campionati europei (Cristiano Ronaldo e Messi su tutti), il quesito a cui rispondere questa volta era se tale fenomeno fosse giustificabile anche matematicamente.
A questo proposito, abbiamo pensato di dare una mano agli appassionati di football utilizzando il grafico di Pareto in Tableau, sfruttando la teoria del 80/20. Tale analisi viene generalmente utilizzata all’interno dell’ambito business, per spiegare come l’80% dei risultati provenga dal 20% delle cause impiegate. Ad esempio, l’analisi è frequentemente utilizzata per individuare quali SKU all’interno di un portafoglio di prodotti generino la fetta più larga dei ricavi di una business unit.
Tornando al nostro caso specifico, l’obiettivo era capire se il dominio di certi attaccanti può essere dimostrato, evidenziando come la maggior parte dei goal della stagione passata – e magari anche di quelle precedenti -provenisse da loro.
I DATI
Per effettuare l’analisi ci servivano dei dati da cui partire. Abbiamo quindi ricercato un’API che potesse venire incontro alle nostre esigenze: in questo caso, la scelta è ricaduta su api-football.com. Il servizio è stato per l’utilizzo che ne abbiamo fatto, totalmente gratuito (supporta fino a 100 chiamate al giorno).
Per effettuare una chiamata, è stato prima necessario estrapolare gli ID delle leghe di calcio oggetto d’analisi; nello specifico, football-API è strutturato in modo tale da registrare un singolo ID per la combinazione lega/anno calcistico. Una volta ottenuti i dati necessari dall’API, tramite uno script Python, abbiamo deciso di salvare l’estrazione dei dati in file in formato JSON. I file JSON (JavaScript Object Notation) sono infatti una delle fonti dati accettate da Tableau Desktop; l’alternativa sarebbe stata quella di creare un connettore WDC e quindi collegare direttamente l’API a Tableau, come vi abbiamo mostrato in un nostro precedente articolo sul tema.
Infine, dato che sono stati ottenuti molteplici file JSON dallo step precedente, è stato necessario metterli assieme attraverso una union, per avere una solo data source in Tableau.
Di seguito, riportiamo gli step necessari alla realizzazione del grafico di Pareto in Tableau.
Osservando a questo punto la visualizzazione creata, possiamo evidenziare come il 20% dei giocatori è riuscito esclusivamente all’interno delle stagioni 2017 e 2018 a realizzare complessivamente il 35/40% dei goal. La distribuzione dei goal all’interno dei top-scorer delle maggiori leghe calcio è evidentemente molto meno concentrata di quello che ci potevamo aspettare e di quello che afferma l’assunto dell’analisi di Pareto.
Per avere più informazioni sul mondo della Business Intelligence, visita la pagina ufficiale Tableau, continua a seguirci sul nostro blog e sui nostri canali social Facebook e LinkedIn.