Come usare ChatGPT per fare Data Analysis (II)

Nel nostro precedente articolo “Come utilizzare ChatGPT per fare Data Analysis (I)” dello scorso mese, abbiamo esplorato alcune delle potenzialità di ChatGPT nell’analisi dati, come la generazione di codice e la creazione di dataset sintetici.

Nell’articolo di oggi approfondiremo ulteriori applicazioni utili, partendo dall’analisi esplorativa dei dati (EDA) con grafici e modelli statistici, fino a concludere con la documentazione necessaria a supporto.

Task 4: applicazioni relative all'analisi dati in senso stretto

  • Pulizia e Preparazione dei Dati: richiesta di metodi per gestire dati mancanti, rimuovere duplicati o convertire tipi di dati, o descrivere il risultato voluto richiedendo la traduzione in codice Python.
  • Analisi Esplorativa (EDA): generazione di statistiche descrittive, grafici e correlazioni.
  • Modellazione Statistica e Machine Learning: richiesta di codice per costruire, valutare e ottimizzare modelli.

Come comporre il Prompt in ChatGpt

Casi d'Uso Pratici

Workflow EDA
Scrivere la documentazione
Interazione iniziale
Dataset Overview
    
     #Dataset Overview
dataset_overview = {
    'Number of Rows': candy_data.shape[0],
    'Number of Columns': candy_data.shape[1],
    'Column Names': candy_data.columns.tolist(),
    'Missing Values': candy_data.isnull().sum().sum()  # Total missing values across the dataset
}
    
   
Rappresentazione Grafica Risultati
Analisi statistico-descrittiva
Accesso al codice
Matrice con il profilo degli ingredienti
Profilo composizionale completo
Regressione multivariata

Considerazioni finali

In conclusione ChatGPT può essere un valido aiuto per condurre analisi di carattere generale su un dataset relativamente semplice (modello dati denormalizzato in cui si dispone di un’unica tabella), ricavando insights grazie alla formulazione (prompting) del compito da eseguire (task) e del contesto (descrizione del dominio applicativo) in linguaggio naturale, senza la necessità di conoscere tecnicamente/operativamente come arrivare a quel risultato. In quest’ottica si potrebbe fornire in input il registro delle transazioni (excel o csv) di un esercizio commerciale e richiedere il totale delle vendite, il prezzo medio di vendita per categoria di prodotto o ancora la variazione percentuale rispetto al mese precedente (MoM). Quello che segue è un esempio di interazione di questo tipo, ma è necessario sottolineare che ChatGPT è un tool utile ma fallibile, va visto come un assistente e non uno specialista. Per questa ragione è fondamentale formulare senza ambiguità i task, assicurandosi di definire il contesto utile all’analisi nel modo più dettagliato possibile. Quelle che seguono sono le domande poste da ChatGPT e che costituiscono come si intuisce, il cuore di questa strategia di prompting, capace di guidare anche gli utenti meno esperti nella corretta e completa definizione della richiesta prima che questa venga presa in carico dal modello.

Analisi dati registro delle transizioni
Output generato da ChatGPT
Output generato da strumento di BI
Esportare codice

Leggi tutti i nostri articoli sulla Data Tech

Vuoi scopri le ultime novità su Fivetran e nuove tecnologie di data science?

Visualitics Team
Questo articolo è stato scritto e redatto da uno dei nostri consulenti.

Condividi ora sui tuoi canali social o via email: