La Data Analysis: perché è importante? Quali conoscenze sono richieste?

L’analisi dei dati consiste nella valutazione nell’aggregazione dei dati, condotte tipicamente per ottenere informazioni e insights con riferimento a un Dataset, composto da uno o più Database.

I campi di applicazione della Data Analysis sono oggi i più disparati, soprattutto a causa della facilità con la quale è possibile generare, raccogliere ed elaborare grandi masse di dati, e studiare il tipo di relazione che intercorre tra i vari “oggetti”, attorno ai quali è organizzato ciascun Database.
campi di applicazione della Data Analysis
Che si tratti di persone, aziende, offerte, ma anche di ticket di assistenza, eventi o misurazioni, processi, applicazioni industriali, e così via all’infinito, una volta che iniziamo ad osservare il mondo dal punto di vista di un Database, ci accorgiamo che abbiamo a che fare con “oggetti”, che porteranno con sé un certo numero di proprietà (sarà la struttura del Database stesso a definirle).
Ognuna di queste proprietà, potrà infine esprimere o meno un valore per ciascuno dei record disponibili (i record sono ogni Persona, Azienda, Offerta, che abbiamo nel nostro DB).
Comprendere questo concetto ci permette di rispondere alla prima grande domanda che ci dobbiamo fare quando ci troviamo ad analizzare dei dati:

Cosa sto guardando?

  1. Che tipo di oggetti sto considerando? Ovvero: cosa accomuna i record all’interno di questo specifico Database? Sono tutte Persone? Aziende? Eventi? Sembra una domanda stupida, ma non lo è.
  2. Qual è l’ID univoco di ciascuna riga della mia tabella? Esiste un nome o un identificativo, attraverso il quale vengono distinti i vari record nel mio Database?
  3. Qual è l’intervallo temporale di riferimento? Sto guardando ai dati dell’ultima settimana o dell’ultimo anno? Sto facendo un confronto tra questo mese e il mese scorso, o con lo stesso mese, dell’anno scorso?
  4. I dati sono “puliti” o “sporchi” (ad esempio perché inquinati da test)? Se sono sporchi, possono essere puliti, e con quale effort? È utile rendere discrete delle variabili continue? Quante di quelle email contengono virgole, al posto dei punti?
  5. Come sono collegati i miei Database, all’interno del mio Dataset? Persone, Aziende e Offerte sono legate tra loro, con relazioni che possono essere uno-a-uno, molti-a-uno o molti-a-molti. Comprendere e analizzare queste relazioni è spesso la chiave di volta dell’analisi.

Cosa sto facendo?

Qual è l’obiettivo della mia analisi? Sto cercando di provare, o smentire, un’ipotesi? Sto cercando di evidenziare un risultato positivo? Sto cercando di capire cosa è andato storto? Devo ipotizzare cosa succederà la prossima volta, o devo ricostruire quanto è successo nel passato?
Destinazioni diverse si raggiungono attraverso strade differenti: avere ben chiaro l’obiettivo di partenza è un requisito importante, per nulla scontato.
Non ci dimentichiamo poi, che le strade più sicure sono quelle già battute: informarsi e conoscere le basi tecniche, matematiche e statistiche dell’analisi, permette di orientarsi e fa risparmiare tempo, dove altri hanno risolto i nostri stessi problemi, con formule, strumenti e approcci ora a nostra disposizione: non dobbiamo necessariamente reinventare ogni volta la ruota!

Come lo sto facendo?

Che strumenti sto usando per condurre la mia analisi? Sono efficaci? Li sto usando al pieno delle loro potenzialità, o solo per una frazione marginale? E infine, una volta che comincio a conoscere le strade battute, le best practices e gli approcci consolidati: esiste un modo nuovo, originale e inedito, di guardare al problema? Ci sono collegamenti, relazioni e correlazioni che mi stanno sfuggendo? E se sì, come posso catturarli?
Per molti versi, l’analisi dei dati è una ricerca, un’indagine. Uno scenario aperto all’interpretazione, dove assunzioni e ipotesi devono trovare conferma nei fatti e nei dati a disposizione, per ricostruire una storia fatta di significato, prima ancora che di numeri.

Quali competenze mi servono?

Nella cassetta degli attrezzi di un buon analista, troveremo spesso, insieme alle competenze tecniche di mestiere, un insieme di tratti e competenze trasversali, importanti per eccellere in questo ambito:
  • La capacità di apprendere e ricercare costantemente nuove soluzioni e restare aggiornati.
  • La capacità di analizzare e risolvere i problemi con un approccio sistematico.
  • Una buona visione complessiva e sistemica, bisogna sapere unire i puntini.
  • La precisione e l’orientamento a risultati di qualità: una buona analisi non può essere approssimativa.
  • Una giusta dose di creatività e capacità di innovare, per adattare il proprio approccio al contesto che cambia.

Come posso formarmi?

Oltre a rappresentare un cluster di competenze piuttosto richiesto, la Data Analysis è un campo nel quale è relativamente facile trovare materiale di formazione e training qualità, online. Se vuoi impegnarti e imparare cose nuove, non farai fatica a espandere i tuoi orizzonti.
Fai le tue ricerche, per capire quali sono i software più utilizzati nel campo di tuo interesse, quindi cerca di ottenere certificazioni di livello crescente, mettendo in pratica autonomamente, nel tuo lavoro, nello studio o nell’ambito di progetti pro-bono, quanto impari man mano. Avere accesso a dataset, progetti e sfide concrete ti darà modo di affinare in breve tempo le competenze necessarie per diventare cintura nera in Data Analysis.