Negli ultimi anni la mole e l’utilizzo di dati ha acquisito una rilevanza sempre maggiore all’interno della nostra vita quotidiana, da cui è nata la necessità di una figura professionale in grado di studiare e interpretare i dati grezzi per ricavarne informazione, il Data Scientist.
Quella del data scientist, definita del 2012 dalla Harvard Business Review come “The Sexiest Job of the 21st Century” è una professione la cui domanda sul mercato del lavoro presenta un trend in forte incremento.
È possibile identificare tre tipologie di macro-sorgenti per i dati:
- Human generated: tra cui risaltano le piattaforme di social-network e di e-commerce.
- Machine generated: vi troviamo fonti come dispositivi IoT e smartphone.
- Business generated: tra le quali identifichiamo le attività data-driven dei processi di business aziendali.
Il ruolo che ricopre un data scientist però non si circoscrive solo all’analisi e alla gestione di tali dati, ma grazie all’utilizzo sempre più affermato da parte delle aziende di tecnologie quali:
- Big data e Analytics per il supporto e l’automazione di processi decisionali ed Information Technology.
- Big data e Analytics come prodotto e servizio.
- Tecnologie cloud per il calcolo e l’archiviazione di dati.
Ha quindi acquisito parte rilevante nel business da loro generato.
Come si diventa Data Scientist?
Essendo una professione nata di recente non esiste una carriera standard, anche se negli ultimi anni sono nati corsi specializzanti di Data Science.
Tipicamente i titoli di studio consigliati sono coloro che cadono sotto l’acronimo di STEM, Science, Technology, Engineering and Mathematics.
Tra i corsi di laurea che ricadono sotto questa categoria non ve ne è uno più adeguato degli altri, questo perché per diventare un data scientist occorre possedere conoscenze trasversali.
In funzione del ruolo che verrà in seguito ricoperto all’interno di una determinata azienda è possibile che vengano richieste le seguenti hard skills:
- Competenze in informatica e nella programmazione.
- Competenze in tecniche e metodi statistici.
- Competenze nell’ambito Internet of Things.
- Conoscenze di economia e marketing.
- Conoscenza di tools di Business Intelligence.
In aggiunta alle prime competenze più tecniche, sono fondamentali nel ruolo sono anche le seguenti soft skills:
- Principi di project management.
- Forti capacità di comunicazione.
- Problem solving.
- Capacità di lavorare in gruppo sia a livello tecnico che operativo.
Quali sono i compiti tipici?
Sebbene nello specifico i compiti di un data scientist dipendano molto dall’ambito in cui lavora, è possibile identificare alcune attività tipiche:
- Progettazione e gestione di data warehouse.
- Raccogliere e trasformare grandi quantità di dati senza uno schema per fornirgli formato più utilizzabile e comprensibile.
- Creazione di report, spesso automatizzati, per la presentazione dell’informazione raccolta.
- La risoluzione di problemi di business sfruttando tecniche data-driven.
- L’utilizzo di diversi linguaggi di programmazione quali, Python ed
- Sfruttare tecniche analitiche quali il machine learning ed il deep learning.
- Collaborare sia in forma tecnica che consulenziale con i team di IT e di business.
Quali sono gli attrezzi del mestiere?
Sono presenti alcuni termini e tecnologie tipicamente utilizzati da un data scientist:
- Data Visualization: la presentazione grafica del dato ha un ruolo incisivo nella trasformazione da dato ad informazione, argomento molto più approfondito in un altro articolo.
- Machine Learning: una branca dell’intelligenza artificiale che si basa sull’utilizzo di algoritmi matematici ed automazione.
- Deep Learning: un’area del machine learning che sfrutta i dati per la definizione di modelli complessi.
- Pattern recognition: tecnologie tramite le quali riconoscere e definire uno schema all’interno dei dati.
- Data preparation: il processo di conversione del dato grezzo in un dato strutturato.
- Natural Language Process: trattamento informatico del linguaggio naturale.