Chi è il Big data e Data scientist

Una ricerca su Google, un nostro acquisto al supermercato, una foto, un messaggio vocale, un tweet. Tutti questi sono dati. La maggior parte delle nostre attività quotidiane, oggi, crea dei dati, che possono essere raccolti, analizzati e monetizzati. Chi si occupa di analizzare tutti questi dati? Il Data scientist.

Cosa fa un Data scientist

La responsabilità principale di un data scientist è l’analisi dei dati, un processo che inizia con la raccolta dei dati e termina con le decisioni aziendali basate sui risultati finali delle analisi.

I dati analizzati, spesso si tratta di Big Data, vengono raccolti da una serie di fonti. Esistono due tipi di dati che rientrano nell’ambito dei Big Data: i dati strutturati e i dati non strutturati.

I dati strutturati sono dati organizzati, tipicamente per categorie, che possono essere facilmente ordinati, letti e organizzati in modo automatico da un sistema. Questo gruppo include i dati raccolti da servizi, prodotti e dispositivi elettronici, come per esempio dati sul traffico di un sito web, cifre di vendita, coordinate bancarie o coordinate GPS raccolte da uno smartphone.

I dati non strutturati, la forma di Big Data che sta crescendo più velocemente, provengono generalmente da input di persone, come per esempio recensioni dei clienti, email, video, messaggi sui social media e così via. Questi dati sono tipicamente più difficili da ordinare e classificare in modo automatizzato, e la loro gestione può richiedere grandi investimenti.

Le competenze necessarie per diventare data scientist

Programmazione: “la capacità più importante di un data scientist”, un’abilità che aggiunge valore alle competenze in scienza dei dati. La programmazione migliora le competenze in ambito statistico, permette di analizzare set di dati di grandi dimensioni e “offre la possibilità di crearsi i propri strumenti”.

Analisi quantitativa: abilità importante per l’analisi di grandi set di dati, secondo Chen l’analisi quantitativa migliora le capacità di eseguire analisi sperimentali, scalare la strategia sui dati e implementare il machine learning.

Comprensione del prodotto: “comprendere i prodotti aiuta a eseguire analisi quantitative”, dice Chen. Consente anche di prevedere il comportamento di un sistema, stabilire metriche e migliorare le abilità di debug.

Comunicazione: probabilmente la più importante soft skill in ogni settore. “Forti capacità di comunicazione vi aiuteranno a sfruttare tutte le altre competenze

Lavoro di squadra: Molto simile alla comunicazione, il lavoro di squadra è fondamentale per una carriera di di successo. “Richiede generosità, capacità di accogliere feedback e condividere con altri le proprie conoscenze”