MODULO PER LO STUDIO DEI BIG DATA
Il Modulo ‘Big Data’ affronta lo studio dell’elaborazione e analisi di grandi quantità di dati nell’ambito della Data Science.
I Big Data si differenziano dalle tradizionali collezioni di dati per numerose caratteristiche: la quantità di dati, il fatto che i dati in genere non sono strutturati perché provengono da fonti e forme diverse e, in caso di streaming in tempo reale, la velocità con cui i dati arrivano.
Nella Data Science sono state introdotte nuove tecnologie che si occupano della gestione e dell’analisi di dati di grandi dimensioni, superando le limitazioni dei sistemi tradizionali di gestione dei dati come i DBMS (Database Management System) relazionali.
Il Modulo ‘Big Data’ utilizza Apache Spark, un framework open source che supporta il calcolo parallelo in memoria per ottimizzare le prestazioni delle applicazioni che analizzano Big Data.
È usato da moltissime organizzazioni mondiali, tra cui IBM, NASA, Samsung e Yahoo!, e il suo impiego è in continua espansione.