MÓDULO PARA EL ESTUDIO DEL BIG DATA
El módulo de ‘Big Data’ DL NGL-DATA se ocupa del estudio del procesamiento y análisis de grandes cantidades de datos en el campo del Data Science.
El Big Data se diferencia de las colecciones de datos tradicionales por varias características: la cantidad de datos, el hecho de que los datos generalmente no están estructurados porque provienen de diferentes fuentes y formas, y, en el caso de la transmisión en tiempo real, la velocidad con la que llegan los datos.
En el Data Science se han introducido nuevas tecnologías que se ocupan de la gestión y análisis de grandes datos, superando las limitaciones de los sistemas tradicionales de gestión de datos como los DBMS (Database Management Systems) relacionales.
El módulo ‘Big Data’ utiliza Apache Spark, un marco de código abierto que admite computación paralela en memoria para optimizar el rendimiento de las aplicaciones que analizan el Big Data.
Es utilizado por muchas organizaciones en todo el mundo, incluyendo IBM, NASA, Samsung y Yahoo!, y su uso está en constante expansión.