Big Data Systems and Analytics (2019/2020)

Codice insegnamento
cod wi: DT000049
Docenti
Elisa Quintarelli, Sara Migliorini
Coordinatore
Elisa Quintarelli
crediti
5
Settore disciplinare
ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Lingua di erogazione
Italiano
Sede
VERONA
Periodo
A.A. 19/20 dottorato dal 1-ott-2019 al 30-set-2020.

Orario lezioni

Vai all'orario delle lezioni

Obiettivi formativi

Il corso tratterà gli aspetti principali, le problematiche e le sfide che vedono coinvolte applicazioni e sistemi per la gestione di grossi moli di dati.
Partendo dalle 5 V dei Big Data (Volume, Velocità, Varietà, Variabilità e Valore), il corso si concentra principalmente sul framework Hadoop e sui sistemi come Spark, mostrando la differenza tra i modelli di dati No-SQL e quello relazionale.

Programma

Introduzione al corso
Il paradigma di programmazione MapReduce e Apache Hadoop
Apache Spark
L'ecosistema di Hadoop
SpatialHadoop: una estensione spaziale di Hadoop
Sistemi Avanzati di partizionamento di Hadoop
DBMS per Big data
DBMS relazionali e NoSQL a confronto
Mongo DB: un esempio di dbms NO-SQL
Le sfide nell'era dei Big Data

Il corso coprirà tematiche teoriche e più applicative