Big Data (2021/2022)

Codice insegnamento
cod wi: DT000243
Docente
Damiano Carra
Coordinatore
Damiano Carra
crediti
3
Settore disciplinare
ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Lingua di erogazione
Italiano
Sede
VERONA
Periodo
A.A. 21/22 dottorato dal 1-ott-2021 al 30-set-2022.

Orario lezioni

Vai all'orario delle lezioni

Obiettivi formativi

Il corso offre una panoramica dei concetti fondamentali dei sistemi di calcolo distribuito che trattano dataset molto grandi, insieme ai paradigmi di programmazione adottati da questi sistemi. In particolare, verrà discusso il paradigma MapReduce e la sua implementazione in Spark. Inoltre, verranno presentati gli aspetti di sistema del calcolo distribuito, comprese le architetture dei data center e le soluzioni per l'archiviazione di dataset così grandi.

Programma

- Introduzione ai BigData
- Il paradigma di programmazione MapReduce
- Apache Hadoop e Apache Spark
- Non-relational databases
- Architetture dei datacenter

Testi di riferimento

Vedi la bibliografia dell'insegnamento

Modalità d'esame

L'esame consiste nello svolgimento di un progetto in cui vengono applicati i principi presentati a lezione.