Il corso offre una panoramica dei concetti fondamentali dei sistemi di calcolo distribuito che trattano dataset molto grandi, insieme ai paradigmi di programmazione adottati da questi sistemi. In particolare, verrà discusso il paradigma MapReduce e la sua implementazione in Spark. Inoltre, verranno presentati gli aspetti di sistema del calcolo distribuito, comprese le architetture dei data center e le soluzioni per l'archiviazione di dataset così grandi.
- Introduzione ai BigData
- Il paradigma di programmazione MapReduce
- Apache Hadoop e Apache Spark
- Non-relational databases
- Architetture dei datacenter
Vedi la bibliografia dell'insegnamento
L'esame consiste nello svolgimento di un progetto in cui vengono applicati i principi presentati a lezione.
Strada le Grazie 15
37134 Verona
Partita IVA01541040232
Codice Fiscale93009870234
© 2024 | Università degli studi di Verona
******** CSS e script comuni siti DOL - frase 9957 ********p>