Il corso offre una panoramica dei concetti fondamentali dei sistemi di calcolo distribuito che trattano dataset molto grandi, insieme ai paradigmi di programmazione adottati da questi sistemi. In particolare, verrà discusso il paradigma MapReduce e la sua implementazione in Spark. Inoltre, verranno presentati gli aspetti di sistema del calcolo distribuito, comprese le architetture dei data center e le soluzioni per l'archiviazione di dataset così grandi.
- Introduzione ai BigData
- Il paradigma di programmazione MapReduce
- Apache Hadoop e Apache Spark
- Non-relational databases
- Architetture dei datacenter
Autore | Titolo | Casa editrice | Anno | ISBN | Note |
Jimmy Lin, Chris Dyer | Data-Intensive Text Processing with MapReduce (Edizione 1) | Morgan & Claypool Publishers | 2010 | 978-1608453429 | |
Tom White | Hadoop: The Definitive Guide (Edizione 3) | Oreilly & Associates Inc | 2012 | 978-1449311520 |
L'esame consiste nello svolgimento di un progetto in cui vengono applicati i principi presentati a lezione.
******** CSS e script comuni siti DOL - frase 9957 ********p>