Sistemi di elaborazione di grandi quantita' di dati (2015/2016)

Codice insegnamento
4S001412
Docente
Damiano Carra
Coordinatore
Damiano Carra
crediti
6
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Periodo
I semestre dal 1-ott-2015 al 29-gen-2016.

Orario lezioni

I semestre
Giorno Ora Tipo Luogo Note
giovedì 14.30 - 16.30 lezione Aula A  
venerdì 15.30 - 16.30 lezione Laboratorio didattico Alfa  
venerdì 16.30 - 18.30 laboratorio Laboratorio didattico Alfa  

Obiettivi formativi

Il corso fornisce un'ampia introduzione ai concetti fondamentali dei sistemi di calcolo distribuiti di grandi dimensioni che devono gestire grandi quantità di dati. Gli argomenti trattati includono i framework di programmazione (MapReduce, Pregel), la progettazione degli algoritmi (per l'analisi dei testi, l'indicizzazione e l'analisi dei grafi) e le architetture dei sistemi (topologie dei data center, aspetti di rete e di gestione dei guasti).

Programma

- Framework di programmazione -
Filesystem distribuiti (HFS), sistemi NoSQL (HBase, Cassandra), analisi di dati e grafi (MapReduce, Pregel), sistemi SQL-like (Pig, Hive).

- Algoritmi -
Progettazione di algoritmi per l'analisi dei testi, per l'indicizzazione (PageRank), e l'analisi dei grafi.

- Architetture dei data center -
Topologie (VL2, PortLand, c-Through), protocolli di comunicazione (spanning tree, ECMP, OpenFlow), gestione degli errori e dei guasti.

Testi di riferimento
Autore Titolo Casa editrice Anno ISBN Note
Jimmy Lin, Chris Dyer Data-Intensive Text Processing with MapReduce (Edizione 1) Morgan & Claypool Publishers 2010 978-1608453429
Tom White Hadoop: The Definitive Guide (Edizione 3) Oreilly & Associates Inc 2012 978-1449311520

Modalità d'esame

L'esame consiste nello svolgimento di un progetto e relativa documentazione.

Materiale didattico

Documenti

Opinione studenti frequentanti - 2015/2016


Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

Statistiche esiti
Esiti Esami Esiti Percentuali Media voti Deviazione Standard
Positivi 72.22% 28 1
Respinti --
Assenti 27.77%
Ritirati --
Annullati --
Distribuzione degli esiti positivi
18 19 20 21 22 23 24 25 26 27 28 29 30 30 e Lode
0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 3.8% 7.6% 7.6% 26.9% 7.6% 15.3% 15.3% 15.3%

Valori relativi all'AA 2015/2016 calcolati su un totale di 36 iscritti. I valori in percentuale sono arrotondati al numero intero più vicino.