Sistemi di elaborazione di grandi quantita' di dati (2014/2015)

Codice insegnamento
4S001412
Docente
Damiano Carra
Coordinatore
Damiano Carra
crediti
6
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Periodo
I sem. dal 1-ott-2014 al 30-gen-2015.

Orario lezioni

I sem.
Giorno Ora Tipo Luogo Note
giovedì 10.30 - 13.30 lezione Aula C  
venerdì 14.30 - 16.30 laboratorio Laboratorio didattico Alfa  

Obiettivi formativi

Il corso fornisce un'ampia introduzione ai concetti fondamentali dei sistemi di calcolo distribuiti di grandi dimensioni che devono gestire grandi quantità di dati. Gli argomenti trattati includono i framework di programmazione (MapReduce, Pregel), la progettazione degli algoritmi (per l'analisi dei testi, l'indicizzazione e l'analisi dei grafi) e le architetture dei sistemi (topologie dei data center, aspetti di rete e di gestione dei guasti).

Programma

- Framework di programmazione -
Filesystem distribuiti (HFS), sistemi NoSQL (HBase, Cassandra), analisi di dati e grafi (MapReduce, Pregel), sistemi SQL-like (Pig, Hive).

- Algoritmi -
Progettazione di algoritmi per l'analisi dei testi, per l'indicizzazione (PageRank), e l'analisi dei grafi.

- Architetture dei data center -
Topologie (VL2, PortLand, c-Through), protocolli di comunicazione (spanning tree, ECMP, OpenFlow), gestione degli errori e dei guasti.

Testi di riferimento
Autore Titolo Casa editrice Anno ISBN Note
Jimmy Lin, Chris Dyer Data-Intensive Text Processing with MapReduce (Edizione 1) Morgan & Claypool Publishers 2010 978-1608453429
Tom White Hadoop: The Definitive Guide (Edizione 3) Oreilly & Associates Inc 2012 978-1449311520

Modalità d'esame

L'esame consiste nello svolgimento di un progetto e relativa documentazione.

Materiale didattico

Documenti

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

Statistiche esiti
Esiti Esami Esiti Percentuali Media voti Deviazione Standard
Positivi 70.0% 28 2
Respinti --
Assenti 30.00%
Ritirati --
Annullati --
Distribuzione degli esiti positivi
18 19 20 21 22 23 24 25 26 27 28 29 30 30 e Lode
0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 7.1% 0.0% 35.7% 0.0% 7.1% 0.0% 35.7% 14.2%

Valori relativi all'AA 2014/2015 calcolati su un totale di 20 iscritti. I valori in percentuale sono arrotondati al numero intero più vicino.