Sistemi di elaborazione di grandi quantita' di dati (2016/2017)

Codice insegnamento
4S001412
Docente
Damiano Carra
Coordinatore
Damiano Carra
crediti
6
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Periodo
I sem. dal 3-ott-2016 al 31-gen-2017.

Orario lezioni

I sem.
Giorno Ora Tipo Luogo Note
martedì 16.30 - 18.30 lezione Aula C  
venerdì 14.30 - 15.30 lezione Laboratorio didattico Alfa  
venerdì 15.30 - 17.30 laboratorio Laboratorio didattico Alfa  

Obiettivi formativi

Il corso fornisce un'ampia introduzione ai concetti fondamentali dei sistemi di calcolo distribuiti di grandi dimensioni che devono gestire grandi quantità di dati. Gli argomenti trattati includono i framework di programmazione (MapReduce, Pregel), la progettazione degli algoritmi (per l'analisi dei testi, l'indicizzazione e l'analisi dei grafi) e le architetture dei sistemi (topologie dei data center, aspetti di rete e di gestione dei guasti).

Programma

- Framework di programmazione -
Filesystem distribuiti (HFS), sistemi NoSQL (HBase, Cassandra), analisi di dati e grafi (MapReduce, Pregel), sistemi SQL-like (Pig, Hive).

- Algoritmi -
Progettazione di algoritmi per l'analisi dei testi, per l'indicizzazione (PageRank), e l'analisi dei grafi.

- Architetture dei data center -
Topologie (VL2, PortLand, c-Through), protocolli di comunicazione (spanning tree, ECMP, OpenFlow), gestione degli errori e dei guasti.

Modalità d'esame

L'esame consiste nello svolgimento di un progetto e relativa documentazione.

Materiale didattico

Documenti

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

I dati relativi all'AA 2016/2017 non sono ancora disponibili