Computational analysis of biological structures and networks (2017/2018)

Codice insegnamento
4S004551
Docente
Manuele Bicego
Coordinatore
Manuele Bicego
crediti
6
Settore disciplinare
ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Lingua di erogazione
Inglese
Periodo
I sem. dal 2-ott-2017 al 31-gen-2018.

Orario lezioni

Vai all'orario delle lezioni

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi della Pattern Recognition per l'analisi di dati biologici dotati di struttura complessa (come grafi, reti, sequenze, stringhe). In particolare verranno presentate e discusse le principali tecniche computazionali per l'analisi di dati strutturati, con particolare attenzione alla rappresentazione, agli approcci generativi e agli approcci discriminativi.

Al completamento del corso, gli studenti saranno in grado di analizzare un problema biologico che coinvolge dati con una struttura complessa utilizzando il punto di vista della Pattern Recognition; avranno inoltre le conoscenze necessarie per poter ideare, sviluppare e implementare le diverse componenti di un sistema di Pattern Recognition per l'analisi di dati biologici strutturati.

Programma

CAPITOLO 1. Basi di PR e Introduzione ai dati strutturati.
CAPITOLO 2. Rappresentazione per dati strutturati
- Tecniche di riduzione della dimensionalità
- Approcci Bag of Words
- Approcci di rappresentazione basati sulla dissimilarità
CAPITOLO 3. Modelli per dati strutturati
- Introduzione ai modelli grafici probabilistici
- Reti di Bayes
- Inferenza e Addestramento
CAPITOLO 4. Kernel per dati strutturati
- Support Vector Machines e kernel
- kernel per dati strutturati
CAPITOLO 5. Deep Learning

Testi di Riferimento:
R. Duda, P. Hart, D. Stork Pattern Classification. Wiley, 2001
P. Baldi, S. Brunak, Bioinformatics, The Machine Learning Approach. MIT Press, 2001
C.M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006

Modalità d'esame

Per superare l'esame gli studenti dovranno dimostrare di:
- essere in grado di descrivere i diversi componenti di un sistema di Pattern Recognition per dati strutturati in modo preciso, organico e senza divagazioni
- saper analizzare, capire e descrivere un sistema di Pattern Recognition (o una sua parte) relativo ad un problema di tipo biologico che coinvolge dati strutturati

L'esame consiste in:
i) una prova scritta contenente domande a risposta aperta sugli argomenti trattati nel corso
ii) una presentazione orale di un articolo scientifico pubblicato in importanti riviste di settore su un tema specifico deciso durante il corso. L'articolo viene scelto dal candidato e approvato dal docente del corso

Le due parti dell'esame sono superabili separatamente e il voto complessivo è dato dalla somma delle valutazioni in 15esimi ottenute nelle due parti. Lo scritto si ritiene superato con un voto maggiore o uguale a 8. L’esame si ritiene superato se la somma delle parti è maggiore o uguale a 18. Ogni valutazione rimane valida per l’intero anno accademico in corso.

Materiale didattico

Documenti

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

I dati relativi all'AA 2017/2018 non sono ancora disponibili