Attività | Crediti | Periodo | Docenti | Orario |
---|---|---|---|---|
Teoria | 9 | I sem. | Manuele Bicego, Rosalba Giugno | |
Laboratorio | 3 | I sem. | Pietro Lovato |
Il corso intende fornire i fondamenti teorici e applicativi della Pattern Recognition, una classe di metodologie automatiche utilizzate per il riconoscimento e il recupero di informazioni da dati biologici. In particolare verranno presentati e discussi i principali aspetti di questa disciplina: la rappresentazione, la classificazione, il clustering e la validazione. L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).
Al completamento del corso, gli studenti saranno in grado di analizzare un problema biologico utilizzando il punto di vista della Pattern Recognition; avranno inoltre le conoscenze necessarie per poter ideare, sviluppare e implementare le diverse componenti di un sistema di Pattern Recognition.
Propedeuticità consigliate: il corso ha come prerequisiti generali i corsi del I e II anno, ed in particolare nozioni di base di probabilità e statistica e analisi matematica.
Il corso si suddivide in tre parti:
PARTE 1. la prima parte è di natura strettamente metodologica, dove vengono descritte in maniera generale le diverse metodologie di rappresentazione, classificazione e clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche.
PARTE 2. Nella seconda parte, più strettamente applicativa, vengono analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di classificazione e clustering (ad esempio l'analisi di dati di espressione genica, la segmentazione di immagini biomedicali, la determinazione di omologia remota tra proteine etc etc).
PARTE 3. Completa il corso una parte di laboratorio, nella quale verranno implementati (utilizzando il linguaggio di programmazione MATLAB) alcuni degli algoritmi visti nella parte di teoria.
Programma dettagliato
Teoria (72 h):
- Introduzione generale alla Pattern Recognition
- Rappresentazione dei dati
- Teoria della decisione di Bayes
- Classificatori generativi e discriminativi
- Validazione della classificazione
- Reti Neurali
- Hidden Markov Models
- Tecniche di clustering
- Validazione del clustering
- Applicazioni in bioinformatica
Laboratorio (36 h):
- Introduzione a matlab
- Rappresentazione dei dati e standardizzazione
- Principal Component Analysis
- Gaussiane e classificatori gaussiani
- Hidden Markov Models
Testi di Riferimento:
R. Duda, P. Hart, D. Stork Pattern Classification. Wiley, 2001
P. Baldi, S. Brunak, Bioinformatics, The Machine Learning Approach. MIT Press, 2001
A.K. Jain and R.C. Dubes, Algorithms for Clustering Data, Prentice-Hall, 1988
Per superare l'esame gli studenti dovranno dimostrare di:
- essere in grado di descrivere i diversi componenti di un sistema di Pattern Recognition in modo preciso, organico e senza divagazioni
- saper analizzare, capire e descrivere un sistema di Pattern Recognition (o una sua parte) relativo ad un problema di tipo biologico.
L'esame consiste in:
i) una prova scritta contenente domande a risposta aperta sugli argomenti trattati nel corso
ii) una presentazione orale di un articolo scientifico pubblicato in importanti riviste di settore nell'anno 2015. L'articolo viene scelto dal candidato e approvato dal docente del corso
Le due parti dell'esame sono superabili separatamente e il voto complessivo è dato dalla somma delle valutazioni in 15esimi ottenute nelle due parti. Lo scritto si ritiene superato con un voto maggiore o uguale a 8. L’esame si ritiene superato se la somma delle parti è maggiore o uguale a 18. Ogni valutazione rimane valida per l’intero anno accademico in corso.