Riconoscimento e recupero dell'informazione per bioinformatica (2011/2012)

Codice insegnamento
4S02716
Crediti
12
Coordinatore
Manuele Bicego
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti
Teoria 9 II semestre Manuele Bicego
Laboratorio 3 II semestre Marco Cristani

Orario lezioni

II semestre
Attività Giorno Ora Tipo Luogo Note
Teoria martedì 14.30 - 17.30 lezione Aula B  
Teoria giovedì 8.30 - 11.30 lezione Aula B  
Laboratorio lunedì 9.30 - 12.30 laboratorio Laboratorio didattico Alfa  

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi di una classe di metodologie automatiche per il riconoscimento e il recupero di informazioni da dati biologici, al fine di estrarre conoscenza. In particolare verranno fornite le basi delle principali metodologie di Pattern Recognition, sia supervisionata (classificazione) che non supervisionata (clustering). L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).

Il corso si svilupperà seguendo diverse direzioni (intersecanti). Nella prima, più metodologica, verranno descritte in generale le metodologie di classificazione e di clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche.
Nella seconda, più strettamente applicativa, verranno analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di classificazione e clustering (come l'analisi di dati derivanti da microarray). In particolare, per ogni applicazione, verranno fornite una descrizione del problema e una soluzione classica.
Infine, nella terza (da effettuare in laboratorio), verranno implementati semplici algoritmi di classificazione e clustering utilizzando il linguaggio di programmazione MATLAB.

Programma

INTRODUZIONE:
- Introduzione generale alla Pattern Recognition: cos’è, cosa serve, tipico sistema di PR
- Rappresentazione e visualizzazione dei dati

CLASSIFICAZIONE:
- Schemi di classificazione
- Classificatori semplici
- Classificatori avanzati: Reti neurali, Support Vector Machines, Hidden Markov Models
- Validazione della classificazione

CLUSTERING:
- Misure di similarità tra dati
- Tecniche di clustering: tassonomia e dettagli delle tecniche più utilizzate
- Validazione

APPLICAZIONI

Modalità d'esame

La verifica del profitto sarà effettuata mediante la preparazione e lo svolgimento di un seminario e di una breve prova scritta, atti a verificare l'acquisizione dei concetti teorici, nonché la padronanza degli strumenti matematici e informatici.

Per gli studenti particolarmente interessati agli argomenti del corso è possibile effettuare l'esame sostituendo il seminario con lo svolgimento di un progetto.

Materiale didattico
Titolo Formato (Lingua, Dimensione, Data pubblicazione)
Lab 0 - Introduzione a MATLAB - part1  pdfpdf (it, 101 KB, 14/03/12)
Lab 0 - Introduzione a MATLAB - part2  zipzip (it, 0 KB, 14/03/12)
Lab 1 - Introduzione a MATLAB - part3  zipzip (it, 1 KB, 14/03/12)
Lab 2 - Introduzione a MATLAB - part4  zipzip (it, 2 KB, 26/03/12)
Lab 3 - Introduzione a MATLAB e PCA  zipzip (it, 2 KB, 02/04/12)
Lab 4 - LDA  zipzip (it, 14 KB, 07/05/12)
Lab 5 - Classificatori Bayesiani e distribuzioni Gaussiane  zipzip (it, 23 KB, 07/05/12)
Lab 6 - KNN  zipzip (it, 92 KB, 07/05/12)
Lab 7 - Riassunto  zipzip (it, 0 KB, 06/06/12)
Lab 8 - Hidden Markov Models  zipzip (it, 0 KB, 06/06/12)

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

I dati relativi all'AA 2011/2012 non sono ancora disponibili