Riconoscimento e recupero dell'informazione per bioinformatica (2012/2013)

Codice insegnamento
4S02716
Crediti
12
Coordinatore
Manuele Bicego
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti
Teoria 9 I semestre Manuele Bicego
Laboratorio 3 I semestre Marco Cristani

Orario lezioni

I semestre
Attività Giorno Ora Tipo Luogo Note
Teoria martedì 10.30 - 13.30 lezione Aula F  
Teoria mercoledì 10.30 - 13.30 lezione Aula B  
Laboratorio lunedì 14.30 - 17.30 laboratorio Laboratorio didattico Alfa  

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi di una classe di metodologie automatiche per il riconoscimento e il recupero di informazioni da dati biologici, al fine di estrarre conoscenza. In particolare verranno fornite le basi delle principali metodologie di Pattern Recognition, sia supervisionata (classificazione) che non supervisionata (clustering). L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).

Il corso si svilupperà seguendo diverse direzioni (intersecanti). Nella prima, più metodologica, verranno descritte in generale le metodologie di classificazione e di clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche.
Nella seconda, più strettamente applicativa, verranno analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di classificazione e clustering. In particolare, per ogni applicazione, verranno fornite una descrizione del problema e una soluzione classica. Esempi di possibili applicazioni affrontate nel corso saranno: classificazione e clustering di dati microarray (con cenni alle tecniche di biclustering), analisi evolutiva (filogenesi-filogenomica), analisi di immagini biomedicali e altre
Infine, nella terza (da effettuare nel modulo di laboratorio), verranno implementati semplici algoritmi di classificazione e clustering utilizzando il linguaggio di programmazione MATLAB.

Programma

- Introduzione generale alla Pattern Recognition: cos’è, cosa serve, tipico sistema di PR

- Rappresentazione e visualizzazione dei dati
- Teoria della decisione di Bayes
- Classificatori generativi
- Classificatori discriminativi
- Validazione della classificazione
- Cenni a Reti Neurali
- Cenni a Hidden Markov Models

- Misure di similarità tra dati
- Tecniche di clustering: tassonomia e dettagli delle tecniche più utilizzate
- Validazione del clistering

- Applicazioni

Modalità d'esame

La verifica del profitto sarà effettuata mediante la preparazione e lo svolgimento di un seminario e di una breve prova scritta, atti a verificare l'acquisizione dei concetti teorici, nonché la padronanza degli strumenti matematici e informatici.

Per gli studenti particolarmente interessati agli argomenti del corso è possibile effettuare l'esame sostituendo il seminario con lo svolgimento di un progetto.

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

I dati relativi all'AA 2012/2013 non sono ancora disponibili