Recupero dell'informazione (2008/2009)

Corso disattivato non visibile

Codice insegnamento
4S01905
Docente
Manuele Bicego
crediti
5
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Sede
VERONA
Periodo
3° Q dal 20-apr-2009 al 19-giu-2009.

Orario lezioni

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi di una classe di metodologie automatiche per il recupero di informazioni da dati biologici, al fine di estrarre conoscenza. In particolare verranno fornite le basi delle principali metodologie di clustering (o raggruppamento, detto anche Pattern Recognition non supervisionata), cioè metodi per la determinazione, all’interno di un insieme di dati, di gruppi omogenei basandosi su un criterio di similarità. L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).

Il corso si dividerà in due parti: nella prima, più metodologica, verranno descritte in generale le metodologie di clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche, con particolare riferimento, quando possibile, al clustering di dati biologici.

Nella seconda parte, più strettamente applicativa, verranno analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di clustering. In particolare, per ogni applicazione, verranno fornite una descrizione del problema e una soluzione classica. Esempi di applicazioni affrontate nel corso saranno: clustering di dati microarray (con cenni alle tecniche di biclustering), analisi evolutiva (filogenesi-filogenomica) e analisi di immagini biomedicali

Programma

- Introduzione generale al clustering: cos’è, cosa serve, qual’è la sua relazione con la Pattern Recognition supervisionata
- Rappresentazione e visualizzazione dei dati
- Misure di similarità tra dati
- Tecniche di clustering: tassonomia e dettagli delle tecniche più utilizzate
- Validazione dei risultati del clustering
- Applicazioni bioinformatiche

Modalità d'esame

La verifica del profitto sarà effettuata mediante la preparazione e lo svolgimento di un seminario e di una prova orale, atti a verificare l'acquisizione dei concetti teorici, nonché la padronanza degli strumenti matematici e informatici.
Per gli studenti particolarmente interessati agli argomenti del corso è possibile effettuare l'esame mediante lo svolgimento di un progetto e una prova orale. Il progetto dovrà essere congiunto a quello del corso di Riconoscimento e classificazione per la bioinformatica e concordato coi relativi docenti.

Condividi