Recupero dell'informazione (2008/2009)

Corso a esaurimento

Codice insegnamento
4S01905
Docente
Manuele Bicego
crediti
5
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Periodo
3° Q dal 20-apr-2009 al 19-giu-2009.

Orario lezioni

3° Q
Giorno Ora Tipo Luogo Note
martedì 9.30 - 11.30 lezione Aula B  
mercoledì 9.30 - 10.30 lezione Aula F  
giovedì 9.30 - 11.30 lezione Aula G  
giovedì 9.30 - 11.30 lezione Laboratorio didattico Gamma  

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi di una classe di metodologie automatiche per il recupero di informazioni da dati biologici, al fine di estrarre conoscenza. In particolare verranno fornite le basi delle principali metodologie di clustering (o raggruppamento, detto anche Pattern Recognition non supervisionata), cioè metodi per la determinazione, all’interno di un insieme di dati, di gruppi omogenei basandosi su un criterio di similarità. L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).

Il corso si dividerà in due parti: nella prima, più metodologica, verranno descritte in generale le metodologie di clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche, con particolare riferimento, quando possibile, al clustering di dati biologici.

Nella seconda parte, più strettamente applicativa, verranno analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di clustering. In particolare, per ogni applicazione, verranno fornite una descrizione del problema e una soluzione classica. Esempi di applicazioni affrontate nel corso saranno: clustering di dati microarray (con cenni alle tecniche di biclustering), analisi evolutiva (filogenesi-filogenomica) e analisi di immagini biomedicali

Programma

- Introduzione generale al clustering: cos’è, cosa serve, qual’è la sua relazione con la Pattern Recognition supervisionata
- Rappresentazione e visualizzazione dei dati
- Misure di similarità tra dati
- Tecniche di clustering: tassonomia e dettagli delle tecniche più utilizzate
- Validazione dei risultati del clustering
- Applicazioni bioinformatiche

Modalità d'esame

La verifica del profitto sarà effettuata mediante la preparazione e lo svolgimento di un seminario e di una prova orale, atti a verificare l'acquisizione dei concetti teorici, nonché la padronanza degli strumenti matematici e informatici.
Per gli studenti particolarmente interessati agli argomenti del corso è possibile effettuare l'esame mediante lo svolgimento di un progetto e una prova orale. Il progetto dovrà essere congiunto a quello del corso di Riconoscimento e classificazione per la bioinformatica e concordato coi relativi docenti.

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

Statistiche esiti
Esiti Esami Esiti Percentuali Media voti Deviazione Standard
Positivi 25.0% 28 2
Respinti --
Assenti 75.0%
Ritirati --
Annullati --
Distribuzione degli esiti positivi
18 19 20 21 22 23 24 25 26 27 28 29 30 30 e Lode
0.0% 0.0% 0.0% 0.0% 0.0% 22.2% 0.0% 0.0% 11.1% 0.0% 11.1% 0.0% 22.2% 33.3%

Valori relativi all'AA 2008/2009 calcolati su un totale di 36 iscritti. I valori in percentuale sono arrotondati al numero intero più vicino.