Riconoscimento e recupero dell'informazione per bioinformatica (2009/2010)

Codice insegnamento
4S02716
Docente
Manuele Bicego
Coordinatore
Manuele Bicego
crediti
12
Altri corsi di studio in cui è offerto
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Periodo
II semestre dal 1-mar-2010 al 15-giu-2010.

Orario lezioni

II semestre
Giorno Ora Tipo Luogo Note
mercoledì 14.30 - 17.30 lezione Aula F  
giovedì 10.30 - 13.30 lezione Aula D  
venerdì 10.30 - 13.30 laboratorio Laboratorio didattico Delta  

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi di una classe di metodologie automatiche per il riconoscimento e il recupero di informazioni da dati biologici, al fine di estrarre conoscenza. In particolare verranno fornite le basi delle principali metodologie di Pattern Recognition, sia supervisionata (classificazione) che non supervisionata (clustering). L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).
 
Il corso si svilupperà seguendo diverse direzioni (intersecanti). Nella prima, più metodologica, verranno descritte in generale le metodologie di classificazione e di clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche.  
Nella seconda, più strettamente applicativa, verranno analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di classificazione e clustering. In particolare, per ogni applicazione, verranno fornite una descrizione del problema e una soluzione classica. Esempi di applicazioni affrontate nel corso saranno: classificazione e clustering di dati microarray (con cenni alle tecniche di biclustering), analisi evolutiva (filogenesi-filogenomica), analisi di immagini biomedicali e altre
Infine, nella terza (da effettuare in laboratorio), verranno implementati semplici algoritmi di classificazione e clustering utilizzando il linguaggio di programmazione MATLAB.

Programma

INTRODUZIONE:
- Introduzione generale alla Pattern Recognition: cos’è, cosa serve, tipico sistema di PR
- Rappresentazione e visualizzazione dei dati

CLASSIFICAZIONE:
- Schemi di classificazione
- Classificatori semplici
- Classificatori avanzati: Reti neurali, Support Vector Machines, Hidden Markov Models
- Validazione della classificazione

CLUSTERING:
- Misure di similarità tra dati
- Tecniche di clustering: tassonomia e dettagli delle tecniche più utilizzate
- Validazione

APPLICAZIONI:
- classificazione e clustering di dati microarray (con cenni alle tecniche di biclustering)
- analisi evolutiva (filogenesi-filogenomica)
- analisi di immagini biomedicali

Modalità d'esame

La verifica del profitto sarà effettuata mediante la preparazione e lo svolgimento di un seminario e di una breve prova scritta, atti a verificare l'acquisizione dei concetti teorici, nonché la padronanza degli strumenti matematici e informatici.

Per gli studenti particolarmente interessati agli argomenti del corso è possibile effettuare l'esame sostituendo il seminario con lo svolgimento di un progetto.

Materiale didattico

Documenti

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

Statistiche esiti
Esiti Esami Esiti Percentuali Media voti Deviazione Standard
Positivi 41.12% 26 2
Respinti --
Assenti 58.87%
Ritirati --
Annullati --
Distribuzione degli esiti positivi
18 19 20 21 22 23 24 25 26 27 28 29 30 30 e Lode
0.0% 0.0% 0.0% 0.0% 4.5% 11.3% 11.3% 11.3% 6.8% 15.9% 15.9% 9.0% 6.8% 6.8%

Valori relativi all'AA 2009/2010 calcolati su un totale di 107 iscritti. I valori in percentuale sono arrotondati al numero intero più vicino.