Riconoscimento e recupero dell'informazione per bioinformatica (2010/2011)

Codice insegnamento
4S02716
Docenti
Manuele Bicego, Mehmet Aydin Ulas
Coordinatore
Manuele Bicego
crediti
12
Altri corsi di studio in cui è offerto
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
Periodo
II semestre dal 1-mar-2011 al 15-giu-2011.

Orario lezioni

II semestre
Giorno Ora Tipo Luogo Note
lunedì 16.30 - 19.30 lezione Aula F  
giovedì 8.30 - 11.30 laboratorio Laboratorio didattico Delta  
venerdì 14.30 - 17.30 lezione Aula F  

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi di una classe di metodologie automatiche per il riconoscimento e il recupero di informazioni da dati biologici, al fine di estrarre conoscenza. In particolare verranno fornite le basi delle principali metodologie di Pattern Recognition, sia supervisionata (classificazione) che non supervisionata (clustering). L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).

Il corso si svilupperà seguendo diverse direzioni (intersecanti). Nella prima, più metodologica, verranno descritte in generale le metodologie di classificazione e di clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche.
Nella seconda, più strettamente applicativa, verranno analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di classificazione e clustering (come l'analisi di dati derivanti da microarray). In particolare, per ogni applicazione, verranno fornite una descrizione del problema e una soluzione classica.
Infine, nella terza (da effettuare in laboratorio), verranno implementati semplici algoritmi di classificazione e clustering utilizzando il linguaggio di programmazione MATLAB.

Programma

INTRODUZIONE:
- Introduzione generale alla Pattern Recognition: cos’è, cosa serve, tipico sistema di PR
- Rappresentazione e visualizzazione dei dati

CLASSIFICAZIONE:
- Schemi di classificazione
- Classificatori semplici
- Classificatori avanzati: Reti neurali, Support Vector Machines, Hidden Markov Models
- Validazione della classificazione

CLUSTERING:
- Misure di similarità tra dati
- Tecniche di clustering: tassonomia e dettagli delle tecniche più utilizzate
- Validazione

APPLICAZIONI

Modalità d'esame

La verifica del profitto sarà effettuata mediante la preparazione e lo svolgimento di un seminario e di una breve prova scritta, atti a verificare l'acquisizione dei concetti teorici, nonché la padronanza degli strumenti matematici e informatici.

Per gli studenti particolarmente interessati agli argomenti del corso è possibile effettuare l'esame sostituendo il seminario con lo svolgimento di un progetto.

Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

Statistiche esiti
Esiti Esami Esiti Percentuali Media voti Deviazione Standard
Positivi 52.77% 26 2
Respinti --
Assenti 47.22%
Ritirati --
Annullati --
Distribuzione degli esiti positivi
18 19 20 21 22 23 24 25 26 27 28 29 30 30 e Lode
0.0% 0.0% 0.0% 0.0% 15.7% 0.0% 21.0% 10.5% 15.7% 5.2% 10.5% 0.0% 10.5% 10.5%

Valori relativi all'AA 2010/2011 calcolati su un totale di 36 iscritti. I valori in percentuale sono arrotondati al numero intero più vicino.