Gestione e modellazione di dati bioinformatici - RICONOSCIMENTO E RECUPERO DELL'INFORMAZIONE PER BIOINFORMATICA (2019/2020)



Codice insegnamento
4S003708
Crediti
6
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti Orario
Teoria 4 I semestre Manuele Bicego

Vai all'orario delle lezioni

Laboratorio 2 I semestre Manuele Bicego

Vai all'orario delle lezioni

Obiettivi formativi

Il corso intende fornire i fondamenti teorici e applicativi della Pattern Recognition, una classe di metodologie automatiche utilizzate per il riconoscimento e il recupero di informazioni da dati biologici. In particolare verranno presentati e discussi le tecniche legate ai principali aspetti di questa disciplina: la rappresentazione, la classificazione, il clustering e la validazione. L’attenzione è rivolta principalmente alla descrizione delle metodologie piuttosto che ai dettagli dei programmi applicativi (già visti in altri corsi).

Al completamento del corso, gli studenti saranno in grado di analizzare un problema biologico utilizzando il punto di vista della Pattern Recognition; avranno inoltre le conoscenze necessarie per poter ideare, sviluppare e implementare le diverse componenti di un sistema di Pattern Recognition.

Programma

Propedeuticità consigliate: il corso ha come prerequisiti generali i corsi del I e II anno, ed in particolare nozioni di base di probabilità e statistica e analisi matematica.

TEORIA: in questa parte vengono descritte in maniera generale le diverse metodologie di rappresentazione, classificazione e clustering, i problemi sottostanti e le motivazioni che portano allo studio di queste tecniche.
Vengono inoltre analizzati alcuni problemi bioinformatici che sono classicamente risolti con metodologie di classificazione e clustering (ad esempio l'analisi di dati di espressione genica, la segmentazione di immagini biomedicali, la determinazione di omologia remota tra proteine etc etc).

LABORATORIO: Completa il corso una parte di laboratorio, nella quale verranno implementati (utilizzando il linguaggio di programmazione MATLAB) alcuni degli algoritmi visti nella parte di teoria.


Programma dettagliato

Teoria:
- Introduzione generale alla Pattern Recognition
- Rappresentazione dei dati
- Cenni alla teoria della decisione di Bayes
- Classificatori generativi e discriminativi
- Cenni a Reti Neurali e Hidden Markov Models
- Tecniche di clustering
- Applicazioni in bioinformatica

Laboratorio:
- Introduzione a matlab
- Rappresentazione dei dati e standardizzazione
- Principal Component Analysis
- Gaussiane e classificatori gaussiani
- Hidden Markov Models

Testi di Riferimento:
R. Duda, P. Hart, D. Stork Pattern Classification. Wiley, 2001
P. Baldi, S. Brunak, Bioinformatics, The Machine Learning Approach. MIT Press, 2001
A.K. Jain and R.C. Dubes, Algorithms for Clustering Data, Prentice-Hall, 1988

Modalità d'esame

Vedi le note generali sul corso.

Materiale didattico
Titolo Formato (Lingua, Dimensione, Data pubblicazione)
Dettagli Esame  pdfpdf (it, 62 KB, 14/01/20)