Computational analysis of biological structures and networks (2018/2019)

Codice insegnamento
4S004551
Crediti
6
Coordinatore
Manuele Bicego
Settore disciplinare
ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Lingua di erogazione
Inglese
L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti Orario
Teoria 4 I semestre Manuele Bicego

Vai all'orario delle lezioni

Laboratorio 2 I semestre Manuele Bicego

Vai all'orario delle lezioni

Obiettivi formativi

Il corso si propone fornire i fondamenti teorici e applicativi della Pattern Recognition per l'analisi di dati biologici dotati di struttura complessa (come grafi, reti, sequenze, stringhe). In particolare verranno presentate e discusse le principali tecniche computazionali per l'analisi di dati strutturati, con particolare attenzione alla rappresentazione, agli approcci generativi e agli approcci discriminativi.

Conoscenza e capacità di comprensione
Al termine dell'insegnamento lo studente dovrà dimostrare di saper applicare su dati reali le metodologie per il riconoscimento di modelli dei dati complessi attraverso tecniche la costruzione di un sistema di Pattern Recognition.

Conoscenze applicate e capacità di comprensione
a) Rappresentazione di dati biologici con struttura complessa
b) Classificazione di dati biologici con struttura complessa
c) Clustering di dati biologici con struttura complessa

Autonomia di giudizio
In particolare, alla fine del corso lo studente dovrà dimostrare di essere in grado di proporre in modo autonomo soluzioni efficaci ed efficienti per il dominio applicativo biomedico e bioinformatico e di individuare le criticità per il trattamento di problemi complessi di bioinformatica.

Abilità comunicative
Alla fine del corso lo studente dovrà dimostrare di essere in grado di relazionarsi con i colleghi nello svolgimento di lavori in gruppo.

Capacità di apprendere
Alla fine del corso lo studente dovrà dimostrare di essere in grado di apprendere nuove metodologie per la soluzione di problemi bioinformatici e clinici e applicarli in modo autonomo. In particolare dovrà dimostrare di essere in grado di analizzare un problema biologico che coinvolge dati con una struttura complessa utilizzando il punto di vista della Pattern Recognition; avrà inoltre le conoscenze necessarie per poter ideare, sviluppare e implementare le diverse componenti di un sistema di Pattern Recognition per l'analisi di dati biologici strutturati. Sarà inoltre in grado di proseguire gli studi in modo autonomo nell'ambito della Pattern Recognition.

Programma

CAPITOLO 1. Basi di PR e Introduzione ai dati strutturati.
CAPITOLO 2. Rappresentazione per dati strutturati
- Tecniche di riduzione della dimensionalità
- Approcci Bag of Words
- Approcci di rappresentazione basati sulla dissimilarità
CAPITOLO 3. Modelli per dati strutturati
- Introduzione ai modelli grafici probabilistici
- Reti di Bayes
- Inferenza e Addestramento
CAPITOLO 4. Kernel per dati strutturati
- Support Vector Machines e kernel
- kernel per dati strutturati
CAPITOLO 5. Paradigmi di learning avanzati

Completa il corso una parte di laboratorio, nella quale verranno implementati alcuni degli algoritmi visti nella parte di teoria.

Modalità d'esame

Per superare l'esame gli studenti dovranno dimostrare di:
- essere in grado di descrivere i diversi componenti di un sistema di Pattern Recognition per dati strutturati in modo preciso, organico e senza divagazioni
- saper analizzare, capire e descrivere un sistema di Pattern Recognition (o una sua parte) relativo ad un problema di tipo biologico che coinvolge dati strutturati

L'esame consiste in:
i) una prova scritta contenente domande a risposta aperta sugli argomenti trattati nel corso
ii) una presentazione orale di un articolo scientifico pubblicato in importanti riviste di settore su un tema specifico deciso durante il corso. L'articolo viene scelto dal candidato e approvato dal docente del corso

Le due parti dell'esame sono superabili separatamente e il voto complessivo è dato dalla somma delle valutazioni in 15esimi ottenute nelle due parti. Lo scritto si ritiene superato con un voto maggiore o uguale a 8. L’esame si ritiene superato se la somma delle parti è maggiore o uguale a 18. Ogni valutazione rimane valida per l’intero anno accademico in corso.