Laboratorio di bioinformatica (2018/2019)



Codice insegnamento
4S003713
Crediti
12
Coordinatore
Alejandro Giorgetti
Settore disciplinare
BIO/10 - BIOCHIMICA
Lingua di erogazione
Italiano
L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti Orario
Mod.1 teoria 3 I semestre Daniele Dell'Orco

Vai all'orario delle lezioni

Mod.1 laboratorio 3 I semestre Daniele Dell'Orco

Vai all'orario delle lezioni

Mod.2 teoria 3 II semestre Alejandro Giorgetti

Vai all'orario delle lezioni

Mod.2 laboratorio 3 II semestre Alejandro Giorgetti

Vai all'orario delle lezioni

Obiettivi formativi

Il corso si propone di presentare allo studente le basi teoriche e applicative di algoritmi e programmi utilizzati nella ricerca e nell’analisi dei dati contenuti nelle principali banche dati biologiche di uso corrente. Attraverso presentazioni orali, a gruppi, lo studente svilupperà inoltre abilità comunicative e di autoverifica.

Il corso si compone di due moduli di seguito specificati. Attraverso

Modulo 1: In questo modulo verranno appresi gli strumenti volti all’utilizzo dell’informazione in proteomica, genomica, biochimica, biologia molecolare e strutturale. Si fornisce inoltre un’introduzione all’analisi e la visualizzazione di dati strutturali relativi a macromolecole biologiche e loro complessi e la creazione di semplici modelli dinamici e statici di reti biomolecolari, che avvicinerà lo studente all’emergente disciplina della systems biology.

Modulo 2: In questo modulo lo studente acquisirà conoscenza pratica degli strumenti bioinformatici per l'analisi, l'interpretazione e la predizione di dati biologici in proteomica, genomica, biochimica, biologia molecolare e strutturale. In particolare, gli studenti avranno la possibilità di applicare strumenti della boinformatica allo stato dell'arte a specifici problemi biologici.

Programma

------------------------
MM: Modulo 1
------------------------
Modulo di Teoria
- Principali proprietà strutturali di proteine e acidi nucleici in relazione all’evoluzione. Introduzione ai recenti sviluppi delle banche dati e del software di interesse biologico e al loro utilizzo in genomica funzionale, proteomica e genomica strutturale. - Introduzione alle banche dati biomolecolari. Organizzazione e integrazione dell'informazione riguardante: a) sequenze di proteine e di acidi nucleici; b) strutture biomolecolari o di composti di interesse biologico; c) banche dati bibliografiche e specialistiche; recupero di informazione e ricerca per parole chiave combinate con operatori logici. - Confronto di sequenze biologiche, matrici a punti, algoritmi statici e dinamici di allineamento; matrici di punteggio e sostituzione (PAM, BLOSUM). - Algoritmi di allineamento; metodi dinamici; algoritmo di Needleman-Wunsch; algoritmo di Smith-Waterman; significatività statistica di un allineamento (z-score, valori di aspettativa e di probabilità); metodi euristici; Allineamenti locali e BLAST. - Allineamenti multipli di sequenze: l'algoritmo ClustalW; cenni ad altri algoritmi; ricerca in banche dati con allineamenti multipli; PSI-BLAST. - Introduzione alla bioinformatica strutturale: macromolecole biologiche (proteine e acidi nucleici) e loro assemblati: introduzione alla grafica molecolare. - Introduzioni alle reti neurali (NN). Cenni ai metodi basati su NN per predire strutture secondarie partendo dalla sequenza e al confronto strutturale. - Introduzione alla systems biology: il sistema non come somma delle parti; modelli statici e modelli cinetici dinamici; cenni alle reti di trasduzione del segnale.

Modulo di Laboratorio
- Introduzione ai database presso NCBI: l’interfaccia Entrez, Gene, Unigene, Protein. Uniprot.
- Allineamenti a coppie, matrici a punti e applicazione all’analisi di sequenze proteiche. Matrici di punteggio e metodi ottimali: strumenti online.
- BLAST, PSI-BLAST: risorse online ed applicazioni pratiche.
- Strumenti per gli allineamenti multipli, la banca dati Homologene e risorse online per il calcolo e la visualizzazione di allineamenti multipli. - Visualizzazione e grafica molecolare: utilizzo di PyMol.
- Metodi per predire strutture secondarie e proteine, PSI-PRED, JPRED, database di famiglie strutturali
- Systems Biology: simulazione numerica di semplici reazioni biochimiche e della loro cinetica. Costruzione di semplici modelli cinetici e simulazione dell’evoluzione temporale con SBTOOLBOX2 per Matlab; applicazione: il ciclo di signaling delle proteine G.

------------------------
MM: Modulo 2
------------------------
Strumenti bioinformatici per l'analisi di fenomeni di evoluzione molecolare e filogenesi: Orologio molecolare, modelli di sostituzione, filogenesi molecolare, metodi per la costruzione degli alberi filogenetici (algoritmi di clustering, metodi che massimizzano funzione obiettiva). Programmi per la predizione della struttura tridimensionale di una proteina: modelling comparativo, Fold recognition e Ab initio.
Predizione automatica di geni utilizzando i programmi di ultima generazione. Validazione delle predizioni geniche utilizzando dati di espressione genica. Annotazione funzionale e geni ortologhi.
Introduzione ai calcoli energetici delle proteine: MD simulations, docking ligando-proteina e docking proteina-proteina. La modalità di insegnamento prevede la didattica frontale e esercizi al PC. Inoltre gli studenti sono coinvolti nella preparazione di un progetto su argomenti di interesse biologico. Questo è svolto in gruppi.

Modalità d'esame

------------------------
MM: Modulo 1
------------------------
Per superare l'esame di profitto lo studente dovrà dimostrare di: - aver compreso il concetto di omologia ed i suoi risvolti pratici nell'ambito bioinformatico - aver compreso la differenza tra similitudine e identità tra sequenze biologiche - saper interrogare database di interesse bioinformatico, ottenere ed immagazzinare i relativi dati, effettuando opportune ricerche incrociate su diversi database al fine di effettuare ricerche specifiche - saper utilizzare algoritmi per il confronto di sequenze nucleotidiche ed amminoacidiche - saper utilizzare software per la grafica e visualizzazione molecolare - saper costruire semplici reti di interazione fra biomolecole e simularne il decorso temporale. Teoria -------- L'esame consiste in una prova scritta con 5 domande aperte sugli argomenti trattati nel corso, ciascuna con un punteggio massimo di 6 punti. Lo scritto ha una durata di 75 minuti. Il voto sara' in trentesimi. Laboratorio ----------------- L'esame, che si può sostenere lo stesso giorno dello scritto di teoria, contiene 3 esercizi da risolvere con l'utilizzo del computer (ciascuno con un punteggio massimo di 10 punti). Lo scritto ha una durata di 75 minuti. Il voto sara' in trentesimi. Presentazioni -------------------- A fine gennaio gli studenti presentano, a gruppi di 2 o 3 membri, un database a loro scelta contenuto nel numero di gennaio della rivista Nucleic Acids Research (Database issue). Dovranno illustrare, mediante una presentazione di 10 minuti + 3 minuti per le domande/discussione, le finalità del database ed un'applicazione originale. Otterranno un punteggio da 1 a 4, che terra' conto dell'approfondimento della tematica, della chiarezza espositiva, dell'efficacia di comunicazione e padronanza degli strumenti utilizzati. Voto finale --------------- Il voto finale, in trentesimi, si otterrà sommando la media tra il voto della prova di teoria e quella laboratorio al voto conseguito nella presentazione.
------------------------
MM: Modulo 2
------------------------
L'esame è scritto e consiste in una sessione di domande aperte sugli argomenti trattati nel corso. In particolare le teorie di modellizzazione, docking e gene annotation sono richieste. La seconda fase consiste nella stessura di un documento del tipo manuscritto scientifico con i risultati ottenuti nella realizzazione del progetto assegnato a lezione.

Testi di riferimento
Attività Autore Titolo Casa editrice Anno ISBN Note
Mod.1 teoria Stefano Pascarella e Alessandro Paiardini Bioinformatica Zanichelli 2011 9788808062192
Mod.1 teoria Jonathan Pevsner Bioinformatics and Functional Genomics, 3rd Edition Wiley-Blackwell 2015 978-1-118-58178-0
Mod.1 laboratorio Stefano Pascarella e Alessandro Paiardini Bioinformatica Zanichelli 2011 9788808062192
Mod.1 laboratorio Jonathan Pevsner Bioinformatics and Functional Genomics, 3rd Edition Wiley-Blackwell 2015 978-1-118-58178-0
Mod.2 teoria Stefano Pascarella e Alessandro Paiardini Bioinformatica Zanichelli 2011 9788808062192
Mod.2 teoria Frishman, D., Valencia, Alfonso Modern Genome Annotation Springer 2008
Mod.2 laboratorio Stefano Pascarella e Alessandro Paiardini Bioinformatica Zanichelli 2011 9788808062192

Opinione studenti frequentanti - 2017/2018