Programming laboratory for bioinformatics (2016/2017)

Codice insegnamento
4S004548
Docente
Rosalba Giugno
Coordinatore
Rosalba Giugno
crediti
12
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Inglese
Periodo
II sem., I sem.

Orario lezioni

II sem.
Giorno Ora Tipo Luogo Note
mercoledì 11.30 - 13.30 lezione Aula G  
venerdì 15.30 - 18.30 laboratorio Laboratorio didattico Alfa  
I sem.
Giorno Ora Tipo Luogo Note
mercoledì 8.30 - 10.30 laboratorio Laboratorio didattico Alfa  
giovedì 8.30 - 10.30 laboratorio Laboratorio didattico Gamma dal 13-ott-2016  al 27-ott-2016
giovedì 8.30 - 10.30 lezione Aula G  
venerdì 8.30 - 10.30 lezione Aula G  

Obiettivi formativi

Il corso ha l’obiettivo di fornire gli strumenti di programmazione necessari per l’analisi di dati genomici, trascrittomici e proteomici provenienti dalle tecnologie di ultima generazione. Per ogni argomento sono previste lezioni teoriche e di seguito (stesso giorno o giorni seguenti secondo il calendario) esercitazione in laboratorio.
A completamento del corso gli studenti saranno in grado di programmare, secondo i dati da analizzare e la domanda biomedica da risolvere, la pipeline di analisi appropriata. Sapranno altresì interpretare i dati e i risultati ottenuti.

Programma

Programmare in R. Introduzione. Le Strutture dati: Vettori, Matrici, Liste, Data Frame. Data Frame. Le funzioni. In/Out. Visualizzazione, la grammatica di graphics e ggplot2.

Capire e usare la Statistica: Pvalue, FDR, median, MAD, rank test, Spearman, test multiple e modelli lineari.

Programmare con Bioconductor. Struttura, principi e funzione. Allineamento di sequenze, progettazione sperimentale, effetti batch, analisi dei dati RNA-Seq e espressione differenziale, analisi di metilazione, analisi CNV, analisi di Microarray. Risorse di annotazione, Arricchimento funzionale.

Programmazione in Python e Bash. Introduzione e principi di base.

Algoritmi di analisi avanzati. Clustering e classificazione, resampling, cross-validation, bootstrap e test di permutazione, reti biologiche e loro analisi.

Il materiale didattico (principalmente basato su articoli scientifici continuamente aggiornati e guide online alla programmazione) è disponile nella piattaforma e-learning di Ateneo relativa al corso.

Modalità d'esame

L’esame consiste di una parte scritta (A) e di una progettuale (B). A consiste nello sviluppo di un programma in R per la risoluzione di un problema su dati genomici, trascrittomici o proteomici. B consiste nello sviluppo di un progetto concordato con il docente previo richiesta via email e appuntamento per l’elaborazione delle specifiche (il progetto ha validità tutto l’anno accademico). I progetti hanno diversi livelli di difficoltà. Ad ogni difficoltà corrisponde un valore massimo di valutazione. Gli studenti sosteranno un colloquio per commentare e approfondire le prove sostenute (A e B).

Riguardo al punto A, i frequentanti al corso potranno partecipare a due prove intermedie previste durante l’anno. Le prove consistono nello sviluppo di un programma in R per l'analisi di dati biomedici. Le due prove avranno un voto cumulativo espresso in trentesimi e comunicato agli studenti alla fine del corso.

Riguardo al punto B, i frequentanti al corso potranno potranno esporre alla classe le tematiche del loro progetto, il contesto di ricerca in cui il progetto è collocato, e lo stato di avanzamento dello stesso.

Il voto per le parti A e B è espresso in trentesimi.

Il voto finale è calcolato come min(31, ((A+B)/2)+C).
C è espresso nell'intervallo[-4,+4] è riflette la maturazione e autonomia scientifica acquisita durante lo sviluppo delle prove e del progetto, nell’esposizione e nell’interpretazione della letteratura scientifica e del contesto scientifico del progetto.

Opinione studenti frequentanti - 2015/2016


Statistiche per i requisiti di trasparenza (Attuazione Art. 2 del D.M. 31/10/2007, n. 544)

I dati relativi all'AA 2016/2017 non sono ancora disponibili