Statistical methods for data analysis (2018/2019)



Codice insegnamento
4S007624
Crediti
6
Coordinatore
Alberto Castellini
Settore disciplinare
MAT/08 - ANALISI NUMERICA
Lingua di erogazione
Inglese
L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti Orario
Machine learning 3 I semestre Alberto Castellini

Vai all'orario delle lezioni

Statistical modelling 3 I semestre Leonard Peter Bos

Vai all'orario delle lezioni

Obiettivi formativi

L'obiettivo del modulo è quello di introdurre agli studenti metodi di modellazione statistica ed analisi dati descrittiva. Tecniche di addestramento supervisionato e non supervisionato saranno presentate sia dal punto di vista teorico che applicativo con la presentazione di alcuni esempi pratici. Nelle sessioni di laboratorio verrà illustrato l'utilizzo di algoritmi applicati a specifici casi di studio, utilizzando principalmente i linguaggi di programmazione R e Python.

Programma

- Introduzione all'analisi dati con R e Python

- Metodi di regressione lineare (regressione lineare, minimi quadrati, MLE: stima, predizione, test con assunzioni Gaussiane, selezione di variabili)

- Metodi di regolarizzazione (Ridge regression, Least absolute shrinkage and selection operator, [Elastic net, Least angle regression])

- Metodi di classificazione lineare (regressione logistica, MLE: stima, predizione, selezione di variabili)

- Selezione di modelli lineari (cross-validazione, metodi di bootstrap)

- Metodologie di clustering (k-means, analisi delle componenti principali, clustering spettrale)

Modalità d'esame

L'obiettivo dell'esame è di valutare le capacità dello studente di comprendere ed utilizzare le metodologie presentate nel corso. L'esame consiste nello sviluppo di un progetto applicativo relativo ad uno specifico caso di studio. Alternativamente lo studente può scegliere di dare una presentazione su metodologie avanzate presenti in letteratura e collegate agli argomenti del corso.

Testi di riferimento
Attività Autore Titolo Casa editrice Anno ISBN Note
Machine learning T. Hastie, R. Tibshirani, J. Friedman. The elements of statistical learning. Data mining, inference, and prediction. (Edizione 2) Springer 2009

Opinione studenti frequentanti - 2017/2018