Intelligenza visuale (2020/2021)

Codice insegnamento
4S008907
Crediti
6
Settore disciplinare
INF/01 - INFORMATICA
Lingua di erogazione
Italiano
L'insegnamento è organizzato come segue:
Attività Crediti Periodo Docenti Orario
Teoria 5 I semestre Gloria Menegaz

Vai all'orario delle lezioni

Laboratorio 1 I semestre Gloria Menegaz

Vai all'orario delle lezioni

Obiettivi formativi

Il corso si propone di fornire le competenze relative all'analisi, alla modellazione e all'interpretazione di immagini e segnali multidimensionali con enfasi sugli aspetti relativi alla visione artificiale e ai fini sia dell'applicazione di tecniche di intelligenza artificiale a problemi tipici in ambito multimediale sia dell'interpretazione dei relativi risultati. Al termine dell'insegnamento lo/la studente sarà in grado analizzare e di risolvere in autonomia problemi tipici relativi alla modellazione di diverse tipologie di segnali (oltre alle immagini, sequenze video, dati volumetrici, etc.), all'estrazione di feature, alla comprensione e all'analisi della performance di algoritmi di apprendimento automatico orientati alla visione artificiale in ambito multimediale.

Programma

Il corso si compone di tre blocchi: modellazione del sistema visivo umano (HVS), rappresentazione dei segnali mediante analisi multirisoluzione e analisi degli algoritmi di deep learning implementati mediante reti convoluzionali (CNN).

Parte 1: Sistema Visivo Umano (HVS) – 10 ore
Introduzione all’Intelligenza visuale
Fondamenti di visione, codifica, rappresentazione e interpretazione dello stimolo visivo, modellazione del sistema visivo (elaborazione multiscala del segnale visivo, funzione di sensibilità al contrasto (CSF), codifica, rappresentazione e percezione del colore (CMF)
Modellazione ad alto livello del HVS: connettività strutturale e funzionale e relativa modellazione mediante grafi

Parte 2: Analisi multirisoluzione – 20 ore
Background
Richiami e acquisizione di strumenti matematici
Rivisitazione della trasformata di Fourier in 1D e in 2D
Trasformata di Fourier a finestra (Windowed Fourier Transform)
Wavelets e rappresentazioni multirisoluzione
Basi wavelet
Famiglie di trasformate multiscala e loro proprietà
Implementazione veloce della trasformata wavelet discreta (DWT)
Trasformata wavelet discreta in 2D
Scattering transform

Parte 3: Applicazione all’interpretazione del comportamento delle reti convoluzionali profonde (CNN) – 10 ore
Richiami di CNN
Il problema dell'interpretabilità, principali soluzioni proposte
Reti convoluzionali, HVS e analisi multirisoluzione: verso l'integrazione
Interpretazione delle reti CNN alla luce della teoria della multirisoluzione e del modello del HVS

Esempi di applicazione nel contesto dell’interpretable deep learning

LABORATORIO
Le sessioni di laboratorio consisteranno in esercitazioni da svolgere in Matlab e Python relative agli argomenti trattati nel corso.

Modalità d'esame

L'esame consisterà in un progetto e in un colloquio sui temi trattati nel corso.

Testi di riferimento
Attività Autore Titolo Casa editrice Anno ISBN Note
Teoria Stephane Mallat A Wavelet Tour of Signal Processing (Edizione 2) Academic Press 1999 9780124666061
Teoria Brian A. Wandell Foundations of Vision Sinauer Associates Inc 1995 0878938532