Cigdem Beyan

Foto Cigdem,  1 marzo 2024
Qualifica
Professore associato
Settore disciplinare
INFO-01/A - Informatica
Settore di Ricerca (ERC-2024)
PE6_7 - Artificial intelligence, intelligent systems, natural language processing

PE6_8 - Computer graphics, computer vision, multimedia, computer games

PE6_11 - Machine learning, statistical data processing and applications using signal processing (e.g. speech, image, video)

Ufficio
Ca' Vignal 2,  Piano 1,  Stanza 87
Telefono
+39 045 802 7973
E-mail
cigdem|beyan*univr|it <== Sostituire il carattere | con . e il carattere * con @ per avere indirizzo email corretto.
Pagina Web personale
https://cbeyan.github.io/

Orario di ricevimento

Martedì, ore 11.00 - 12.30, Ca' Vignal 2, piano 1, stanza 1.87
Si consiglia comunque di concordare sempre l'orario con il docente via email.
It is suggested to always agree on the date/time with the teacher via email.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

I have several Master's thesis proposals on topics related to computer vision, multimodal data analysis (e.g., audio, text, and video), as well as medical image analysis, including recent approaches based on multimodal/visual-language models. If you are interested, please contact me via email to learn more.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Curriculum

[IT] Gli interessi di ricerca di Cigdem Beyan sono principalmente nei settori della visione artificiale, dell'apprendimento automatico, e dell'informatica sociale e affettiva. Alcuni argomenti recenti includono il pre-addestramento non supervisionato, l'apprendimento multimodale, l'apprendimento attivo, l'adattamento del dominio non supervisionato e l'uso di modelli generativi per compiti discriminativi applicati par esempio al rilevamento dell'obiettivo dello sguardo, il rilevamento delle anomalie, il riconoscimento multimodale delle emozioni e l'analisi delle interazioni sociali. Pubblica regolarmente in riviste e conferenze di alto livello nei campi della visione artificiale, del multimedia e dell'informatica sociale/affettiva. Inoltre, è Area Chair in questi settori. È coinvolta nell'organizzazione di conferenze nei settori della visione artificiale, della robotica sociale, dell'interazione uomo-computer.

[ENG] Cigdem Beyan’s research interests are mainly in the areas of computer vision, machine learning, and social, and affective computing. Some topics she has recently been engaged with include unsupervised pre-training, multimodal learning, active learning, unsupervised domain adaptation, and the usage of generative models for discriminative tasks applied to various applications such as gaze target detection, anomaly detection, (multimodal) affect recognition and social interaction analysis. She regularly publishes in top-tier journals and conferences in computer vision, multimedia, and social/affective computing. She also serves as an area chair in these fields. Additionally, she has been actively involved in organizing conferences in the areas of computer vision, social robotics, human-computer interaction, and biometrics.

Insegnamenti

Insegnamenti attivi nel periodo selezionato: 7.
Clicca sull'insegnamento per vedere orari e dettagli del corso.

Corso Nome Crediti totali Online Crediti del docente Moduli svolti da questo docente
Laurea magistrale in Artificial Intelligence [LM-18] HCI – Intelligent Interfaces (2024/2025)   6  eLearning (Theory)
Laurea magistrale in Artificial Intelligence [LM-18] Machine Learning & Deep Learning (2024/2025)   12    (Deep Learning - Teoria)
(Foundation of Machine Learning - Teoria)
(Foundation of Machine Learning - Laboratorio)
Laurea magistrale in Artificial Intelligence [LM-18] Reinforcement learning and Advanced programming for AI (2024/2025)   12  eLearning (Advanced programming for AI)
Laurea magistrale in Computer Engineering for Robotics and Smart Industry Machine learning & artificial intelligence (2023/2024)   9  eLearning (Teoria)
Dottorato in Informatica Multimodal Learning and Applications (2023/2024)   5   

Di seguito sono elencati gli eventi e gli insegnamenti di Terza Missione collegati al docente:

  • Eventi di Terza Missione: eventi di Public Engagement e Formazione Continua.
  • Insegnamenti di Terza Missione: insegnamenti che fanno parte di Corsi di Studio come Corsi di formazione continua, Corsi di perfezionamento e aggiornamento professionale, Corsi di perfezionamento, Master e Scuole di specializzazione.

Gruppi di ricerca

Visione, Immagini, Pattern e Segnali (VIPS)
Le attività del gruppo VIPS sono rivolte all’analisi, al riconoscimento, alla modellazione e alla predizione di pattern e segnali multidimensionali e multimediali mediante metodi di intelligenza artificiale e apprendimento automatico. Le competenze specifiche e i domini applicativi riguardano: elaborazione delle immagini, visione artificiale, riconoscimento di pattern, interazione uomo-macchina, grafica al calcolatore e modellazione digitale, realtà virtuale e mista, gaming e all’analisi e modellazione di dati in ambito biomedicale e delle neuroscienze a fini di ricerca di base e traslazionale.
Competenze
Argomento Descrizione Area di ricerca
Active learning Nell'apprendimento attivo, il modello interroga iterativamente un oracolo (tipicamente un annotatore umano) per etichettare solo i punti dati più informativi che contribuiscono maggiormente a migliorare l'accuratezza del modello. In questo modo, l'apprendimento attivo riduce il costo dell'etichettatura e accelera il processo di apprendimento del modello. Questo approccio è particolarmente utile quando i dati etichettati sono scarsi o costosi da ottenere. La ricerca si concentra sullo sviluppo di criteri di selezione efficaci per identificare i punti dati più informativi da etichettare, migliorando così l'efficienza del processo di apprendimento attivo. Intelligenza Artificiale
Machine learning
Adattamento/generalizzazione del dominio Si riferisce a tecniche di apprendimento automatico che mirano a migliorare le prestazioni dei modelli quando applicati a nuovi domini o ambienti non visti. L'adattamento del dominio si concentra sul trasferimento delle conoscenze apprese da un dominio di origine (con abbondanti dati etichettati) a un dominio di destinazione (con dati etichettati limitati o assenti), superando le differenze distributive tra i due. D'altra parte, la generalizzazione del dominio mira a sviluppare modelli che possano generalizzare attraverso più domini, rendendoli robusti alle variazioni senza la necessità di riaddestrarli su ciascun dominio specifico. Questi approcci sono particolarmente importanti nelle applicazioni del mondo reale, dove i modelli devono funzionare in modo affidabile su set di dati diversificati e in evoluzione. Intelligenza Artificiale
Machine learning
Apprendimento multimodale Mira a integrare e analizzare dati provenienti da più fonti o modalità, come immagini, testo, audio e video, per migliorare le prestazioni e la comprensione dei modelli di apprendimento automatico. Combinando informazioni provenienti da diversi tipi di dati, l'apprendimento multimodale consente ai sistemi di catturare meglio la ricchezza e la complessità delle informazioni del mondo reale. Questo campo include sfide come la traduzione tra modalità, l'allineamento, la fusione, la rappresentazione efficace e altro. In questa area rientrano anche i modelli multimodali/visivi come CLIP, che collega testo e immagini, DALL-E, che genera immagini a partire da testo, BLIP, progettato per la didascalia delle immagini e per rispondere a domande visive, e modelli di linguaggio di grandi dimensioni come GPT-4 e LLaMA, che si estendono a funzioni multimodali per compiti come la generazione di immagini a partire dal testo. Intelligenza Artificiale
Machine learning
Apprendimento multi-task Un paradigma in cui un modello viene addestrato per risolvere simultaneamente più compiti correlati, condividendo conoscenze e rappresentazioni tra i compiti per migliorare le prestazioni complessive. Invece di addestrare modelli separati per ciascun compito, l'apprendimento multi-task sfrutta caratteristiche e parametri condivisi, permettendo al modello di apprendere rappresentazioni generalizzate che avvantaggiano tutti i compiti coinvolti. La ricerca in questo campo si concentra sul miglioramento della priorizzazione dei compiti, sull'equilibrio dell'importanza dei compiti, sulla progettazione di architetture più efficienti e sulla gestione del trasferimento negativo di conoscenza, in cui l'apprendimento di un compito danneggia le prestazioni degli altri. Inoltre, l'esplorazione di metodi per il peso dei compiti, per strati condivisi e specifici per il compito, e per tecniche di transfer learning è attivamente indagata per migliorare la versatilità e la scalabilità dei modelli multi-task. Intelligenza Artificiale
Machine learning
Apprendimento non supervisionato È un approccio in cui i modelli vengono addestrati su dati non etichettati, con l'obiettivo di identificare schemi o strutture nascoste all'interno dei dati senza etichette predefinite. Viene comunemente utilizzato per compiti come il clustering, la riduzione della dimensionalità dei dati e il rilevamento delle anomalie. La ricerca aperta nell'apprendimento non supervisionato si concentra sul miglioramento della capacità di scoprire strutture significative in insiemi di dati complessi e ad alta dimensione, spesso con conoscenze preliminari limitate. Le sfide principali includono lo sviluppo di algoritmi di clustering più efficaci, il miglioramento dell'interpretabilità dei modelli che scoprono strutture latenti e la gestione di alti livelli di rumore o scarsità nei dati. Inoltre, sono in corso lavori per colmare il divario tra l'apprendimento non supervisionato e altri paradigmi, come l'apprendimento semi-supervisionato, auto-supervisionato e per contrasto, e per migliorare la robustezza dei modelli non supervisionati nelle applicazioni reali. Intelligenza Artificiale
Machine learning
Apprendimento semi-supervisionato Combina una piccola quantità di dati etichettati con una grande quantità di dati non etichettati durante l'addestramento. L'obiettivo è sfruttare l'abbondante disponibilità di dati non etichettati per migliorare il processo di apprendimento, utilizzando i dati etichettati limitati per guidare la comprensione del modello del compito. Questo approccio è particolarmente utile in scenari in cui etichettare i dati è costoso o richiede molto tempo, ma è disponibile un ampio insieme di dati non etichettati. Intelligenza Artificiale
Machine learning
Apprendimento supervisionato È un approccio in cui i modelli vengono addestrati su dati etichettati per apprendere una mappatura dagli input agli output, consentendo loro di prevedere etichette corrette per nuovi dati non visti. Sebbene sia ampiamente utilizzato per compiti come classificazione, regressione e predizione di serie temporali, la ricerca attuale in questo campo affronta diverse sfide. Tra le questioni principali, si annoverano come rendere i modelli più robusti al rumore e alle incongruenze delle etichette, migliorare l’efficienza dei campioni per ridurre la necessità di grandi set di dati etichettati e abilitare un "trasferimento" di conoscenza (transfer learning) efficace tra compiti e domini diversi con dati etichettati limitati. Inoltre, affrontare problematiche di equità e bias nei modelli supervisionati, così come migliorare la scalabilità per gestire grandi set di dati senza compromettere le prestazioni, oltre che approcci basati su attenzione/transformer restano aree di ricerca attive. Intelligenza Artificiale
Machine learning
Biometria Avanzamento del riconoscimento facciale, delle impronte digitali e dell'iride, nonché dell'analisi della camminata, della biometria vocale e dei sistemi biometrici multimodali. Si occupa anche delle questioni relative alla privacy e all'etica nelle applicazioni biometriche. Intelligenza Artificiale
Computer vision
Deep learning Si focalizza sull'addestramento di reti neurali profonde, ovvero con numerosi strati, per apprendere automaticamente pattern e rappresentazioni da grandi quantità di dati. Utilizzando architetture come le reti neurali convoluzionali (CNN) per le immagini, le reti neurali ricorrenti (RNN) per i dati sequenziali e i transformer per compiti diversi, l'apprendimento profondo eccelle in compiti complessi come il riconoscimento delle immagini, l'elaborazione del linguaggio naturale, il riconoscimento vocale, il reinforcement learning, la predizione di serie temporali e la guida autonoma. Intelligenza Artificiale
Machine learning
Elaborazione delle immagini mediche Sviluppare tecniche per elaborare e interpretare immagini mediche, inclusi quelle provenienti da modalità come raggi X, TAC, risonanze magnetiche e campioni di istopatologia. Le applicazioni includono la diagnosi di malattie, la segmentazione dei tessuti, il riconoscimento degli organi, la rilevazione di anomalie e il monitoraggio dei trattamenti farmacologici. Sfruttando il deep learning e l'elaborazione avanzata delle immagini, la visione artificiale medica migliora la precisione diagnostica, supporta trattamenti personalizzati e consente approfondimenti in tempo reale nei contesti sanitari. Intelligenza Artificiale
Computer vision
Informatica affettiva Si concentra sulla progettazione di sistemi in grado di rilevare, interpretare e rispondere agli stati interni umani, tra cui emozioni, umori, motivazioni e stati cognitivi, nonché segnali sottili come stress, livelli di attenzione e coinvolgimento, utilizzando input da espressioni facciali, tono della voce, segnali fisiologici e comportamenti contestuali (verbali e non). L'obiettivo dell'informatica affettiva è permettere alla tecnologia di interagire in modo più naturale ed empatico, adattando le risposte in base allo stato interiore dell'utente per migliorare l'esperienza e il coinvolgimento dell'utente. Intelligenza Artificiale
Human computer interaction (HCI)
Intelligenza Artificiale Sociale Sviluppare sistemi di intelligenza artificiale in grado di percepire, interpretare e rispondere ai comportamenti sociali e alle interazioni umane. Questo campo combina conoscenze provenienti dalla visione artificiale, dai multimedia, dalla psicologia, dalla linguistica e dall'apprendimento automatico per consentire alle macchine di comprendere i segnali sociali, come espressioni facciali, gesti, sguardi, intonazione vocale e linguaggio (non verbale) del corpo. L'obiettivo è creare sistemi capaci di intraprendere interazioni socialmente consapevoli, riconoscere le intenzioni umane e le dinamiche sociali e adattare le risposte di conseguenza. Intelligenza Artificiale
Human computer interaction (HCI)
Riconoscimento e comprensione delle attività Riconoscere e comprendere attività ed azioni individuali e di gruppo, inclusi il tracciamento dello sguardo, l'analisi delle espressioni facciali e l'analisi delle interazioni tra esseri umani e oggetti e sociali, con applicazioni in sanità, assistenza domiciliare e sicurezza pubblica. Intelligenza Artificiale
Computer vision
Sorveglianza e monitoraggio video Rilevare anomalie nei filmati di sorveglianza, identificare eventi e generare allarmi, tracciare oggetti e analizzare i movimenti. Ha applicazioni nelle smart city, nei trasporti e nei contesti commerciali. Intelligenza Artificiale
Computer vision
Progetti
Titolo Data inizio
TRANSFER AND ADAPTIVE LEARNING IN IMPERFECT MULTIMODAL DATA SCENARIOS - TALIM 01/05/24




Organizzazione

Strutture del dipartimento

Condividi