Pubblicazioni

An FPGA-Based Architecture for Binocular Scene Understanding  (2012)

Autori:
Martelli, Samuele
Titolo:
An FPGA-Based Architecture for Binocular Scene Understanding
Anno:
2012
Tipologia prodotto:
Doctoral Thesis
Tipologia ANVUR:
Altro
Lingua:
Inglese
Parole chiave:
Embedded; FPGA; object detection; covariance matrices; Riemannian Manifold
Abstract (italiano):
Classificare automaticamente categorie differenti di oggetti presenti in immagini e video è una delle principali sfide nell'abito della visione computazionale (computer vision). Tra di esse, i pedoni e più in generale gli umani rappresentano la categoria di principale interesse in quanto rappresentano una informazione di estremo interesse in molte applicazioni come la video sorveglianza, in sistemi di navigazione automatica e di controllo in robotica. Nonostante i notevoli sforzi ed i considerevoli progressi in termini di accuratezza e velocità di processamento degli ultimi anni, i sistemi attuali non sono ancora pronti per essere utilizzati in applicazioni commerciali. Inoltre, anche se alcune implementazioni su piattaforme hardware sono state recentemente proposte in letteratura, pochi sistemi per la detezione di oggetti sono stati appositamente sviluppati per essere realizzati su sistemi dedicati. L'obiettivo di questa tesi è quello di sviluppare ed implementare un sistema ottimizzato per piattaforme FPGA che sia capace di raggiungere prestazioni elevate in termini di velocità ed accuratezza in problemi di detezione di oggetti, con particolare attenzione ai pedoni. Una serie di matrici di covarianza, calcolate su segnali eterogenei come derivate di intensità o caratteristiche di tessitura, sono state impiegate per codificare l'apparenza locale degli oggetti di interesse. Le matrici di covarianza permettono di codificare naturalmente le correlazioni tra segnali e garantiscono robustezza in differenti condizioni di luce. Il gran numero di parallelizzazioni offerte dalla architettura computazionale FPGA sono state sfruttate a differenti livelli. Il principale vantaggio è stata la possibilità di parallelizzare l'algoritmo raggiungendo prestazioni elevate, superiori a quelle raggiungibili con architetture seriali. Inoltre in questo lavoro nuove caratteristiche basate su segnali di intensità e profondità sono proposte, appositamente sviluppate per l'architettura FPGA di riferimento. L' approccio binoculare contribuisce a migliorare le prestazioni di tutto il sistema, rivelando l'importanza di avere informazioni sulla geometria della scena, di natura complementare rispetto alla immagine di intensità fornita dalle singole camere. Le prestazioni di detezione sono state valutate sistematicamente utilizzando diverse combinazioni di caratteristiche e classificatori, utilizzando dati pubblicamente disponibili estratti da scene video acquisite in ambienti reali. Gli esperimenti dimostrano che modelli di oggetti modulari, basati su serie di matrici di covarianza, sono capaci di codificare sinteticamente l'informazione proveniente da segnali eterogenei, sono facilmente generalizzabili a differenti categorie di oggetti e sono paricolarmente indicate per essere implementate su architetture parallele dedicate.
Id prodotto:
70562
Handle IRIS:
11562/427537
ultima modifica:
26 ottobre 2022
Citazione bibliografica:
Martelli, Samuele, An FPGA-Based Architecture for Binocular Scene Understanding

Consulta la scheda completa presente nel repository istituzionale della Ricerca di Ateneo IRIS

<<indietro

Attività

Strutture

Condividi