Modelli di diffusione probabilistici applicati al miglioramento delle immagini in condizioni di scarsa illuminazione

This thesis addresses low-light image enhancement (LLIE), an important research area with several applications in different domains. In fact, when light is scarce, the built-in noise of the camera sensor is amplified, producing a low-quality image with severe noise and buried details. This degradation negatively impacts feature extraction, which is crucial for computer vision's effectiveness. For this reason, many computer vision applications such as object detection, video surveillance and object tracking rely on enhancing low-light images to improve the overall performance. Artificial Neural Networks (ANNs) have become an hot topic of research with applications in diverse fields such as computer vision, natural language processing, image generation and so on. Among recent advancements, a generative model known as the Diffusion Denoising Probabilistic Model (DDPM) has gained popularity for its exceptional performance in image generation. DDPMs are based in two processes: forward, during which noise is applied, and reverse, which employs neural networks to estimate the amount of noise added in the forward process. In particular, this thesis introduces a new supervised approach to address low-light image enhancement using Diffusion Denoising Probabilistic Model. This method allows to estimate the distribution of normal-light images, enabling sampling from that distribution to enhance low-light images effectively. The work is organized in three chapters. \\ The first chapter provides an introduction to the problem. First, an overview of Artificial Neural Networks and their main architectures is presented. Then, the focus is posed on the formulation of Diffusion Denoising Probabilistic Models. Finally, the second major ingredient, that is Low-Light Image Enhancement problem, is introduced highlighting its importance and challenges. In the second chapter, the results obtained with the experiments are presented. First, the work environment is introduced, by discussing the tools used, and the conditioning approach is presented. In the second section the model is applied to small images of size $32 \times 32$, so that it it is possible to understand the effectiveness of the approach with a more manageable amount of parameters. Then, the experiments are repeated on larger images of size $128\times 128$. Finally, all the experiments are discussed and compared. The last chapter summarizes conclusions of the work and future explorations to enhance the model's behavior.

Questa tesi tratta il problema di miglioramento di immagini in condizioni di scarsa luminosità (LLIE). Esso rappresenta un'importante area di ricerca con numerose applicazioni in ambiti differenti. Infatti, quando la luce è scarsa, il rumore intrinseco del sensore della fotocamera viene amplificato, producendo immagini a bassa qualità con molto rumore e dettagli sfocati. QUesta degrazione impatta negativamente l'estrazione di features dalle immagini, elemento cruciale per l'efficacia nell'ambito di \textit{computer vision}. Per questa ragione, molte applicazioni di \textit{computer vision} come rilevamento di oggetti, video sorveglianza e tracciamento di oggetti si basano sul miglioramento di immagini a bassa luminosità in modo da garantire un miglioramento delle performance. Nell'ultimo periodo, le reti neurali artificiali (ANNs) sono diventati un ambito di ricerca di grande interesse con applicazioni in molti ambiti come \textit{computer vision}, \textit{natural language processing}, generazione di immagini, suoni e video. Tra i più recenti avanzamenti, il modello generativo noto come \textit{Denoising Diffusion Probabilistic Model} (DDPM) ha riscosso molto successo per le sue eccellenti performance nella generazione di immagini. Esso si basa su due processi: \textit{forward}, durante il quale viene gradualmente aggiunto del rumore, e \textit{reverse}, il quale utilizza una rete neurale per stimare la quantità di rumore aggiunta nel primo processo. In particolare, questa tesi introduce un nuovo approccio \textit{supervised} per risolvere il problema del miglioramento di immagini in condizioni di scarsa luminosità utilizzando i \textit{Denoising Diffusion Probabilistic Model}. Questo metodo amibisce a stimare la distribuzione di immagini in condizione di luce ottimali e permettendone così, data un'immagine a bassa luminosità, il campionamento della versione migliorata. Il lavoro è organizzato in tre capitoli. Il primo capitolo fornisce un'introduzione al problema. Innazitutto, viene presentata una panoramica sulle reti neurali e le più importanti architetture. Dopodiché, il focus si sposta sulla formulazione dei \textit{Denoising Diffusion Probabilistic Models}. Infine, viene introdotto il problema del miglioramento delle immagini in condizioni di scarsa illuminazione, sottolineandone l'importanza e le maggiori difficoltà. Il secondo capitolo presenta i risultati degli esperimenti. Esso inizia con un'introduzione all'ambiente di lavoro, discutendo degli strumenti utilizzati, dell'approccio condizionato dei DDPM e la relativa applicazione al metodo sviluppato in questo elaborato. La sezione successiva è dedicat agli esperimenti effettuati su immagini di dimensione $32 \times 32$ in modo da comprendere l'efficacia dell'approccio e le migliori configurazioni con un numero di parametri più maneggevole. Dopodiché, le migliori configurazioni sono sperimentate su immagini a dimensione $128\times 128$. Infine, è presentata una discussione di tutti gli esperimenti effettuati. Il capitolo conclusivo raccoglie le considerazioni finali sul lavoro compiute e ne presenta future esplorazioni.