Framework di Deep Learning per la Generazione di Grafica Vettoriale mediante Stable Diffusion

Vector graphics are a critical component of digital design, offering scalability and resolution independence that make them indispensable in many applications. However, generating high-quality vector graphics is a challenge because of their dependence on geometric primitives and complex topologies, unlike raster graphics, which are easier to produce with modern AI models. This thesis explores advanced techniques for vector graphic generation by using generative and vectorization models. The research begins with an investigation of DeepSVG, a hierarchical generative model for creating scalable vector graphics, revealing its potential and limitations. Following this, DiffVG is explored for vectorization and optimization, demonstrating its capabilities to refine and adapt vector images. To overcome the challenges of direct vector generation, a diffusion model has been fine-tuned on raster logo datasets, enabling the creation of raster images from text prompts. These raster outputs are subsequently vectorized using VTracer. The final aim of this work is the development of a prototype user interface that can generate vector graphics based on user-provided prompts. This thesis aims to bridge the gap between raster and vector graphic generation, presenting a unified pipeline for scalable and efficient design workflows and opening new opportunities for progress in the field.

La grafica vettoriale è una componente fondamentale della progettazione digitale, offrendo scalabilità e indipendenza dalla risoluzione che la rendono indispensabile in molte applicazioni. Tuttavia, generare grafica vettoriale di alta qualità è una sfida a causa della sua dipendenza da primitive geometriche e topologie complesse, a differenza della grafica raster, che è più facile da produrre con i moderni modelli di intelligenza artificiale. Questa tesi esplora tecniche avanzate per la generazione di grafica vettoriale utilizzando modelli generativi e di vettorizzazione. La ricerca inizia con un'indagine su DeepSVG, un modello generativo gerarchico per la creazione di grafica vettoriale scalabile, rivelandone il potenziale e i limiti. In seguito, DiffVG viene esplorato per la vettorizzazione e l'ottimizzazione, dimostrando le sue capacità di perfezionare e adattare le immagini vettoriali. Per superare le sfide della generazione diretta di vettori, è stato messo a punto un modello di diffusione su set di dati di logo raster, consentendo la creazione di immagini raster da prompt di testo. Questi output raster vengono successivamente vettorializzati utilizzando VTracer. L'obiettivo finale di questo lavoro è lo sviluppo di un prototipo di interfaccia in grado di generare grafica vettoriale in base ai prompt forniti dall'utente. Questa tesi mira a colmare il divario tra la generazione di grafica raster e vettoriale, presentando una pipeline unificata per flussi di lavoro di progettazione scalabili ed efficienti e aprendo nuove opportunità di progresso in questo campo.