In recent years Artificial Intelligence (AI) and, more specifically, the importance of Natural Language Processing (NLP) has been steadily growing for those businesses seeking to automate and optimize their internal processes. This study aims to develop and test an NLP algorithm designed for the low-code platform eLegere, which is commonly used for the digitization of corporate operations. The purpose of this academic research is to develop a transformer-based module capable of converting natural language queries into structured filter queries, simplifying data access and usability for end users. In this context, the Mistral 7B model (optimized for text generation and processing) will be analyzed and tested. This analysis consists of several phases. The first phase consists of presenting a theoretical framework on AI and NLP to provide a solid foundation for understanding transformer-based machine learning models. The study then focuses on the eLegere platform, analyzing its key features and highlighting the value of NLP in enhancing user interaction mechanisms for managing complex user queries. This integration is achieved through various advanced tools supported by technologies such as Redis, Docker, and RabbitMQ, ensuring efficient and scalable request processing. Focus is put on the creation of optimized templates for the Mistral 7B model. Lastly, system limitations and future developments will be addressed, among others: dataset’s fine tuning approaches to obtain model optimization; improvement of ambiguous queries’ handling; integration of user feedback mechanisms for continued learning. The experimental field of the thesis is a performance analysis of the implemented system, which is to be conducted through qualitative and quantitative tests carried out on queries which will have been elaborated. The findings suggest that the implementation of NLP in corporate processes facilitates data visualization and manipulation for end users while simultaneously streamlining organizational workflows and internal operations.
Negli ultimi anni, l’Intelligenza Artificiale (AI) e, nello specifico, il Natural Language Processing (NLP) hanno acquisito sempre più rilevanza per le aziende che desiderano automatizzare e ottimizzare i propri processi interni. Questo studio si propone di sviluppare e testare un algoritmo NLP progettato per la piattaforma low-code eLegere, comunemente utilizzata per la digitalizzazione delle operazioni aziendali. Lo scopo di questa ricerca accademica è sviluppare un modulo basato su transformer, capace di convertire interrogazioni in linguaggio naturale in query strutturate per filtrare i dati, semplificando così l’accesso e l’usabilità dei dati per gli utenti finali. In questo contesto verrà analizzato e testato il modello Mistral 7B, ottimizzato per la generazione e l’elaborazione del testo. L’analisi si articola in diverse fasi. La prima fase consiste nella presentazione di un quadro teorico sull’AI e sul NLP, al fine di fornire una base solida per comprendere i modelli di machine learning basati su transformer. Successivamente, lo studio si concentra sulla piattaforma eLegere, analizzandone le principali caratteristiche e mettendo in evidenza il valore dell’NLP nel migliorare i meccanismi di interazione con l’utente nella gestione di interrogazioni complesse. Questa integrazione viene realizzata attraverso vari strumenti avanzati supportati da tecnologie come Redis, Docker e RabbitMQ, garantendo un’elaborazione delle richieste efficiente e scalabile. Particolare attenzione è rivolta alla creazione di template ottimizzati per il modello Mistral 7B. Infine, verranno affrontati i limiti del sistema e i possibili sviluppi futuri, tra cui: approcci di fine tuning del dataset per ottimizzare il modello; miglioramento nella gestione delle query ambigue; integrazione di meccanismi di feedback degli utenti per l’apprendimento continuo. Il campo sperimentale della tesi consiste in un’analisi delle performance del sistema implementato, che verrà condotta tramite test qualitativi e quantitativi su interrogazioni appositamente elaborate. I risultati suggeriscono che l’implementazione del NLP nei processi aziendali facilita la visualizzazione e la manipolazione dei dati da parte degli utenti finali, semplificando al contempo i flussi di lavoro organizzativi e le operazioni interne.
Studio di Algoritmi per il Natural Language Processing mirati all'efficientamento dei processi aziendali
DE LEO, GIOVANNI
2023/2024
Abstract
In recent years Artificial Intelligence (AI) and, more specifically, the importance of Natural Language Processing (NLP) has been steadily growing for those businesses seeking to automate and optimize their internal processes. This study aims to develop and test an NLP algorithm designed for the low-code platform eLegere, which is commonly used for the digitization of corporate operations. The purpose of this academic research is to develop a transformer-based module capable of converting natural language queries into structured filter queries, simplifying data access and usability for end users. In this context, the Mistral 7B model (optimized for text generation and processing) will be analyzed and tested. This analysis consists of several phases. The first phase consists of presenting a theoretical framework on AI and NLP to provide a solid foundation for understanding transformer-based machine learning models. The study then focuses on the eLegere platform, analyzing its key features and highlighting the value of NLP in enhancing user interaction mechanisms for managing complex user queries. This integration is achieved through various advanced tools supported by technologies such as Redis, Docker, and RabbitMQ, ensuring efficient and scalable request processing. Focus is put on the creation of optimized templates for the Mistral 7B model. Lastly, system limitations and future developments will be addressed, among others: dataset’s fine tuning approaches to obtain model optimization; improvement of ambiguous queries’ handling; integration of user feedback mechanisms for continued learning. The experimental field of the thesis is a performance analysis of the implemented system, which is to be conducted through qualitative and quantitative tests carried out on queries which will have been elaborated. The findings suggest that the implementation of NLP in corporate processes facilitates data visualization and manipulation for end users while simultaneously streamlining organizational workflows and internal operations.File | Dimensione | Formato | |
---|---|---|---|
Tesi_Giovanni_de_LEO.pdf
accesso aperto
Descrizione: Tesi di laurea Magistrale in Matematica di Giovanni de LEO
Dimensione
2.11 MB
Formato
Adobe PDF
|
2.11 MB | Adobe PDF | Visualizza/Apri |
È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/28784