Le tecnologie di intelligenza artificiale (IA) stanno diventando sempre più disponibili in ambito sanitario, aprendo nuove possibilità per la ricerca, l’istruzione e gli interventi comportamentali a lungo termine. Nonostante ciò, le risorse formative specializzate sono poche e la comprensione di concetti come la generazione di dati sintetici e la sua relazione con l’aderenza al trattamento è ancora limitata. Questa tesi presenta la progettazione, lo sviluppo e la validazione di un chatbot formativo basato sull’IA per migliorare la comprensione della generazione di dati sintetici in ambito sanitario, con particolare attenzione all’aderenza al trattamento. Il progetto si è articolato in quattro obiettivi. In primo luogo, è stata condotta una scoping review seguendo la metodologia PRISMA in tre domini della letteratura (generazione di dati sintetici, chatbot sanitari e aderenza al trattamento) per mappare il panorama attuale e individuare le lacune nella ricerca. In secondo luogo, uno studio di elicitazione dei requisiti ha prodotto 20 requisiti formalizzati per i chatbot sanitari, in conformità con la norma ISO/IEC/IEEE 29148:2018 e prioritizzati mediante il metodo MoSCoW. Tali requisiti sono stati integrati da un’analisi degli stakeholder secondo il modello Quintuple Helix. In terzo luogo, è stata progettata e implementata in Python un’architettura avanzata di Retrieval-Augmented Generation (RAG) per il chatbot, che combina una knowledge base multi-dominio di 21 articoli peer-reviewed con una pipeline di retrieval ibrida (ricerca sparsa BM25 e ricerca vettoriale densa BAAI/bge-m3), Reciprocal Rank Fusion, reranking tramite cross-encoder, validazione dell’output strutturato tramite Pydantic, supporto multilingue e un sistema di guardrails a doppio livello. Il sistema offre un’interfaccia utente basata su Streamlit con livelli adattivi (Principiante, Intermedio, Avanzato) per risposte, citazioni e metadati di confidenza. In quarto luogo, per validare il chatbot sono stati utilizzati una valutazione delle conoscenze pre-test/post-test e la chatBot Usability Scale (BUS-11), somministrate a un campione di utenti target. Il sistema ha ottenuto un punteggio complessivo di usabilità dell’88,4%, classificato come Molto buono secondo i benchmark normativi della BUS-11, e i risultati della validazione hanno mostrato un miglioramento statisticamente significativo delle conoscenze dopo l’interazione con il chatbot (W = 2.0, p = 0.0005, rrb = 0.971, effetto ampio). Questi risultati suggeriscono che i chatbot formativi basati su RAG rappresentano un metodo promettente e realizzabile per fornire formazione sanitaria basata sull’evidenza in modo sicuro e personalizzato.

Progettazione e Sviluppo di un Chatbot Formativo basato sull'Intelligenza Artificiale per i Dati Sintetici e l'Aderenza in sanità

BELVISO, BEATRICE
2024/2025

Abstract

Le tecnologie di intelligenza artificiale (IA) stanno diventando sempre più disponibili in ambito sanitario, aprendo nuove possibilità per la ricerca, l’istruzione e gli interventi comportamentali a lungo termine. Nonostante ciò, le risorse formative specializzate sono poche e la comprensione di concetti come la generazione di dati sintetici e la sua relazione con l’aderenza al trattamento è ancora limitata. Questa tesi presenta la progettazione, lo sviluppo e la validazione di un chatbot formativo basato sull’IA per migliorare la comprensione della generazione di dati sintetici in ambito sanitario, con particolare attenzione all’aderenza al trattamento. Il progetto si è articolato in quattro obiettivi. In primo luogo, è stata condotta una scoping review seguendo la metodologia PRISMA in tre domini della letteratura (generazione di dati sintetici, chatbot sanitari e aderenza al trattamento) per mappare il panorama attuale e individuare le lacune nella ricerca. In secondo luogo, uno studio di elicitazione dei requisiti ha prodotto 20 requisiti formalizzati per i chatbot sanitari, in conformità con la norma ISO/IEC/IEEE 29148:2018 e prioritizzati mediante il metodo MoSCoW. Tali requisiti sono stati integrati da un’analisi degli stakeholder secondo il modello Quintuple Helix. In terzo luogo, è stata progettata e implementata in Python un’architettura avanzata di Retrieval-Augmented Generation (RAG) per il chatbot, che combina una knowledge base multi-dominio di 21 articoli peer-reviewed con una pipeline di retrieval ibrida (ricerca sparsa BM25 e ricerca vettoriale densa BAAI/bge-m3), Reciprocal Rank Fusion, reranking tramite cross-encoder, validazione dell’output strutturato tramite Pydantic, supporto multilingue e un sistema di guardrails a doppio livello. Il sistema offre un’interfaccia utente basata su Streamlit con livelli adattivi (Principiante, Intermedio, Avanzato) per risposte, citazioni e metadati di confidenza. In quarto luogo, per validare il chatbot sono stati utilizzati una valutazione delle conoscenze pre-test/post-test e la chatBot Usability Scale (BUS-11), somministrate a un campione di utenti target. Il sistema ha ottenuto un punteggio complessivo di usabilità dell’88,4%, classificato come Molto buono secondo i benchmark normativi della BUS-11, e i risultati della validazione hanno mostrato un miglioramento statisticamente significativo delle conoscenze dopo l’interazione con il chatbot (W = 2.0, p = 0.0005, rrb = 0.971, effetto ampio). Questi risultati suggeriscono che i chatbot formativi basati su RAG rappresentano un metodo promettente e realizzabile per fornire formazione sanitaria basata sull’evidenza in modo sicuro e personalizzato.
2024
Design and Development of an AI-powered Educational Chatbot for Synthetic Data and Adherence in Healthcare
File in questo prodotto:
File Dimensione Formato  
Master_Thesis_BelvisoB.pdf

embargo fino al 02/11/2026

Dimensione 2.39 MB
Formato Adobe PDF
2.39 MB Adobe PDF   Richiedi una copia

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/35068