Sviluppo di un sistema automatizzato per la gestione del flusso di dati da OMOP a REDCap

La tesi consiste nella progettazione e nello sviluppo di un framework software per il trasferimento automatico di dati clinici da un database conforme a OMOP Common Data Model ad un progetto REDCap. Il sistema è concepito per supportare studi osservazionali e attività di ricerca clinica, garantendo l’interoperabilità semantica e riducendo l’inserimento manuale dei dati al fine di migliorarne la qualità e la tracciabilità nel tempo. Il flusso dei dati ha origine nel database OMOP, sorgente primaria dei dati clinici, organizzati secondo un modello paziente-centrico e normalizzati tramite vocabolari standard condivisi. L’accesso a OMOP è gestito da uno strato applicativo sviluppato in Java che utilizza Hibernate, come framework di Object-Relational Mapping per mappare le tabelle del database in entità Java tipizzate, e query SQL per accedere ai dati e filtrarli. L’estrazione dei dati è governata da file di configurazione in formato JSON che definiscono le regole di corrispondenza tra le variabili di OMOP e quelle dello studio REDCap. Ogni file specifica il dominio OMOP di riferimento, i concetti clinici da interrogare, i filtri temporali da applicare e i criteri di selezione dei record, come la scelta del valore più recente o più rilevante in presenza di più osservazioni. Le logiche di interrogazione del database OMOP e di estrazione delle variabili REDCap sono state incapsulate in utility software dedicate, sviluppate come progetti indipendenti. In particolare, l’Utility REDCap utilizza API REST ufficiali e gestisce l’autenticazione tramite token, le chiamate di export per il recupero di informazioni di contesto (come date di visita o identificativi di record) e le chiamate di import per la scrittura automatica dei dati nei form REDCap. Questo approccio consente di isolare completamente la logica di accesso ai dati clinici dal resto dell’applicazione. Una volta estratti, i dati vengono trasformati secondo le regole specificate nel file di configurazione. Le trasformazioni possono riguardare la conversione dei formati numerici, la rappresentazione delle date, la gestione di variabili categoriali e la traduzione di codici standard OMOP in valori compatibili con le variabili definite nello studio REDCap. Tale fase è fondamentale per adattare dati clinici standardizzati a un contesto di raccolta dati specifico per la ricerca. L’intero processo viene eseguito in modo iterativo per ciascun paziente, mediante l’utilizzo di una lookup table che associa gli identificativi dei record REDCap agli identificativi dei pazienti nel database OMOP. Per ogni paziente, il sistema esegue iterativamente le fasi di recupero degli input, estrazione dei dati, trasformazione e scrittura finale in REDCap

Sviluppo di un sistema automatizzato per la gestione del flusso di dati da OMOP a REDCap

GERACI, ELEONORA

2024/2025

Abstract

La tesi consiste nella progettazione e nello sviluppo di un framework software per il trasferimento automatico di dati clinici da un database conforme a OMOP Common Data Model ad un progetto REDCap. Il sistema è concepito per supportare studi osservazionali e attività di ricerca clinica, garantendo l’interoperabilità semantica e riducendo l’inserimento manuale dei dati al fine di migliorarne la qualità e la tracciabilità nel tempo. Il flusso dei dati ha origine nel database OMOP, sorgente primaria dei dati clinici, organizzati secondo un modello paziente-centrico e normalizzati tramite vocabolari standard condivisi. L’accesso a OMOP è gestito da uno strato applicativo sviluppato in Java che utilizza Hibernate, come framework di Object-Relational Mapping per mappare le tabelle del database in entità Java tipizzate, e query SQL per accedere ai dati e filtrarli. L’estrazione dei dati è governata da file di configurazione in formato JSON che definiscono le regole di corrispondenza tra le variabili di OMOP e quelle dello studio REDCap. Ogni file specifica il dominio OMOP di riferimento, i concetti clinici da interrogare, i filtri temporali da applicare e i criteri di selezione dei record, come la scelta del valore più recente o più rilevante in presenza di più osservazioni. Le logiche di interrogazione del database OMOP e di estrazione delle variabili REDCap sono state incapsulate in utility software dedicate, sviluppate come progetti indipendenti. In particolare, l’Utility REDCap utilizza API REST ufficiali e gestisce l’autenticazione tramite token, le chiamate di export per il recupero di informazioni di contesto (come date di visita o identificativi di record) e le chiamate di import per la scrittura automatica dei dati nei form REDCap. Questo approccio consente di isolare completamente la logica di accesso ai dati clinici dal resto dell’applicazione. Una volta estratti, i dati vengono trasformati secondo le regole specificate nel file di configurazione. Le trasformazioni possono riguardare la conversione dei formati numerici, la rappresentazione delle date, la gestione di variabili categoriali e la traduzione di codici standard OMOP in valori compatibili con le variabili definite nello studio REDCap. Tale fase è fondamentale per adattare dati clinici standardizzati a un contesto di raccolta dati specifico per la ricerca. L’intero processo viene eseguito in modo iterativo per ciascun paziente, mediante l’utilizzo di una lookup table che associa gli identificativi dei record REDCap agli identificativi dei pazienti nel database OMOP. Per ogni paziente, il sistema esegue iterativamente le fasi di recupero degli input, estrazione dei dati, trasformazione e scrittura finale in REDCap

Scheda

Scheda DC

	Facoltà/Dipartimento
	
				DIPARTIMENTO DI INGEGNERIA INDUSTRIALE E DELL'INFORMAZIONE
			
	Corso di studio
	
				BIOINGEGNERIA [42400]
			
	Anno Accademico
	
				2024
			
	Titolo inglese
	
				Development of an automated system for data flow management from OMOP to REDCap
			
	Relatore
	
				LARIZZA, CRISTIANA
			
	Correlatore
	
				GABETTA, MATTEO
			
	Appare nelle tipologie:
	
				Lauree Magistrali

File in questo prodotto:

File	Dimensione	Formato
tesi_Geraci.pdf accesso aperto Dimensione 5.27 MB Formato Adobe PDF Visualizza/Apri	5.27 MB	Adobe PDF	Visualizza/Apri

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: [email protected].

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/35061