La tesi consiste nella progettazione e nello sviluppo di un framework software per il trasferimento automatico di dati clinici da un database conforme a OMOP Common Data Model ad un progetto REDCap. Il sistema è concepito per supportare studi osservazionali e attività di ricerca clinica, garantendo l’interoperabilità semantica e riducendo l’inserimento manuale dei dati al fine di migliorarne la qualità e la tracciabilità nel tempo. Il flusso dei dati ha origine nel database OMOP, sorgente primaria dei dati clinici, organizzati secondo un modello paziente-centrico e normalizzati tramite vocabolari standard condivisi. L’accesso a OMOP è gestito da uno strato applicativo sviluppato in Java che utilizza Hibernate, come framework di Object-Relational Mapping per mappare le tabelle del database in entità Java tipizzate, e query SQL per accedere ai dati e filtrarli. L’estrazione dei dati è governata da file di configurazione in formato JSON che definiscono le regole di corrispondenza tra le variabili di OMOP e quelle dello studio REDCap. Ogni file specifica il dominio OMOP di riferimento, i concetti clinici da interrogare, i filtri temporali da applicare e i criteri di selezione dei record, come la scelta del valore più recente o più rilevante in presenza di più osservazioni. Le logiche di interrogazione del database OMOP e di estrazione delle variabili REDCap sono state incapsulate in utility software dedicate, sviluppate come progetti indipendenti. In particolare, l’Utility REDCap utilizza API REST ufficiali e gestisce l’autenticazione tramite token, le chiamate di export per il recupero di informazioni di contesto (come date di visita o identificativi di record) e le chiamate di import per la scrittura automatica dei dati nei form REDCap. Questo approccio consente di isolare completamente la logica di accesso ai dati clinici dal resto dell’applicazione. Una volta estratti, i dati vengono trasformati secondo le regole specificate nel file di configurazione. Le trasformazioni possono riguardare la conversione dei formati numerici, la rappresentazione delle date, la gestione di variabili categoriali e la traduzione di codici standard OMOP in valori compatibili con le variabili definite nello studio REDCap. Tale fase è fondamentale per adattare dati clinici standardizzati a un contesto di raccolta dati specifico per la ricerca. L’intero processo viene eseguito in modo iterativo per ciascun paziente, mediante l’utilizzo di una lookup table che associa gli identificativi dei record REDCap agli identificativi dei pazienti nel database OMOP. Per ogni paziente, il sistema esegue iterativamente le fasi di recupero degli input, estrazione dei dati, trasformazione e scrittura finale in REDCap
Sviluppo di un sistema automatizzato per la gestione del flusso di dati da OMOP a REDCap
GERACI, ELEONORA
2024/2025
Abstract
La tesi consiste nella progettazione e nello sviluppo di un framework software per il trasferimento automatico di dati clinici da un database conforme a OMOP Common Data Model ad un progetto REDCap. Il sistema è concepito per supportare studi osservazionali e attività di ricerca clinica, garantendo l’interoperabilità semantica e riducendo l’inserimento manuale dei dati al fine di migliorarne la qualità e la tracciabilità nel tempo. Il flusso dei dati ha origine nel database OMOP, sorgente primaria dei dati clinici, organizzati secondo un modello paziente-centrico e normalizzati tramite vocabolari standard condivisi. L’accesso a OMOP è gestito da uno strato applicativo sviluppato in Java che utilizza Hibernate, come framework di Object-Relational Mapping per mappare le tabelle del database in entità Java tipizzate, e query SQL per accedere ai dati e filtrarli. L’estrazione dei dati è governata da file di configurazione in formato JSON che definiscono le regole di corrispondenza tra le variabili di OMOP e quelle dello studio REDCap. Ogni file specifica il dominio OMOP di riferimento, i concetti clinici da interrogare, i filtri temporali da applicare e i criteri di selezione dei record, come la scelta del valore più recente o più rilevante in presenza di più osservazioni. Le logiche di interrogazione del database OMOP e di estrazione delle variabili REDCap sono state incapsulate in utility software dedicate, sviluppate come progetti indipendenti. In particolare, l’Utility REDCap utilizza API REST ufficiali e gestisce l’autenticazione tramite token, le chiamate di export per il recupero di informazioni di contesto (come date di visita o identificativi di record) e le chiamate di import per la scrittura automatica dei dati nei form REDCap. Questo approccio consente di isolare completamente la logica di accesso ai dati clinici dal resto dell’applicazione. Una volta estratti, i dati vengono trasformati secondo le regole specificate nel file di configurazione. Le trasformazioni possono riguardare la conversione dei formati numerici, la rappresentazione delle date, la gestione di variabili categoriali e la traduzione di codici standard OMOP in valori compatibili con le variabili definite nello studio REDCap. Tale fase è fondamentale per adattare dati clinici standardizzati a un contesto di raccolta dati specifico per la ricerca. L’intero processo viene eseguito in modo iterativo per ciascun paziente, mediante l’utilizzo di una lookup table che associa gli identificativi dei record REDCap agli identificativi dei pazienti nel database OMOP. Per ogni paziente, il sistema esegue iterativamente le fasi di recupero degli input, estrazione dei dati, trasformazione e scrittura finale in REDCap| File | Dimensione | Formato | |
|---|---|---|---|
|
tesi_Geraci.pdf
accesso aperto
Dimensione
5.27 MB
Formato
Adobe PDF
|
5.27 MB | Adobe PDF | Visualizza/Apri |
È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: [email protected].
https://hdl.handle.net/20.500.14239/35061