L’elaborato si inserisce nell’ambito dell’analisi di Process Mining applicata al contesto healthcare ed ha come principale obiettivo quello di fornire un supporto negli step della pipeline computazionale dell’analisi di processi clinici. Il Process Mining è una disciplina che nasce dall’esigenza di trovare una connessione tra le discipline di Machine Learning e Data Mining da un lato e l’analisi dei processi dall’altro. L’idea del Process Mining è quella di scoprire, monitorare e migliorare processi a partire da dati raccolti in contesti pratici, che permettono di generare log di eventi consecutivi (Event Log). La computational pipeline che si applica in analisi di questo tipo è composta essenzialmente da tre fasi: (i) Preprocessing dei dati estratti in forma di Event Log, (ii) Analisi Descrittiva degli Eventi, (iii) Process Discovery. Il focus del lavoro è stato quello di sviluppare uno strumento software che andasse ad inserirsi in ciascuna di queste fasi, presentandosi come un mezzo pratico e di supporto alle analisi di Process Mining. È stata realizzata una Software suite, sviluppata nell’ambiente di programmazione di R e implementata come cruscotto interattivo attraverso i tool di Shiny Dashboard, articolata in tre moduli, corrispondenti agli step sopra elencati. Il Modulo di Enrichment si inserisce nell’ambito del preprocessing e si occupa dell’integrazione di dati eterogenei, attraverso l’applicazione di un processo che, dati in input un Event Log e almeno un data set ancillare (di informazioni aggiuntive), riesce a restituire in output un nuovo Event Log, le cui dimensioni possono essere estese grazie alla combinazione delle informazioni originali (dell’Event Log di partenza) e quelle aggiuntive derivate dai file ancillari. Il Modulo Descrittivo si occupa dell’analisi descrittiva e ha come obbiettivo quello di fornire all’utente diverse tecniche di visualizzazione per l’analisi della distribuzione e della co-occorrenza degli eventi e per l’analisi e la distribuzione degli eventi nei percorsi dei singoli pazienti. Il Modulo di Careflow Mining è dedicato al process discovery. Infatti, attraverso l’algoritmo di careflow mining vengono estratti e mostrati i percorsi principali seguiti pazienti durante il processo di cura. Questo modulo include inoltre la possibilità di effettuare analisi predittive (probabilità di sperimentare un preciso evento futuro dato l’evento presente) e inferenziali. Nella parte finale dell’elaborato è presentato un caso d’uso, dato dall’applicazione della software suite per l’analisi dei processi di cura di soggetti affetti da COVID-19. Le funzionalità della dashbaord sono state utilizzate per l’analisi di dati eterogenei (ricoveri e trasferimento di reparto, dati demografici, informazioni fisiopatologiche e fasi della pandemia) per l'identificazione dei percorsi di cure nel contesto emergenziale e la stratificazione della coorte osservata sulla base dei percorsi estratti.

Una Suite Software di supporto alla Process Mining computational pipeline

LORUSSO, MARIAGRAZIA
2020/2021

Abstract

L’elaborato si inserisce nell’ambito dell’analisi di Process Mining applicata al contesto healthcare ed ha come principale obiettivo quello di fornire un supporto negli step della pipeline computazionale dell’analisi di processi clinici. Il Process Mining è una disciplina che nasce dall’esigenza di trovare una connessione tra le discipline di Machine Learning e Data Mining da un lato e l’analisi dei processi dall’altro. L’idea del Process Mining è quella di scoprire, monitorare e migliorare processi a partire da dati raccolti in contesti pratici, che permettono di generare log di eventi consecutivi (Event Log). La computational pipeline che si applica in analisi di questo tipo è composta essenzialmente da tre fasi: (i) Preprocessing dei dati estratti in forma di Event Log, (ii) Analisi Descrittiva degli Eventi, (iii) Process Discovery. Il focus del lavoro è stato quello di sviluppare uno strumento software che andasse ad inserirsi in ciascuna di queste fasi, presentandosi come un mezzo pratico e di supporto alle analisi di Process Mining. È stata realizzata una Software suite, sviluppata nell’ambiente di programmazione di R e implementata come cruscotto interattivo attraverso i tool di Shiny Dashboard, articolata in tre moduli, corrispondenti agli step sopra elencati. Il Modulo di Enrichment si inserisce nell’ambito del preprocessing e si occupa dell’integrazione di dati eterogenei, attraverso l’applicazione di un processo che, dati in input un Event Log e almeno un data set ancillare (di informazioni aggiuntive), riesce a restituire in output un nuovo Event Log, le cui dimensioni possono essere estese grazie alla combinazione delle informazioni originali (dell’Event Log di partenza) e quelle aggiuntive derivate dai file ancillari. Il Modulo Descrittivo si occupa dell’analisi descrittiva e ha come obbiettivo quello di fornire all’utente diverse tecniche di visualizzazione per l’analisi della distribuzione e della co-occorrenza degli eventi e per l’analisi e la distribuzione degli eventi nei percorsi dei singoli pazienti. Il Modulo di Careflow Mining è dedicato al process discovery. Infatti, attraverso l’algoritmo di careflow mining vengono estratti e mostrati i percorsi principali seguiti pazienti durante il processo di cura. Questo modulo include inoltre la possibilità di effettuare analisi predittive (probabilità di sperimentare un preciso evento futuro dato l’evento presente) e inferenziali. Nella parte finale dell’elaborato è presentato un caso d’uso, dato dall’applicazione della software suite per l’analisi dei processi di cura di soggetti affetti da COVID-19. Le funzionalità della dashbaord sono state utilizzate per l’analisi di dati eterogenei (ricoveri e trasferimento di reparto, dati demografici, informazioni fisiopatologiche e fasi della pandemia) per l'identificazione dei percorsi di cure nel contesto emergenziale e la stratificazione della coorte osservata sulla base dei percorsi estratti.
2020
A Software Suite to support the Process Mining computational pipeline
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/14434