Tra i rischi legati alla somministrazione della nutrizione artificiale parenterale (NAP), ovvero della terapia che prevede l’infusione endovenosa di sospensioni farmaceutiche contenenti principi attivi quali lipidi, glucosio, aminoacidi ed elettroliti in acqua, risaltano sicuramente gli errori umani commessi dai componenti del personale medico e paramedico. Spesso, tali errori portano alla somministrazione di farmaci errati, che non sono stati precedentemente prescritti da un medico, ai pazienti sotto terapia, con conseguenze molto gravi sulla loro salute. Perciò, è nata la necessità di riconoscere in maniera automatica e con buona precisione e affidabilità i farmaci in questione. Questi fluidi sono detti diffondenti, in quanto presentano una componente diffondente (le micelle lipidiche) immersa in una matrice acquosa, che contiene i restanti principi attivi. Tale caratteristica, aumenta l’interesse dello studio delle proprietà ottiche delle sospensioni farmaceutiche, in quanto, sfruttando la presenza al loro interno di elementi diffondenti quali gli agglomerati lipidici, a partire da questi farmaci è possibile acquisire delle immagini di speckle pattern (SP), cosa che non sarebbe possibile per fluidi trasparenti e non diffondenti. Per giunta, nel lavoro di tesi precedente al mio, sono state acquisite delle immagini di speckle pattern a partire da campioni di un set di sette farmaci per NAP mediante un laser a semiconduttore ed una telecamera collegata ad un computer portatile. Il presente lavoro di tesi si pone come obbiettivo il riconoscimento automatico delle sette sospensioni farmaceutiche per la nutrizione artificiale parenterale, mediante l’utilizzo di algoritmi di Machine Learning (ML), quali albero decisionale, Random Forest (RF), Adaboost, k-Nearest Neighbor (k-NN), Support Vector Machine (SVM) e Multi-layer Perceptron (MLP), applicati a un dataset contenente una serie di parametri statistici ricavati dalle immagini di speckle pattern acquisite in precedenza. Dopo una pre-elaborazione dei dati tabellari (che ha coinvolto la rimozione di outliers e la normalizzazione dei dati), uno studio sulla correlazione lineare dei parametri statistici ha permesso di creare un ulteriore dataset di dimensioni ridotte, poiché considerando le coppie di variabili maggiormente correlate, uno dei due parametri veniva scartato in maniera casuale. Successivamente, i classificatori sono stati addestrati utilizzando separatamente entrambi i dataset: è stata condotta per prima una grid-search per la ricerca degli iperparametri ottimali, mentre in secondo luogo si è fatto ricorso alla tecnica della cross-validation per effettuare una model selection, prendendo in considerazione i due modelli con le prestazioni migliori, ovvero Random Forest e Multi-layer Perceptron. Infine, nell’ultimo capitolo della mia tesi è illustrato il processo di test dei modelli, mentre successivamente viene introdotta l’analisi dei risultati mediante SHAP values (SHapley Additive exPlanations), così da facilitarne l’interpretazione. I risultati del test hanno evidenziato una grande capacità dei modelli nel riconoscere due farmaci, denominati FINOMEL e NUMETA, mentre per i restanti le difficoltà aumentano, specialmente per i farmaci chiamati OLIMEL N9E e OLIMEL N12E, per i quali sono state registrate le prestazioni più basse. Tra le metriche di valutazione dell’apprendimento dei modelli scelte, risultano molto promettenti gli ottimi valori dell’area sottesa dalla curva ROC (Receiver operating characteristic) e le alte prestazioni in termini di specificità, che non scendono mai sotto il 90%. Quest’ultimo risultato è piuttosto interessante, in quanto, sebbene i modelli non riescano ad indentificare con assoluta precisione tutti i farmaci, costituisce comunque un primo passo avanti verso la progettazione di un dispositivo di segnalazione di eventuali errori nella somministrazione della terapia NAP.
Algoritmi di machine learning applicati a parametri statistici ricavati da immagini di speckle pattern per il riconoscimento di sospensioni farmaceutiche
COGHE, LUCA
2022/2023
Abstract
Tra i rischi legati alla somministrazione della nutrizione artificiale parenterale (NAP), ovvero della terapia che prevede l’infusione endovenosa di sospensioni farmaceutiche contenenti principi attivi quali lipidi, glucosio, aminoacidi ed elettroliti in acqua, risaltano sicuramente gli errori umani commessi dai componenti del personale medico e paramedico. Spesso, tali errori portano alla somministrazione di farmaci errati, che non sono stati precedentemente prescritti da un medico, ai pazienti sotto terapia, con conseguenze molto gravi sulla loro salute. Perciò, è nata la necessità di riconoscere in maniera automatica e con buona precisione e affidabilità i farmaci in questione. Questi fluidi sono detti diffondenti, in quanto presentano una componente diffondente (le micelle lipidiche) immersa in una matrice acquosa, che contiene i restanti principi attivi. Tale caratteristica, aumenta l’interesse dello studio delle proprietà ottiche delle sospensioni farmaceutiche, in quanto, sfruttando la presenza al loro interno di elementi diffondenti quali gli agglomerati lipidici, a partire da questi farmaci è possibile acquisire delle immagini di speckle pattern (SP), cosa che non sarebbe possibile per fluidi trasparenti e non diffondenti. Per giunta, nel lavoro di tesi precedente al mio, sono state acquisite delle immagini di speckle pattern a partire da campioni di un set di sette farmaci per NAP mediante un laser a semiconduttore ed una telecamera collegata ad un computer portatile. Il presente lavoro di tesi si pone come obbiettivo il riconoscimento automatico delle sette sospensioni farmaceutiche per la nutrizione artificiale parenterale, mediante l’utilizzo di algoritmi di Machine Learning (ML), quali albero decisionale, Random Forest (RF), Adaboost, k-Nearest Neighbor (k-NN), Support Vector Machine (SVM) e Multi-layer Perceptron (MLP), applicati a un dataset contenente una serie di parametri statistici ricavati dalle immagini di speckle pattern acquisite in precedenza. Dopo una pre-elaborazione dei dati tabellari (che ha coinvolto la rimozione di outliers e la normalizzazione dei dati), uno studio sulla correlazione lineare dei parametri statistici ha permesso di creare un ulteriore dataset di dimensioni ridotte, poiché considerando le coppie di variabili maggiormente correlate, uno dei due parametri veniva scartato in maniera casuale. Successivamente, i classificatori sono stati addestrati utilizzando separatamente entrambi i dataset: è stata condotta per prima una grid-search per la ricerca degli iperparametri ottimali, mentre in secondo luogo si è fatto ricorso alla tecnica della cross-validation per effettuare una model selection, prendendo in considerazione i due modelli con le prestazioni migliori, ovvero Random Forest e Multi-layer Perceptron. Infine, nell’ultimo capitolo della mia tesi è illustrato il processo di test dei modelli, mentre successivamente viene introdotta l’analisi dei risultati mediante SHAP values (SHapley Additive exPlanations), così da facilitarne l’interpretazione. I risultati del test hanno evidenziato una grande capacità dei modelli nel riconoscere due farmaci, denominati FINOMEL e NUMETA, mentre per i restanti le difficoltà aumentano, specialmente per i farmaci chiamati OLIMEL N9E e OLIMEL N12E, per i quali sono state registrate le prestazioni più basse. Tra le metriche di valutazione dell’apprendimento dei modelli scelte, risultano molto promettenti gli ottimi valori dell’area sottesa dalla curva ROC (Receiver operating characteristic) e le alte prestazioni in termini di specificità, che non scendono mai sotto il 90%. Quest’ultimo risultato è piuttosto interessante, in quanto, sebbene i modelli non riescano ad indentificare con assoluta precisione tutti i farmaci, costituisce comunque un primo passo avanti verso la progettazione di un dispositivo di segnalazione di eventuali errori nella somministrazione della terapia NAP.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/16197