Il presente progetto di tesi si è svolto nell’ambito del progetto “Intestrat-cad” (Integrated Stratification Tools in Coronary Artery Disease) coordinato dal centro cardiologico Monzino IRCCS. Il progetto Intestrat-cad coinvolge 829 pazienti in uno studio prospettico osservazionale, con lo scopo di stratificare una popolazione affetta da malattia coronarica, la cui incidenza, negli ultimi anni è in notevole aumento. Lo scopo principale del progetto è una comprensione più dettagliata e approfondita del motivo per cui alcuni pazienti classificati come a basso rischio tramite gli attuali approcci ed indicatori di rischio cardiovascolare, in realtà incorressero in manifestazioni acute come infarti, angina instabile o morte istantanea. A tal proposito si è voluto migliorare la capacità di individuare questi soggetti in modo da poterli riconoscere preventivamente e curare tempestivamente. Nell’ambito del progetto “Intestrat-cad” il profilo di rischio si baserà su tre diversi componenti: entità della placca coronarica, profilo clinico-fisiopatologico e dati omici. In questo progetto di tesi ci si è focalizzati sull’aspetto clinico. In particolare, dal registro per la raccolta di dati clinici RedCap sono stati acquisiti i dati dei pazienti raccolti durante la prima visita di follow-up, che includono dati demografici, risultati di test di laboratorio e comorbidità. Il dataset è stato pre-processato al fine di valutare la qualità dei dati raccolti e risolvere il problema della mancanza di dati per ottenere un sub-dataset completo e coerente con il tipo di analisi svolta in questa tesi. Quindi, sono stati utilizzati metodi di apprendimento automatico non supervisionati per distinguere sotto-fenotipi che permettessero di ottenere una stratificazione del rischio più accurata. A questo scopo, è stato utilizzato un metodo basato sulla rappresentazione dei dati in spazi topologici, chiamato TDA Mapper. L’algoritmo TDA mapper ha richiesto diversi step per l’impostazione di parametri per una rappresentazione stabile e congruente della popolazione in esame, guidata da informazioni cliniche inerenti all’entità della placca osservata. La rappresentazione topologica dei dati così ottenuta ha permesso l’identificazione di sottogruppi di pazienti eterogeni da un punto di vista degli score del rischio tradizionali. Si sono quindi analizzati in modo approfondito questi gruppi, per determinare nuovi fenotipi del rischio, che saranno validati durante lo sviluppo del progetto “Intestrat-cad” con lo scopo di ottenere una migliore stratificazione del rischio di eventi acuti e quindi la sensibilità dei modelli predittivi.
Approcci di apprendimento non supervisionato per l'analisi e il confronto di fenotipi ed endotipi nella malattia coronarica.
MONTANARO, ANTONIO
2020/2021
Abstract
Il presente progetto di tesi si è svolto nell’ambito del progetto “Intestrat-cad” (Integrated Stratification Tools in Coronary Artery Disease) coordinato dal centro cardiologico Monzino IRCCS. Il progetto Intestrat-cad coinvolge 829 pazienti in uno studio prospettico osservazionale, con lo scopo di stratificare una popolazione affetta da malattia coronarica, la cui incidenza, negli ultimi anni è in notevole aumento. Lo scopo principale del progetto è una comprensione più dettagliata e approfondita del motivo per cui alcuni pazienti classificati come a basso rischio tramite gli attuali approcci ed indicatori di rischio cardiovascolare, in realtà incorressero in manifestazioni acute come infarti, angina instabile o morte istantanea. A tal proposito si è voluto migliorare la capacità di individuare questi soggetti in modo da poterli riconoscere preventivamente e curare tempestivamente. Nell’ambito del progetto “Intestrat-cad” il profilo di rischio si baserà su tre diversi componenti: entità della placca coronarica, profilo clinico-fisiopatologico e dati omici. In questo progetto di tesi ci si è focalizzati sull’aspetto clinico. In particolare, dal registro per la raccolta di dati clinici RedCap sono stati acquisiti i dati dei pazienti raccolti durante la prima visita di follow-up, che includono dati demografici, risultati di test di laboratorio e comorbidità. Il dataset è stato pre-processato al fine di valutare la qualità dei dati raccolti e risolvere il problema della mancanza di dati per ottenere un sub-dataset completo e coerente con il tipo di analisi svolta in questa tesi. Quindi, sono stati utilizzati metodi di apprendimento automatico non supervisionati per distinguere sotto-fenotipi che permettessero di ottenere una stratificazione del rischio più accurata. A questo scopo, è stato utilizzato un metodo basato sulla rappresentazione dei dati in spazi topologici, chiamato TDA Mapper. L’algoritmo TDA mapper ha richiesto diversi step per l’impostazione di parametri per una rappresentazione stabile e congruente della popolazione in esame, guidata da informazioni cliniche inerenti all’entità della placca osservata. La rappresentazione topologica dei dati così ottenuta ha permesso l’identificazione di sottogruppi di pazienti eterogeni da un punto di vista degli score del rischio tradizionali. Si sono quindi analizzati in modo approfondito questi gruppi, per determinare nuovi fenotipi del rischio, che saranno validati durante lo sviluppo del progetto “Intestrat-cad” con lo scopo di ottenere una migliore stratificazione del rischio di eventi acuti e quindi la sensibilità dei modelli predittivi.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/13778