Con l'evoluzione delle tecnologie di Next Generation Sequencing (NGS) oggi è possibile determinare per un paziente, in breve tempo e a costi ridotti, la lista di geni candidati potenzialmente causativi di una malattia ereditaria. Tuttavia, identificare il singolo gene che causa la malattia richiede un grande sforzo in termini di tempo e risorse da parte del medico genetista, il quale non può svincolarsi dal considerare i fenotipi clinici mostrati dal paziente. In relazione al fatto che le caratteristiche fenotipiche di un individuo rappresentano la manifestazione della malattia dovuta all'eredità di un gene mutato, esse stanno assumendo un ruolo sempre più importante nel migliorare l'efficienza della diagnosi di malattie mendeliane nell'uomo. A questo proposito, negli ultimi anni si stanno diffondendo in maniera progressiva strumenti di supporto al clinico nel complesso processo di diagnosi delle malattie ereditarie, focalizzandosi principalmente sull'analisi della relazione che esiste fra le caratteristiche fenotipiche mostrate dal paziente e i fenotipi che caratterizzano le malattie fin qui note. Lungo questa direzione, il presente lavoro di tesi si è incentrato nello sviluppo di un algoritmo volto al confronto della similarità fenotipica fra le due categorie di fenotipi sopra citate con lo scopo di identificare la malattia che meglio spiega le anormalità fenotipiche mostrate dal paziente. Il progetto ha previsto lo sviluppo di un modello computazionale in cui sono state introdotte informazioni relative ai fenotipi, ritenute fondamentali per una diagnosi accurata, con l'obbiettivo di fornire all'utente finale una classifica delle associazioni gene-malattia che meglio spiegano la lista di fenotipi descrittivi del paziente. L'algoritmo ha mostrato ottime performance nella prioritizzazione del gene causativo del paziente affetto da Miller Syndrome, dimostrandosi tollerante in presenza di fenotipi rumorosi e solido in presenza di pochi fenotipi ma specifici. Dal confronto con 4 tool esistenti allo stato dell'arte su una coorte di 20 pazienti simulati e reali ha mostrato prestazioni migliori rispetto a tutti i tool confrontati nei 10 pazienti simulati, invece si è mostrato migliore nel classificare il gene causativo nei 10 pazienti reali rispetto a 3 tool su 4.

Sviluppo e implementazione di un modello computazionale per il calcolo della similarità tra set di termini fenotipici

CARTA, MARIA GIULIA
2019/2020

Abstract

Con l'evoluzione delle tecnologie di Next Generation Sequencing (NGS) oggi è possibile determinare per un paziente, in breve tempo e a costi ridotti, la lista di geni candidati potenzialmente causativi di una malattia ereditaria. Tuttavia, identificare il singolo gene che causa la malattia richiede un grande sforzo in termini di tempo e risorse da parte del medico genetista, il quale non può svincolarsi dal considerare i fenotipi clinici mostrati dal paziente. In relazione al fatto che le caratteristiche fenotipiche di un individuo rappresentano la manifestazione della malattia dovuta all'eredità di un gene mutato, esse stanno assumendo un ruolo sempre più importante nel migliorare l'efficienza della diagnosi di malattie mendeliane nell'uomo. A questo proposito, negli ultimi anni si stanno diffondendo in maniera progressiva strumenti di supporto al clinico nel complesso processo di diagnosi delle malattie ereditarie, focalizzandosi principalmente sull'analisi della relazione che esiste fra le caratteristiche fenotipiche mostrate dal paziente e i fenotipi che caratterizzano le malattie fin qui note. Lungo questa direzione, il presente lavoro di tesi si è incentrato nello sviluppo di un algoritmo volto al confronto della similarità fenotipica fra le due categorie di fenotipi sopra citate con lo scopo di identificare la malattia che meglio spiega le anormalità fenotipiche mostrate dal paziente. Il progetto ha previsto lo sviluppo di un modello computazionale in cui sono state introdotte informazioni relative ai fenotipi, ritenute fondamentali per una diagnosi accurata, con l'obbiettivo di fornire all'utente finale una classifica delle associazioni gene-malattia che meglio spiegano la lista di fenotipi descrittivi del paziente. L'algoritmo ha mostrato ottime performance nella prioritizzazione del gene causativo del paziente affetto da Miller Syndrome, dimostrandosi tollerante in presenza di fenotipi rumorosi e solido in presenza di pochi fenotipi ma specifici. Dal confronto con 4 tool esistenti allo stato dell'arte su una coorte di 20 pazienti simulati e reali ha mostrato prestazioni migliori rispetto a tutti i tool confrontati nei 10 pazienti simulati, invece si è mostrato migliore nel classificare il gene causativo nei 10 pazienti reali rispetto a 3 tool su 4.
2019
Development and implementation of a method to compute similarity between phenotypic terms sets ​
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/12655