In ambito clinico, l’utilizzo delle tecniche NGS consente di rilevare eventuali differenze tra il genoma di un paziente ed un genoma di riferimento, definite “varianti”. Con il termine “variazione strutturale” (Structural Variation, SV) si intende una variazione nella struttura del DNA, la quale può essere definita microscopica o submicroscopica sulla base della sua dimensione e, di conseguenza, del metodo attraverso cui può essere rilevata. Le variazioni strutturali submicroscopiche, più complesse da rilevare a causa delle loro dimensioni ridotte, riguardano traslocazioni, inversioni e variazioni del numero di copie (Copy Number Variations, CNVs), le quali indicano una regione di DNA che risulta essere presente in un numero variabile di copie rispetto ad un genoma di riferimento, per cui includono delezioni (se vi è una perdita di materiale genetico rispetto al riferimento), inserzioni (se vi è un guadagno di materiale genetico rispetto al riferimento) e duplicazioni (se vi è il raddoppiamento di un tratto di DNA) ed interessano generalmente regioni di DNA di lunghezza >1 kb. La frequenza con cui le CNVs possono verificarsi all’interno di una popolazione è variabile, quando è >1% la CNV è definita polimorfismo del numero di copie (Copy Number Polymorphism, CNP). Sulla base della loro frequenza all’interno della popolazione, le CNVs si dividono quindi in rare e comuni: le CNVs comuni sono coinvolte principalmente nello sviluppo di tumori e malattie autoimmuni/infettive, mentre la maggior parte delle CNVs patogenetiche rare causa sindromi con disabilità intellettiva, dismorfismi facciali e malformazioni. Oltre ad essere causa di sindromi congenite complesse e suscettibilità a malattie, le CNVs possono anche influenzare la risposta ai farmaci. Di conseguenza, la capacità di rilevarne la presenza risulta essenziale per chiarire la plasticità del nostro genoma ed il loro possibile contributo alla malattia. Da qui la necessità di strumenti specializzati nell’identificazione e nell’analisi delle CNVs genomiche. L’obiettivo principale del mio elaborato di tesi era dimostrare che, tramite l’analisi dell’intero esoma (Whole Exome Sequencing, WES), è possibile rilevare la presenza di variazioni del numero di copie all’interno delle regioni codificanti del genoma di un paziente, quindi delezioni e duplicazioni potenzialmente patogenetiche. A tal fine è stato effettuato un training del sistema VarSeq VSClinical ACMG mediante l’analisi delle CNVs in pazienti che erano risultati positivi per la presenza di variazioni del numero di copie tramite array-CGH. Confrontando le posizioni genomiche delle CNVs rilevate mediante array-CGH e WES abbiamo appurato che il sistema è in grado di rilevare le variazioni del numero di copie site in regioni codificanti del genoma dei pazienti in esame.

Analisi bioinformatica di dati Whole Exome Sequencing per l’identificazione di Copy Number Variations

GROPPO, FRANCESCA
2019/2020

Abstract

In ambito clinico, l’utilizzo delle tecniche NGS consente di rilevare eventuali differenze tra il genoma di un paziente ed un genoma di riferimento, definite “varianti”. Con il termine “variazione strutturale” (Structural Variation, SV) si intende una variazione nella struttura del DNA, la quale può essere definita microscopica o submicroscopica sulla base della sua dimensione e, di conseguenza, del metodo attraverso cui può essere rilevata. Le variazioni strutturali submicroscopiche, più complesse da rilevare a causa delle loro dimensioni ridotte, riguardano traslocazioni, inversioni e variazioni del numero di copie (Copy Number Variations, CNVs), le quali indicano una regione di DNA che risulta essere presente in un numero variabile di copie rispetto ad un genoma di riferimento, per cui includono delezioni (se vi è una perdita di materiale genetico rispetto al riferimento), inserzioni (se vi è un guadagno di materiale genetico rispetto al riferimento) e duplicazioni (se vi è il raddoppiamento di un tratto di DNA) ed interessano generalmente regioni di DNA di lunghezza >1 kb. La frequenza con cui le CNVs possono verificarsi all’interno di una popolazione è variabile, quando è >1% la CNV è definita polimorfismo del numero di copie (Copy Number Polymorphism, CNP). Sulla base della loro frequenza all’interno della popolazione, le CNVs si dividono quindi in rare e comuni: le CNVs comuni sono coinvolte principalmente nello sviluppo di tumori e malattie autoimmuni/infettive, mentre la maggior parte delle CNVs patogenetiche rare causa sindromi con disabilità intellettiva, dismorfismi facciali e malformazioni. Oltre ad essere causa di sindromi congenite complesse e suscettibilità a malattie, le CNVs possono anche influenzare la risposta ai farmaci. Di conseguenza, la capacità di rilevarne la presenza risulta essenziale per chiarire la plasticità del nostro genoma ed il loro possibile contributo alla malattia. Da qui la necessità di strumenti specializzati nell’identificazione e nell’analisi delle CNVs genomiche. L’obiettivo principale del mio elaborato di tesi era dimostrare che, tramite l’analisi dell’intero esoma (Whole Exome Sequencing, WES), è possibile rilevare la presenza di variazioni del numero di copie all’interno delle regioni codificanti del genoma di un paziente, quindi delezioni e duplicazioni potenzialmente patogenetiche. A tal fine è stato effettuato un training del sistema VarSeq VSClinical ACMG mediante l’analisi delle CNVs in pazienti che erano risultati positivi per la presenza di variazioni del numero di copie tramite array-CGH. Confrontando le posizioni genomiche delle CNVs rilevate mediante array-CGH e WES abbiamo appurato che il sistema è in grado di rilevare le variazioni del numero di copie site in regioni codificanti del genoma dei pazienti in esame.
2019
Whole Exome Sequencing data analysis to identify Copy Number Variations
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per contatti: unitesi@unipv.it

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/12269