Repetitive sequences are non-coding DNA sequences which are divided into satellite DNA and transposable elements (TEs). TEs physically move from one position to another within genomes (DNA transposons) or increase their copy number through a mechanism called transposition (retrotransposons). The latter are composed by LINEs and SINEs: while LINEs encode for the enzymatic machinery required to transpose, SINEs does not and rely on the enzymatic activities encoded by LINEs. It is well documented that transposons can be involved in a process called exaptation, through which TEs can produce evolutionary innovation at the species level, contributing to genome evolution. Perissodactyla is a phylogenetic order of odd-toed ungulates comprising 17 species traditionally divided in two suborders: Hippomorpha containing the Equidae family, and Ceratomorpha comprising the Tapiridae and Rhinocerotidae ones. In 2011, Steiner and Ryder examined the phylogenetic relationships of 16 perissodactyl species analyzing 11 nuclear and mitochondrial genes. Interestingly, they found that the phylogenetic tree built using mitochondrial genes was very different from the traditional one, since it grouped together Equidae and Tapiridae families and indicated Rhinocerotidae as a separate lineage (Steiner and Ryder, 2011). Recently, an unpublished work of our laboratory aimed to study the conservation of Interstitial Telomeric Sequences (ITSs) within Perissodactyls genomes lead to the same result. These observations prompted us to carry out an evolutionary study of the Perissodactyla phylogeny aimed to validate the alternative tree. For this purpose, the transposon family ERE-1, a perissodactyl-specific SINE, has been used as evolutionary marker. In this work, I evaluated the evolutionary conservation of 102 Equus caballus ERE-1-containing loci in the genomes of Tapirus indicus and Ceratotherium simum simum. The results showed that 95 loci were not informative since they could not be used neither to support nor to exclude the alternative tree. 2 loci support the alternative phylogenetic tree where genus Equus is grouped with Tapirus. Surprisingly, 5 loci suggested a second alternative evolutionary tree where Equidae and Rhinocerotidae families are grouped together. In conclusion, our data showed that the construction of the Perissodactyla phylogenetic tree is particularly complex. In particular, the rapid radiation of the families may have led to phenomena such as hybridization and incomplete lineage sorting. The second part of the thesis describes the experiments that I performed in the laboratory of Christophe Escudè at Muséum national d'Histoire naturelle, MNHN, (Paris), in which I focused my work on Alpha satellite, the major repeated DNA element of primate centromeres. In two papers published by MNHN (Cacheux et al., 2016, 2018), the Alpha satellite DNA of two Cercopithecini species has been studied using a targeted approach, in which Alpha satellite monomers have been retrieved by restriction enzymes cleavage; from this analysis, six Alpha satellite families have been identified. I collaborated to this project by carrying out a non-targeted approach-based analysis on Alpha satellite DNA sequences from Cercopithecus cephus cephodes. Applying an analysis protocol based on Principal Component Analyses (PCA), I projected the principal components of the Alpha satellite monomers retrieved from the previous works onto the PCA planes obtained with the new dataset: the analysis allowed the visualization of the 6 known Alpha satellite families and the identification of putative new families. Based on these data, I built phylogenetic trees that were used to study the relationships between known and putative new families: they confirmed that the non-targeted approach allowed the visualization of the known families and of new putative families of this repeat.

Le sequenze ripetute appartengono alla porzione di DNA non codificante e si dividono in DNA satellite e in elementi trasponibili. Questi ultimi si muovono da una posizione all’altra all’interno dei genomi (i trasposoni a DNA) o aumentano il loro numero tramite un meccanismo noto come trasposizione (i retrotrasposoni). Essi si dividono in LINEs e SINEs: i LINEs codificano per gli enzimi responsabili della trasposizione, i SINEs, invece no e sfruttano i macchinari molecolari codificati dai LINEs. È ampiamente documentato che i trasposoni sono coinvolti in un processo noto come “exaptation”, mediante il quale essi possono fornire un vantaggio evolutivo, contribuendo all’evoluzione del genoma. I Perissodattili sono un ordine filogenetico composto da 17 specie tradizionalmente divise in due sottordini: quello degli Hippomorpha, contenente la famiglia degli equidi, e quello dei Ceratomorpha che comprende le famiglie dei tapiridi e dei rinocerotidi. Nel 2011, Steiner and Ryder studiarono le relazioni filogenetiche dell’ordine analizzando 11 geni tra nucleari e mitocondriali e osservarono che l’albero filogenetico costruito usando i geni mitocondriali era differente da quello tradizionale, poiché in esso le famiglie degli equidi e dei tapiridi erano raggruppate, mentre i rinocerotidi rappresentavano una linea separata. Recentemente, un lavoro non ancora pubblicato del nostro laboratorio, mirato allo studio della conservazione delle sequenze telomeriche interstiziali all’interno dei Perissodattili, ha portato allo stesso risultato. Queste osservazioni ci hanno spinto a condurre uno studio evoluzionistico sulla filogenesi dei Perissodattili, mirato a validare l’albero evolutivo alternativo. A tal proposito, la famiglia di trasposoni ERE-1, un tipo di SINE perissodattilo-specifica, è stata usata come marker evolutivo. In questo lavoro, ho studiato la conservazione di 102 loci di cavallo contenenti ERE-1 nei genomi di Tapirus indicus and Ceratotherium simum simum. I risultati evidenziano 92 loci non informativi in quanto non supportano né escludono l’albero filogenetico alternativo. 2 loci supportano l’albero alternativo in cui il genuus Equus è raggruppato con la famiglia dei tapiridi. Infine, 5 loci suggeriscono un secondo albero alternativo, in cui le famiglie degli equidi e dei rinocerotidi sono raggruppate. In conclusione, i nostri dati mostrano che la costruzione dell’albero filogenetico dei Perissodattili è molto complessa. In particolare, la rapida separazione delle famiglie potrebbe aver portato a fenomeni come ibridazione e incomplete lineage sorting. La seconda sezione della mia tesi descrive gli esperimenti condotti nel laboratorio del prof. Christophe Escudè presso il Muséum national d'Histoire Naturelle, MNHN, (Parigi), in cui ho studiato l’Alfa satellite, il principale tipo di sequenza ripetuta dei centromeri dei primati. In due lavori pubblicati dal MNHN l’Alfa satellite di due specie di Cercopitecini è stato studiato mediante un approccio mirato, in cui i monomeri di Alfa satellite sono stati estratti grazie all’azione di due enzimi di restrizione. Da questa analisi sono state identificate sei famiglie di Alfa satellite. Ho collaborato a questo progetto mediante un analisi delle sequenze di Alfa satellite di Cercopithecus cephus cephodes basata su un approccio non mirato. Mediante un protocollo incentrato su PCA, ho proiettato le componenti principali ricavate dai monomeri di Alfa satellite derivati dai lavori precedenti sui piani di PCA ottenuti con il mio nuovo dataset: l’analisi ha permesso la visualizzazione delle 6 famiglie note e l’identificazione di nuove possibile altre. Osservando questi dati, ho costruito degli alberi filogenetici per studiare le relazioni tra le famiglie note e quelle di nuova identificazione: questi hanno confermato che l’approccio non mirato permette sia la visualizzazione delle famiglie note, sia di altre presunte nuove.

Sequenze di DNA ripetute nei genomi di mammiferi

MARCHI, GIOVANNI
2019/2020

Abstract

Repetitive sequences are non-coding DNA sequences which are divided into satellite DNA and transposable elements (TEs). TEs physically move from one position to another within genomes (DNA transposons) or increase their copy number through a mechanism called transposition (retrotransposons). The latter are composed by LINEs and SINEs: while LINEs encode for the enzymatic machinery required to transpose, SINEs does not and rely on the enzymatic activities encoded by LINEs. It is well documented that transposons can be involved in a process called exaptation, through which TEs can produce evolutionary innovation at the species level, contributing to genome evolution. Perissodactyla is a phylogenetic order of odd-toed ungulates comprising 17 species traditionally divided in two suborders: Hippomorpha containing the Equidae family, and Ceratomorpha comprising the Tapiridae and Rhinocerotidae ones. In 2011, Steiner and Ryder examined the phylogenetic relationships of 16 perissodactyl species analyzing 11 nuclear and mitochondrial genes. Interestingly, they found that the phylogenetic tree built using mitochondrial genes was very different from the traditional one, since it grouped together Equidae and Tapiridae families and indicated Rhinocerotidae as a separate lineage (Steiner and Ryder, 2011). Recently, an unpublished work of our laboratory aimed to study the conservation of Interstitial Telomeric Sequences (ITSs) within Perissodactyls genomes lead to the same result. These observations prompted us to carry out an evolutionary study of the Perissodactyla phylogeny aimed to validate the alternative tree. For this purpose, the transposon family ERE-1, a perissodactyl-specific SINE, has been used as evolutionary marker. In this work, I evaluated the evolutionary conservation of 102 Equus caballus ERE-1-containing loci in the genomes of Tapirus indicus and Ceratotherium simum simum. The results showed that 95 loci were not informative since they could not be used neither to support nor to exclude the alternative tree. 2 loci support the alternative phylogenetic tree where genus Equus is grouped with Tapirus. Surprisingly, 5 loci suggested a second alternative evolutionary tree where Equidae and Rhinocerotidae families are grouped together. In conclusion, our data showed that the construction of the Perissodactyla phylogenetic tree is particularly complex. In particular, the rapid radiation of the families may have led to phenomena such as hybridization and incomplete lineage sorting. The second part of the thesis describes the experiments that I performed in the laboratory of Christophe Escudè at Muséum national d'Histoire naturelle, MNHN, (Paris), in which I focused my work on Alpha satellite, the major repeated DNA element of primate centromeres. In two papers published by MNHN (Cacheux et al., 2016, 2018), the Alpha satellite DNA of two Cercopithecini species has been studied using a targeted approach, in which Alpha satellite monomers have been retrieved by restriction enzymes cleavage; from this analysis, six Alpha satellite families have been identified. I collaborated to this project by carrying out a non-targeted approach-based analysis on Alpha satellite DNA sequences from Cercopithecus cephus cephodes. Applying an analysis protocol based on Principal Component Analyses (PCA), I projected the principal components of the Alpha satellite monomers retrieved from the previous works onto the PCA planes obtained with the new dataset: the analysis allowed the visualization of the 6 known Alpha satellite families and the identification of putative new families. Based on these data, I built phylogenetic trees that were used to study the relationships between known and putative new families: they confirmed that the non-targeted approach allowed the visualization of the known families and of new putative families of this repeat.
2019
Repeated DNA sequences in mammalian genomes
Le sequenze ripetute appartengono alla porzione di DNA non codificante e si dividono in DNA satellite e in elementi trasponibili. Questi ultimi si muovono da una posizione all’altra all’interno dei genomi (i trasposoni a DNA) o aumentano il loro numero tramite un meccanismo noto come trasposizione (i retrotrasposoni). Essi si dividono in LINEs e SINEs: i LINEs codificano per gli enzimi responsabili della trasposizione, i SINEs, invece no e sfruttano i macchinari molecolari codificati dai LINEs. È ampiamente documentato che i trasposoni sono coinvolti in un processo noto come “exaptation”, mediante il quale essi possono fornire un vantaggio evolutivo, contribuendo all’evoluzione del genoma. I Perissodattili sono un ordine filogenetico composto da 17 specie tradizionalmente divise in due sottordini: quello degli Hippomorpha, contenente la famiglia degli equidi, e quello dei Ceratomorpha che comprende le famiglie dei tapiridi e dei rinocerotidi. Nel 2011, Steiner and Ryder studiarono le relazioni filogenetiche dell’ordine analizzando 11 geni tra nucleari e mitocondriali e osservarono che l’albero filogenetico costruito usando i geni mitocondriali era differente da quello tradizionale, poiché in esso le famiglie degli equidi e dei tapiridi erano raggruppate, mentre i rinocerotidi rappresentavano una linea separata. Recentemente, un lavoro non ancora pubblicato del nostro laboratorio, mirato allo studio della conservazione delle sequenze telomeriche interstiziali all’interno dei Perissodattili, ha portato allo stesso risultato. Queste osservazioni ci hanno spinto a condurre uno studio evoluzionistico sulla filogenesi dei Perissodattili, mirato a validare l’albero evolutivo alternativo. A tal proposito, la famiglia di trasposoni ERE-1, un tipo di SINE perissodattilo-specifica, è stata usata come marker evolutivo. In questo lavoro, ho studiato la conservazione di 102 loci di cavallo contenenti ERE-1 nei genomi di Tapirus indicus and Ceratotherium simum simum. I risultati evidenziano 92 loci non informativi in quanto non supportano né escludono l’albero filogenetico alternativo. 2 loci supportano l’albero alternativo in cui il genuus Equus è raggruppato con la famiglia dei tapiridi. Infine, 5 loci suggeriscono un secondo albero alternativo, in cui le famiglie degli equidi e dei rinocerotidi sono raggruppate. In conclusione, i nostri dati mostrano che la costruzione dell’albero filogenetico dei Perissodattili è molto complessa. In particolare, la rapida separazione delle famiglie potrebbe aver portato a fenomeni come ibridazione e incomplete lineage sorting. La seconda sezione della mia tesi descrive gli esperimenti condotti nel laboratorio del prof. Christophe Escudè presso il Muséum national d'Histoire Naturelle, MNHN, (Parigi), in cui ho studiato l’Alfa satellite, il principale tipo di sequenza ripetuta dei centromeri dei primati. In due lavori pubblicati dal MNHN l’Alfa satellite di due specie di Cercopitecini è stato studiato mediante un approccio mirato, in cui i monomeri di Alfa satellite sono stati estratti grazie all’azione di due enzimi di restrizione. Da questa analisi sono state identificate sei famiglie di Alfa satellite. Ho collaborato a questo progetto mediante un analisi delle sequenze di Alfa satellite di Cercopithecus cephus cephodes basata su un approccio non mirato. Mediante un protocollo incentrato su PCA, ho proiettato le componenti principali ricavate dai monomeri di Alfa satellite derivati dai lavori precedenti sui piani di PCA ottenuti con il mio nuovo dataset: l’analisi ha permesso la visualizzazione delle 6 famiglie note e l’identificazione di nuove possibile altre. Osservando questi dati, ho costruito degli alberi filogenetici per studiare le relazioni tra le famiglie note e quelle di nuova identificazione: questi hanno confermato che l’approccio non mirato permette sia la visualizzazione delle famiglie note, sia di altre presunte nuove.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/12745