Disentangling the genetic history of Europe has always been a challenge due to the many events that the continent went through. This is even more factual when analyzing the Y chromosome, despite the advantages that uniparental inheritance markers offer in evolutionary and population genetics studies. In fact, although the Y-chromosome sequence variation has long been investigated in population genetics, the difficulty in sequencing this chromosome – present in a single copy and rich in repetitive elements and heterochromatic regions – has delayed it reaching its full potential in the field. Highly heterogeneous Y-chromosome data, obtained from different capture kits or different whole genome approaches and yielding high or low coverage sequences, have been produced over the years, making it challenging to compare the information from separate studies directly. A still poorly investigated haplogroup (hg) regarding the study of human Y-chromosome variation in Europe is hg I, the only haplogroup that originated in this continent and that characterizes many ancient European individuals. Although a phylogeny of this haplogroup, based on the analysis of genetic markers was published in 2004 (Rootsi et al., 2004), no further study at sequencing level has been carried out to evaluate the genetic variability of this clade over time. For this reason, the objective of this thesis was to employ modern Y-chromosome hg I sequences to construct a robust phylogeny in which ancient data, that are usually overlooked in genome sequencing studies, can be inserted, and thus improving their classification. The resulting phylogeny, obtained from the analysis of 446 modern and 403 ancient samples, not only validates the main structure previously proposed for this haplogroup and its high differentiation already in Paleolithic times, but also reveals key insights into the genetic history of Europe including: the post glacial migration of haplogroup I1-M253 to the northern Europe and its eventual spread via Viking expansions; the replacement of I2-M438 in the Iberian Peninsula by the haplogroups (mainly R1b-M269) carried by incoming Steppe groups (Yamnaya) around 4-3 kya; and complex demographic events in the southern Balkans. This study contributes to a more comprehensive understanding of the Europe’s genetic history and lays the groundwork for further exploration into the complexities of haplogroup I. In addition, it emphasizes the importance of obtaining high-coverage modern data within the different branches of haplogroup I to improve our understanding of the intricate events that shaped the population of the continent and to identify more effective explanations for the observed distribution patterns.

Lo studio della storia genetica dell'Europa si è sempre dimostrato difficoltoso a causa dei numerosi eventi che hanno caratterizzato il continente. Ciò è ancor più evidente quando l'analisi riguarda il cromosoma Y, nonostante i vantaggi che i marcatori di eredità uniparentali offrono in studi di genetica evolutiva e di popolazioni. Infatti, sebbene la variazione della sequenza di questo cromosoma sia stata a lungo oggetto di indagini di genetica di popolazioni, la difficoltà nel sequenziarlo - presente in una singola copia e ricco di elementi ripetitivi e regioni eterocromatiche - ne ha ritardato il pieno potenziale nel campo. Nel corso degli anni l’analisi del cromosoma Y ha prodotto dati altamente eterogenei, ottenuti da sequenziamento di regioni specifiche o dell’intero genoma, con rese variabili in termini di coverage, rendendo difficile confrontare direttamente le informazioni provenienti dai diversi studi. Un aplogruppo (hg) ancora poco indagato nello studio della variazione del cromosoma Y umano in Europa è l’hg I, l’unico ad essersi originato nel continente e che caratterizza molti individui antichi. Sebbene una filogenesi basata sull’analisi di marcatori genetici sia stata pubblicata nel 2004 (Rootsi et al., 2004), nessuno studio successivo basato su sequenze ha valutato la variabilità genetica di questo clade nel tempo. Per questo motivo, l'obiettivo di questa tesi è stato di impiegare sequenze moderne del cromosoma Y per costruire una filogenesi robusta in cui inserire anche i cromosomi Y dei soggetti antichi, che solitamente vengono trascurati negli studi di sequenziamento genomico, migliorandone la classificazione. La filogenesi ottenuta da 446 sequenze moderne e 403 antiche, non solo ha permesso di confermare la struttura principale di questo aplogruppo e la sua elevata differenzazione già nel Paleolitico, ma ha anche rivelato importanti eventi della storia genetica dell'Europa, tra cui: la migrazione post-glaciale dell'aplogruppo I1-M253 verso il Nord Europa e la sua successiva diffusione attraverso le espansioni vichinghe; la sostituzione di I2-M438 nella Penisola Iberica da parte degli aplogruppi (principalmente R1b-M269) portati dai gruppi provenienti dalla steppe asiatiche (Yamnaya) avvenuta circa 4-3 mila anni fa; ed eventi demografici complessi nel sud dei Balcani. Questo studio contribuisce a migliorare la comprensione della storia genetica dell'Europa e getta le basi per ulteriori indagini nelle complessità dell'aplogruppo I. Inoltre, esso sottolinea l'importanza di ottenere sequenze moderne ad alta copertura nei vari rami dell’aplogruppo I per migliorare la comprensione degli eventi che hanno plasmato la popolazione del continente e per identificare spiegazioni più efficaci per le distribuzioni osservate.

Un'analisi filogenetica congiunta dei cromosomi Y umani antichi e moderni appartenenti all’aplogruppo I

DALMAZ, MUHAMMET MUSTAFA
2022/2023

Abstract

Disentangling the genetic history of Europe has always been a challenge due to the many events that the continent went through. This is even more factual when analyzing the Y chromosome, despite the advantages that uniparental inheritance markers offer in evolutionary and population genetics studies. In fact, although the Y-chromosome sequence variation has long been investigated in population genetics, the difficulty in sequencing this chromosome – present in a single copy and rich in repetitive elements and heterochromatic regions – has delayed it reaching its full potential in the field. Highly heterogeneous Y-chromosome data, obtained from different capture kits or different whole genome approaches and yielding high or low coverage sequences, have been produced over the years, making it challenging to compare the information from separate studies directly. A still poorly investigated haplogroup (hg) regarding the study of human Y-chromosome variation in Europe is hg I, the only haplogroup that originated in this continent and that characterizes many ancient European individuals. Although a phylogeny of this haplogroup, based on the analysis of genetic markers was published in 2004 (Rootsi et al., 2004), no further study at sequencing level has been carried out to evaluate the genetic variability of this clade over time. For this reason, the objective of this thesis was to employ modern Y-chromosome hg I sequences to construct a robust phylogeny in which ancient data, that are usually overlooked in genome sequencing studies, can be inserted, and thus improving their classification. The resulting phylogeny, obtained from the analysis of 446 modern and 403 ancient samples, not only validates the main structure previously proposed for this haplogroup and its high differentiation already in Paleolithic times, but also reveals key insights into the genetic history of Europe including: the post glacial migration of haplogroup I1-M253 to the northern Europe and its eventual spread via Viking expansions; the replacement of I2-M438 in the Iberian Peninsula by the haplogroups (mainly R1b-M269) carried by incoming Steppe groups (Yamnaya) around 4-3 kya; and complex demographic events in the southern Balkans. This study contributes to a more comprehensive understanding of the Europe’s genetic history and lays the groundwork for further exploration into the complexities of haplogroup I. In addition, it emphasizes the importance of obtaining high-coverage modern data within the different branches of haplogroup I to improve our understanding of the intricate events that shaped the population of the continent and to identify more effective explanations for the observed distribution patterns.
2022
A joint phylogenetic analysis of ancient and modern human Y chromosomes belonging to haplogroup I
Lo studio della storia genetica dell'Europa si è sempre dimostrato difficoltoso a causa dei numerosi eventi che hanno caratterizzato il continente. Ciò è ancor più evidente quando l'analisi riguarda il cromosoma Y, nonostante i vantaggi che i marcatori di eredità uniparentali offrono in studi di genetica evolutiva e di popolazioni. Infatti, sebbene la variazione della sequenza di questo cromosoma sia stata a lungo oggetto di indagini di genetica di popolazioni, la difficoltà nel sequenziarlo - presente in una singola copia e ricco di elementi ripetitivi e regioni eterocromatiche - ne ha ritardato il pieno potenziale nel campo. Nel corso degli anni l’analisi del cromosoma Y ha prodotto dati altamente eterogenei, ottenuti da sequenziamento di regioni specifiche o dell’intero genoma, con rese variabili in termini di coverage, rendendo difficile confrontare direttamente le informazioni provenienti dai diversi studi. Un aplogruppo (hg) ancora poco indagato nello studio della variazione del cromosoma Y umano in Europa è l’hg I, l’unico ad essersi originato nel continente e che caratterizza molti individui antichi. Sebbene una filogenesi basata sull’analisi di marcatori genetici sia stata pubblicata nel 2004 (Rootsi et al., 2004), nessuno studio successivo basato su sequenze ha valutato la variabilità genetica di questo clade nel tempo. Per questo motivo, l'obiettivo di questa tesi è stato di impiegare sequenze moderne del cromosoma Y per costruire una filogenesi robusta in cui inserire anche i cromosomi Y dei soggetti antichi, che solitamente vengono trascurati negli studi di sequenziamento genomico, migliorandone la classificazione. La filogenesi ottenuta da 446 sequenze moderne e 403 antiche, non solo ha permesso di confermare la struttura principale di questo aplogruppo e la sua elevata differenzazione già nel Paleolitico, ma ha anche rivelato importanti eventi della storia genetica dell'Europa, tra cui: la migrazione post-glaciale dell'aplogruppo I1-M253 verso il Nord Europa e la sua successiva diffusione attraverso le espansioni vichinghe; la sostituzione di I2-M438 nella Penisola Iberica da parte degli aplogruppi (principalmente R1b-M269) portati dai gruppi provenienti dalla steppe asiatiche (Yamnaya) avvenuta circa 4-3 mila anni fa; ed eventi demografici complessi nel sud dei Balcani. Questo studio contribuisce a migliorare la comprensione della storia genetica dell'Europa e getta le basi per ulteriori indagini nelle complessità dell'aplogruppo I. Inoltre, esso sottolinea l'importanza di ottenere sequenze moderne ad alta copertura nei vari rami dell’aplogruppo I per migliorare la comprensione degli eventi che hanno plasmato la popolazione del continente e per identificare spiegazioni più efficaci per le distribuzioni osservate.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per contatti: unitesi@unipv.it

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/17183