Quando l'uomo moderno emigrò dall'Africa circa 10000 anni fa e conseguentemente si occupò il resto del mondo, l'ultimo continente che colonizzò furono le Americhe. Per decenni gli scienziati hanno raccolto informazioni genomiche dalle popolazioni indigene con l'obiettivo di rispondere a molte domande sul suo primo popolamento. Al momento c’è un consenso generale su alcune nozioni fondamentali come l'origine asiatica dei primi coloni, il loro ingresso dalla Siberia attraverso la Beringia durante l'Ultimo Glaciale Massimo e una rapida migrazione verso sud dei primi uomini fino alla punta meridionale del continente come testimoniano vari siti archeologici. migliaia di anni dopo da due ulteriori introgressioni genetiche minori e limitate alla regione artica hanno seguito il primo ingresso: la Saqqaq/Dorset Paleo-Eskimo e la Neo-Eskimo, 4.5k e 2k anni fa. Quando si cerca di far luce su eventi migratori e demografici più dettagliati all'interno del continente americano, le informazioni sono scarse. Un ostacolo nel chiarire la storia genetica di questo continente è la scarsità di informationi sul pool genetico indigeno imputabile all'impatto deleterio che la colonizzazione europea ha avuto sugli autoctoni. Questi eventi determinarono una drastica riduzione degli Indigeni a causa di guerre e malattie e una diminuzione del pool genetico dei nativi americani, soprattutto per quello del cromosoma Y, causata del differente declino della popolazione nativa maschile e femminile. Per questo motivo, la maggior parte delle informazioni ottenute sulle popolazioni native derivano dall'analisi del mitogenoma e da analisi whole-genome. Tuttavia, nonostante le difficoltà incontrate nell'identificazione delle linee fondatrici maschili dei nativi americani, importanti dettagli demografici e socioculturali sulla storia genetica di questo continente possono essere colte integrando queste informazioni con uno studio dettagliato della variazione del cromosoma Y.L'analisi della sua variazione in questo continente è complicata dall'eterogeneità dei marker analizzati e delle regioni indagate dai diversi studi in letteratura. Infatti, sebbene sia stata stabilita uno standard per il sequenziamento del cromosoma Y, spesso lavori diversi analizzano porzioni diverse dell'MSY, rendendo difficile combinare dati provenienti da fonti diverse. In questo lavoro i dati del cromosoma Y da diversi studi sono stati combinati per costruire una filogenesi completa degli aplogruppi del cromosoma Y Americano. Per creare il nostro dataset, abbiamo sviluppato una pipeline che includeva diversi passaggi atti a evitare distorsioni causate dalle differenze metodologiche nei lavori originali, tra cui uno stretto filtraggio di qualità degli allineamenti originali e l'impiego dell'imputazione dei dati mancanti in modo automatico e manuale. Con l'organizzazione filogenetica di un set di dati di ~700 campioni nativi americani non solo abbiamo confermato la struttura principale dei due rami nativi americani del cromosoma Y (C e Q), ma abbiamo anche migliorato la loro risoluzione. Inoltre, l'analisi della loro distribuzione geografica e di molte sotto-linee ha consentito di identificare:Parallelismi tra la distribuzione geografica delle linee Q-Z780, Q-M848 e C-MPB373 nella loro migrazione in Sud America verso il cono meridionale;Distribuzione e tempi di separazione simili caratterizzanti le linee Q-Y4276 e C-P39, imputabili ad un’entrata condivisa, probabilmente attraverso l’”Ice-free corridor”; Tracce di linee del cromosoma Y persi o estinti che hanno in Nord America, causati forse una maggiore diversità dei primi coloni americani che è stata successivamente per lo più persa.

When modern human migrated out of the Africa ~100 thousand years ago and consequently spread all around the world, the last continent to be colonised by modern human was the Americas. For decades, scientists have collected genomic information from Indigenous peoples with the goal of unravelling many questions about its first peopling. Now, a general agreement exists about some fundamental notions such as the Asian origin of the first settlers, their entrance from Siberia across Beringia during the Last Glacial Maximum as well as a rapid southward migration of the first colonizers reaching the southern cone of the continent as testified by archaeological sites. This first entrance was followed thousands of years later by two additional minor gene introgressions restricted to the Arctic region: the Saqqaq/Dorset Paleo-Eskimo and the Thule-related Neo-Eskimo waves, ~4.5 and ~2 thousand years ago respectively. When trying to shed light on more precise or local migratory and demographic events inside the American continent, information is still insufficient. One obstacle in clarifying the genetic history of this continent is the lack of detailed information on the Indigenous gene pool imputable to the impact that the European colonization had on the autochthonous populations. These events determined a dramatically reduction of the Indigenous people due to wars and diseases and a decrease of the Native American gene pool, especially for that of Y chromosome, due to the uneven male/female native population decline. For this reason, most of the information obtained on Native populations derived from mitogenome analysis and nuclear genome-wide analysis. However, despite the difficulties encountered in the identification of the male-specific Native American founding lineages, important demographic and sociocultural details on the genetic history of this continent can only derive by integrating this information with a detailed study of the Y-chromosome variation. Analysing the male variation in this continent is complicated by to the heterogeneity of the markers analysed and regions investigated by the different studies available in literature. Indeed, although a standard region for the sequencing of the Y-chromosome has been established, different works frequently analyse different portions of the MSY, making difficult to combine data from different sources. In this work the Y chromosomal data from several studies were combined to construct a complete phylogeny of Native American Y-chromosome haplogroups. To create our dataset, we developed a pipeline that included several steps to avoid bias caused by the differences in the original work methodologies, including a strict quality filtering of the original sequence alignments and the employment of the imputation of the missing data by automatic and manual With the phylogenetic organization of a dataset of ~700 Native American samples we not only confirmed the main structure of the two Native American branches of the Y chromosome (haplogroups C and Q), but also improved their resolution. In addition, the analysis of their geographic distribution and of many sub-branches allowed the identification of: a parallelism between the geographical distribution of the lineages Q-Z780, Q-M848 and C-MPB373 in their migration in South America towards the southern cone; a similar distribution and splitting times characterizing Q-Y4276 and C-P39, suggesting a shared entrance likely through the internal ice-free corridor; traces of extinct or unsuccessful Y-chromosome lineages which reached North America, suggesting a higher diversity of the first American settlers that was subsequently mostly lost Alongside the interesting results, this work reveals the necessity for a more complete sampling of the Native American populations, which would allow a deeper understanding of the history of the American lineages and, a better definition of their evolutionary history on both a larger and smaller scale.

Phylogenetic analysis of modern and ancient Native Americans' Y-chromosome sequences.

TRAVERSO, LUCA
2019/2020

Abstract

Quando l'uomo moderno emigrò dall'Africa circa 10000 anni fa e conseguentemente si occupò il resto del mondo, l'ultimo continente che colonizzò furono le Americhe. Per decenni gli scienziati hanno raccolto informazioni genomiche dalle popolazioni indigene con l'obiettivo di rispondere a molte domande sul suo primo popolamento. Al momento c’è un consenso generale su alcune nozioni fondamentali come l'origine asiatica dei primi coloni, il loro ingresso dalla Siberia attraverso la Beringia durante l'Ultimo Glaciale Massimo e una rapida migrazione verso sud dei primi uomini fino alla punta meridionale del continente come testimoniano vari siti archeologici. migliaia di anni dopo da due ulteriori introgressioni genetiche minori e limitate alla regione artica hanno seguito il primo ingresso: la Saqqaq/Dorset Paleo-Eskimo e la Neo-Eskimo, 4.5k e 2k anni fa. Quando si cerca di far luce su eventi migratori e demografici più dettagliati all'interno del continente americano, le informazioni sono scarse. Un ostacolo nel chiarire la storia genetica di questo continente è la scarsità di informationi sul pool genetico indigeno imputabile all'impatto deleterio che la colonizzazione europea ha avuto sugli autoctoni. Questi eventi determinarono una drastica riduzione degli Indigeni a causa di guerre e malattie e una diminuzione del pool genetico dei nativi americani, soprattutto per quello del cromosoma Y, causata del differente declino della popolazione nativa maschile e femminile. Per questo motivo, la maggior parte delle informazioni ottenute sulle popolazioni native derivano dall'analisi del mitogenoma e da analisi whole-genome. Tuttavia, nonostante le difficoltà incontrate nell'identificazione delle linee fondatrici maschili dei nativi americani, importanti dettagli demografici e socioculturali sulla storia genetica di questo continente possono essere colte integrando queste informazioni con uno studio dettagliato della variazione del cromosoma Y.L'analisi della sua variazione in questo continente è complicata dall'eterogeneità dei marker analizzati e delle regioni indagate dai diversi studi in letteratura. Infatti, sebbene sia stata stabilita uno standard per il sequenziamento del cromosoma Y, spesso lavori diversi analizzano porzioni diverse dell'MSY, rendendo difficile combinare dati provenienti da fonti diverse. In questo lavoro i dati del cromosoma Y da diversi studi sono stati combinati per costruire una filogenesi completa degli aplogruppi del cromosoma Y Americano. Per creare il nostro dataset, abbiamo sviluppato una pipeline che includeva diversi passaggi atti a evitare distorsioni causate dalle differenze metodologiche nei lavori originali, tra cui uno stretto filtraggio di qualità degli allineamenti originali e l'impiego dell'imputazione dei dati mancanti in modo automatico e manuale. Con l'organizzazione filogenetica di un set di dati di ~700 campioni nativi americani non solo abbiamo confermato la struttura principale dei due rami nativi americani del cromosoma Y (C e Q), ma abbiamo anche migliorato la loro risoluzione. Inoltre, l'analisi della loro distribuzione geografica e di molte sotto-linee ha consentito di identificare:Parallelismi tra la distribuzione geografica delle linee Q-Z780, Q-M848 e C-MPB373 nella loro migrazione in Sud America verso il cono meridionale;Distribuzione e tempi di separazione simili caratterizzanti le linee Q-Y4276 e C-P39, imputabili ad un’entrata condivisa, probabilmente attraverso l’”Ice-free corridor”; Tracce di linee del cromosoma Y persi o estinti che hanno in Nord America, causati forse una maggiore diversità dei primi coloni americani che è stata successivamente per lo più persa.
2019
Analisi filogenetica di cromosomi Y di nativi americani da campioni antichi e moderni.
When modern human migrated out of the Africa ~100 thousand years ago and consequently spread all around the world, the last continent to be colonised by modern human was the Americas. For decades, scientists have collected genomic information from Indigenous peoples with the goal of unravelling many questions about its first peopling. Now, a general agreement exists about some fundamental notions such as the Asian origin of the first settlers, their entrance from Siberia across Beringia during the Last Glacial Maximum as well as a rapid southward migration of the first colonizers reaching the southern cone of the continent as testified by archaeological sites. This first entrance was followed thousands of years later by two additional minor gene introgressions restricted to the Arctic region: the Saqqaq/Dorset Paleo-Eskimo and the Thule-related Neo-Eskimo waves, ~4.5 and ~2 thousand years ago respectively. When trying to shed light on more precise or local migratory and demographic events inside the American continent, information is still insufficient. One obstacle in clarifying the genetic history of this continent is the lack of detailed information on the Indigenous gene pool imputable to the impact that the European colonization had on the autochthonous populations. These events determined a dramatically reduction of the Indigenous people due to wars and diseases and a decrease of the Native American gene pool, especially for that of Y chromosome, due to the uneven male/female native population decline. For this reason, most of the information obtained on Native populations derived from mitogenome analysis and nuclear genome-wide analysis. However, despite the difficulties encountered in the identification of the male-specific Native American founding lineages, important demographic and sociocultural details on the genetic history of this continent can only derive by integrating this information with a detailed study of the Y-chromosome variation. Analysing the male variation in this continent is complicated by to the heterogeneity of the markers analysed and regions investigated by the different studies available in literature. Indeed, although a standard region for the sequencing of the Y-chromosome has been established, different works frequently analyse different portions of the MSY, making difficult to combine data from different sources. In this work the Y chromosomal data from several studies were combined to construct a complete phylogeny of Native American Y-chromosome haplogroups. To create our dataset, we developed a pipeline that included several steps to avoid bias caused by the differences in the original work methodologies, including a strict quality filtering of the original sequence alignments and the employment of the imputation of the missing data by automatic and manual With the phylogenetic organization of a dataset of ~700 Native American samples we not only confirmed the main structure of the two Native American branches of the Y chromosome (haplogroups C and Q), but also improved their resolution. In addition, the analysis of their geographic distribution and of many sub-branches allowed the identification of: a parallelism between the geographical distribution of the lineages Q-Z780, Q-M848 and C-MPB373 in their migration in South America towards the southern cone; a similar distribution and splitting times characterizing Q-Y4276 and C-P39, suggesting a shared entrance likely through the internal ice-free corridor; traces of extinct or unsuccessful Y-chromosome lineages which reached North America, suggesting a higher diversity of the first American settlers that was subsequently mostly lost Alongside the interesting results, this work reveals the necessity for a more complete sampling of the Native American populations, which would allow a deeper understanding of the history of the American lineages and, a better definition of their evolutionary history on both a larger and smaller scale.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per contatti: unitesi@unipv.it

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/12212