Evolutionary biology is a landmark in molecular biology and genetics. Indeed, conserved sequences, identical or highly similar nucleotidic sequences found across different species, have a crucial role in understanding all the molecular mechanisms related to gene expression regulation, biochemical pathways regulation, protein synthesis, diseases, and much more. For this reason, conservation analysis extensively investigated all those protein-coding genes involved in the most various cellular process across the phylogenetic tree. Exploring protein-coding gene sequences and protein structures evolutionary conserved has been essential to understanding their roles and functional domains. However, studying the conservation of splicing, the evolution of alternative splicing, and understanding not only the primary nucleotidic or protein sequences, but the conserved splicing-involved sequences is fundamental. Until our days, conservation analysis studies focused on protein-coding genes, but despite the great projects realized to sequence multiple genomes of different organisms, genome-wide studies across different species are still hindered by the quality, the quantity, and the differences in terms of annotations in the different genomes available. Nevertheless, this type of conservation analysis cannot be done assessing lncRNA genes since their poorly annotation in most species would hinder the conservation analysis. This work aims to assess multispecies conservation of GC-AG introns in protein-coding genes, finding examples of highly conserved genes that could possibly further characterize the description of the mechanisms in which they are involved, to assess wobble splicing events and their prevalence in human and mouse genomes in both protein-coding and lncRNA genes, to identify their putative impact on proteins and to study the conservation of wobble-splicing events in protein-coding genes in different organisms finding comprehensive examples in which GC-AG introns are involved.
La biologia evolutiva è un punto di riferimento per la biologia e per la genetica molecolare. Infatti, lo studio delle sequenze conservate, sequenze nucleotidiche identiche o molto simili che si trovano in specie diverse, hanno un ruolo cruciale nella comprensione di tutti i meccanismi molecolari legati alla regolazione dell'espressione genica, alla regolazione dei diversi pathways biochimici, alla sintesi proteica, alle malattie e molto altro. Per questo motivo, l'analisi della conservazione delle sequenze hanno analizzato a fondo tutti quei geni codificanti proteine coinvolti nei più vari processi cellulari attraverso l'albero filogenetico. L'analisi e lo studio delle sequenze geniche codificanti proteine e delle sequenze proteiche conservate durante l’evoluzione è stato essenziale per comprenderne i ruoli e i domini funzionali. Tuttavia, oggi, è fondamentale studiare la conservazione dello splicing, l'evoluzione dello splicing alternativo ed analizzare non solo le sequenze nucleotidiche o proteiche primarie, ma anche e soprattutto le sequenze coinvolte nello splicing che sono conservate anche in organismi filogeneticamente lontani. Fino ai nostri giorni, gli studi di analisi di conservazione si sono concentrati sui geni codificanti proteine, ma nonostante i grandi progetti realizzati per sequenziare più genomi di organismi diversi, gli studi genome-wide su specie diverse sono ancora ostacolati dalla qualità, dalla quantità e dalle differenze in termini di annotazione nei diversi genomi disponibili. Inoltre, questo tipo di analisi della conservazione non può essere eseguito valutando i lncRNAs poiché la loro scarsa annotazione nella maggior parte delle specie ostacolerebbe una completa analisi di conservazione. Questo lavoro mira a valutare la conservazione multispecie degli introni GC-AG in geni codificanti proteine, riportando esempi di geni altamente conservati che potrebbero caratterizzare ulteriormente la descrizione dei meccanismi in cui sono coinvolti, a valutare eventi di wobble splicing e la loro prevalenza nell'uomo e nel topo per i geni codificanti proteine e per i lncRNAs, ad identificare il loro presunto impatto sulle proteine e a studiare la conservazione degli eventi di wobble-splicing in geni codificanti proteine in diversi organismi riportando alcuni esempi esemplificativi in cui sono coinvolti gli introni GC-AG.
Analisi di conservazione multispecie di introni GC-AG e loro coinvolgimento nello splicing alternativo
BELOTTI, GIULIA
2019/2020
Abstract
Evolutionary biology is a landmark in molecular biology and genetics. Indeed, conserved sequences, identical or highly similar nucleotidic sequences found across different species, have a crucial role in understanding all the molecular mechanisms related to gene expression regulation, biochemical pathways regulation, protein synthesis, diseases, and much more. For this reason, conservation analysis extensively investigated all those protein-coding genes involved in the most various cellular process across the phylogenetic tree. Exploring protein-coding gene sequences and protein structures evolutionary conserved has been essential to understanding their roles and functional domains. However, studying the conservation of splicing, the evolution of alternative splicing, and understanding not only the primary nucleotidic or protein sequences, but the conserved splicing-involved sequences is fundamental. Until our days, conservation analysis studies focused on protein-coding genes, but despite the great projects realized to sequence multiple genomes of different organisms, genome-wide studies across different species are still hindered by the quality, the quantity, and the differences in terms of annotations in the different genomes available. Nevertheless, this type of conservation analysis cannot be done assessing lncRNA genes since their poorly annotation in most species would hinder the conservation analysis. This work aims to assess multispecies conservation of GC-AG introns in protein-coding genes, finding examples of highly conserved genes that could possibly further characterize the description of the mechanisms in which they are involved, to assess wobble splicing events and their prevalence in human and mouse genomes in both protein-coding and lncRNA genes, to identify their putative impact on proteins and to study the conservation of wobble-splicing events in protein-coding genes in different organisms finding comprehensive examples in which GC-AG introns are involved.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/12896