Le funzioni codificate da nuovi geni sono state sottorappresentate per molto tempo, tuttavia, questi nuovi geni stanno attualmente guadagnando attenzione e vengono presi di mira come potenziali geni candidati. Questo perché è stato scoperto che svolgono un ruolo chiave nei processi biologici cruciali, nel comportamento e nell'innovazione dei tratti fenotipici morfologici14. Per identificare questi nuovi geni candidati, ho optato per l'organismo modello Drosophila Melanogaster a causa del suo genoma semplice e dei circuiti genetici ben noti. Quindi ho scelto di utilizzare la genomica comparativa come strategia per consentirci di identificare questi nuovi geni, poiché è stato dimostrato che supera alcuni limiti associati all'approccio tradizionale all'identificazione dei geni candidati. Il campo della genomica comparativa ha presentato un approccio per identificare questi geni candidati putativi semplicemente confrontando i genomi2. In questo progetto ho eseguito analisi su sedici specie di mosche, nove mosche superiori e sette mosche inferiori. Un software di inferenza filogenetica noto come OrthoFinder è stato utilizzato per identificare geni con ortologhi presenti in tutte le mosche superiori ma senza ortologhi identificabili in tutte le mosche inferiori analizzate, classificando così quei geni selezionati come romanzo "evolutivo". Affinché un nuovo gene evolutivo potesse essere classificato come potenziale candidato, il gene doveva anche essere sostanzialmente espresso durante le prime sei ore di sviluppo embrionale. Quindi, ho anche curato un ampio elenco di profili di espressione di mRNA corrispondente a uno specifico punto temporale dello sviluppo, per ogni nuovo gene evolutivo identificato, con l'aiuto di database online pertinenti in modo da selezionare i candidati. In conclusione, partendo solo dalle sequenze proteiche di sedici specie di mosche e un totale di oltre 21.500 ortogruppi presenti, sono stato in grado di identificare 21 nuovi geni candidati evolutivi.
The functions encoded by novel genes have been underrepresented for a very long time however, these novel genes are currently gaining attention and being targeted as potential candidate genes. This is so because, they have been found to play a key role in crucial biological processes, behavior and the innovation of morphological phenotypic traits14. To identify these novel candidate genes, I opted for the model organism Drosophila Melanogaster due to its simple genome and well-known genetic circuitry. Then I chose to use comparative genomics as a strategy to enable us in the identification of these novel genes, as it has been proven to overcome certain limitations associated with the traditional approach to identifying candidate genes. The field of comparative genomics presented an approach to identify these putative candidate genes simply by comparing genomes2. In this project I ran analysis on sixteen fly species, nine higher flies and seven lower flies. A phylogenetic inference software known as OrthoFinder was used to identify genes with orthologs present in all higher flies but with no identifiable orthologs in all lower flies analyzed, thus classifying those selected genes as “evolutionary” novel. For an evolutionary novel gene to be classified as a potential candidate, the gene also had to substantially expressed during the first six hours of embryonic development. Hence, I also curated an extensive mRNA expression profile list corresponding to a specific developmental time point, for each evolutionary novel gene identified, with the help of relevant online databases so as to select candidates. In conclusion, starting with just the protein sequences of sixteen fly species and a total of over 21,500 orthogroups present, I was able to identify 21 evolutionary novel candidate genes.
Uno schermo genetico in silico per l'identificazione del romanzo geni.
AFANGA, MIRIAM KUKU
2019/2020
Abstract
Le funzioni codificate da nuovi geni sono state sottorappresentate per molto tempo, tuttavia, questi nuovi geni stanno attualmente guadagnando attenzione e vengono presi di mira come potenziali geni candidati. Questo perché è stato scoperto che svolgono un ruolo chiave nei processi biologici cruciali, nel comportamento e nell'innovazione dei tratti fenotipici morfologici14. Per identificare questi nuovi geni candidati, ho optato per l'organismo modello Drosophila Melanogaster a causa del suo genoma semplice e dei circuiti genetici ben noti. Quindi ho scelto di utilizzare la genomica comparativa come strategia per consentirci di identificare questi nuovi geni, poiché è stato dimostrato che supera alcuni limiti associati all'approccio tradizionale all'identificazione dei geni candidati. Il campo della genomica comparativa ha presentato un approccio per identificare questi geni candidati putativi semplicemente confrontando i genomi2. In questo progetto ho eseguito analisi su sedici specie di mosche, nove mosche superiori e sette mosche inferiori. Un software di inferenza filogenetica noto come OrthoFinder è stato utilizzato per identificare geni con ortologhi presenti in tutte le mosche superiori ma senza ortologhi identificabili in tutte le mosche inferiori analizzate, classificando così quei geni selezionati come romanzo "evolutivo". Affinché un nuovo gene evolutivo potesse essere classificato come potenziale candidato, il gene doveva anche essere sostanzialmente espresso durante le prime sei ore di sviluppo embrionale. Quindi, ho anche curato un ampio elenco di profili di espressione di mRNA corrispondente a uno specifico punto temporale dello sviluppo, per ogni nuovo gene evolutivo identificato, con l'aiuto di database online pertinenti in modo da selezionare i candidati. In conclusione, partendo solo dalle sequenze proteiche di sedici specie di mosche e un totale di oltre 21.500 ortogruppi presenti, sono stato in grado di identificare 21 nuovi geni candidati evolutivi.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/12159