The construction of a reliable structural model of proteins is based on experimental data that, in accordance with the generated model, are archived and made publicly available through the Protein Data Bank (PDB) database. However, there often results an obvious difference between known protein sequences and experimentally determined structures due to difficulties associated with structure resolution. Continued advances in theoretical protein modeling may, however, provide a potential resolution to this issue. In fact, until recently, no efficient and accurate tools were available that could provide a reliable prediction of the three-dimensional model of a protein, and this also depended on the enormous variability present during protein folding. Alphafold2 is an artificial intelligence model, developed by 2020, that has been able to increase the reliability of theoretical modeling of protein structures. To this end, the goal of this master's thesis work was to validate the potential of Alphafold2 by expression and purification of Pseudoalteromonas spp. esterase A, a widely characterized enzyme. At the end of this procedure, the enzymatic activity of EstA was evaluated by a chromogenic assay. In parallel, the same analyses were also carried out on eleven different mutants of the protein, randomly generated in collaboration with Prof. Colombo, in order to assess any differences in the activity of the enzyme, compared with the wild type. This preliminary study indeed showed reduced enzyme activity of the mutated protein IV compared to the wild type. However, further in-depth studies are needed to optimize the purification protocols used, in order to evaluate the activity of the remaining mutants.

La costruzione di un modello strutturale affidabile delle proteine si basa su dati sperimentali che, in accordo con il modello generato, vengono archiviati e resi pubblicamente disponibili attraverso il database Protein Data Bank (PDB). Tuttavia, spesso risulta un’evidente differenza tra le sequenze proteiche note e le strutture determinate sperimentalmente a causa delle difficoltà legate alla risoluzione delle strutture. I continui progressi del modeling teorico delle proteine possono, però, costituire una potenziale risoluzione a tale problematica. Infatti, fino a poco tempo fa, non erano disponibili strumenti efficienti ed accurati, in grado di fornire una predizione affidabile del modello tridimensionale di una proteina e ciò dipendeva anche dall’enorme variabilità presente durante il ripiegamento proteico. Alphafold2 è un modello di intelligenza artificiale, sviluppato dal 2020, che ha permesso di incrementare l’affidabilità del modeling teorico delle strutture proteiche. A tale scopo, l’obiettivo del presente lavoro di tesi magistrale è stato quello di validare le potenzialità di Alphafold2, mediante l’espressione e la purificazione dell’Esterasi A di Pseudoalteromonas spp., un enzima ampiamente caratterizzato. Al termine di tale procedura, è stata valutata l’attività enzimatica di EstA mediante un saggio cromogenico. In parallelo, le stesse analisi sono state svolte anche su undici differenti mutanti della proteina, generati randomicamente in collaborazione con il Prof. Colombo, al fine di valutare eventuali differenze nell’attività dell’enzima, rispetto al wild type. Questo studio preliminare ha effettivamente mostrato una ridotta attività enzimatica della proteina mutata IV rispetto al wild type. Tuttavia, sono necessari ulteriori approfonditi studi di ottimizzazione dei protocolli di purificazione adoperati, al fine di valutare l’attività dei mutanti restanti. 

Produzione e analisi delle performance di varianti della proteina EstA, ottenute tramite algoritmi di Intelligenza Artificiale

IRACI, ANTONINO SAMUELE
2022/2023

Abstract

The construction of a reliable structural model of proteins is based on experimental data that, in accordance with the generated model, are archived and made publicly available through the Protein Data Bank (PDB) database. However, there often results an obvious difference between known protein sequences and experimentally determined structures due to difficulties associated with structure resolution. Continued advances in theoretical protein modeling may, however, provide a potential resolution to this issue. In fact, until recently, no efficient and accurate tools were available that could provide a reliable prediction of the three-dimensional model of a protein, and this also depended on the enormous variability present during protein folding. Alphafold2 is an artificial intelligence model, developed by 2020, that has been able to increase the reliability of theoretical modeling of protein structures. To this end, the goal of this master's thesis work was to validate the potential of Alphafold2 by expression and purification of Pseudoalteromonas spp. esterase A, a widely characterized enzyme. At the end of this procedure, the enzymatic activity of EstA was evaluated by a chromogenic assay. In parallel, the same analyses were also carried out on eleven different mutants of the protein, randomly generated in collaboration with Prof. Colombo, in order to assess any differences in the activity of the enzyme, compared with the wild type. This preliminary study indeed showed reduced enzyme activity of the mutated protein IV compared to the wild type. However, further in-depth studies are needed to optimize the purification protocols used, in order to evaluate the activity of the remaining mutants.
2022
Producing and characterising EstA protein variants, achieved through artificial intelligence algorithms
La costruzione di un modello strutturale affidabile delle proteine si basa su dati sperimentali che, in accordo con il modello generato, vengono archiviati e resi pubblicamente disponibili attraverso il database Protein Data Bank (PDB). Tuttavia, spesso risulta un’evidente differenza tra le sequenze proteiche note e le strutture determinate sperimentalmente a causa delle difficoltà legate alla risoluzione delle strutture. I continui progressi del modeling teorico delle proteine possono, però, costituire una potenziale risoluzione a tale problematica. Infatti, fino a poco tempo fa, non erano disponibili strumenti efficienti ed accurati, in grado di fornire una predizione affidabile del modello tridimensionale di una proteina e ciò dipendeva anche dall’enorme variabilità presente durante il ripiegamento proteico. Alphafold2 è un modello di intelligenza artificiale, sviluppato dal 2020, che ha permesso di incrementare l’affidabilità del modeling teorico delle strutture proteiche. A tale scopo, l’obiettivo del presente lavoro di tesi magistrale è stato quello di validare le potenzialità di Alphafold2, mediante l’espressione e la purificazione dell’Esterasi A di Pseudoalteromonas spp., un enzima ampiamente caratterizzato. Al termine di tale procedura, è stata valutata l’attività enzimatica di EstA mediante un saggio cromogenico. In parallelo, le stesse analisi sono state svolte anche su undici differenti mutanti della proteina, generati randomicamente in collaborazione con il Prof. Colombo, al fine di valutare eventuali differenze nell’attività dell’enzima, rispetto al wild type. Questo studio preliminare ha effettivamente mostrato una ridotta attività enzimatica della proteina mutata IV rispetto al wild type. Tuttavia, sono necessari ulteriori approfonditi studi di ottimizzazione dei protocolli di purificazione adoperati, al fine di valutare l’attività dei mutanti restanti. 
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/16379