"In the recent years, ESG (Environmental, Social, Governance) themes have seen their role increasing with international and European entities releasing several initiatives to encourage the adoption of sustainability practices by companies and the disclosure of their performance regarding environmental, social and governance aspects of their business activities. In this new scenario, hugely centered around the concept of sustainable finance, ESG metrics have assumed a key role as they provide investors with a benchmark to evaluate the risks and opportunities linked to their different investment opportunities. However, there is still uncertainty revolving around the ESG scores. Indeed, it is unclear which are the determinants of such ESG metrics. In particular, the extent to which traditional financial variables or sectoral affiliation can explain firms’ sustainability performance is still subject to debate. This thesis investigates the predictability and determinants of the Bloomberg ESG score for a sample of 600 European firms included in the STOXX Europe 600 index. The analysis applies a range of machine learning techniques, including linear regression, logistic regression, regression trees, random forests, gradient boosting, and neural networks, to predict the ESG score and its three individual components (E, S, and G), using financial variables and sectoral dummies as explanatory features. The study pursues two main objectives: first, to evaluate the predictive performance of different models; and second, to assess their interpretability to identify the key drivers of ESG performance. Model performance is evaluated through out-of-sample metrics while interpretability is examined using both model-specific approaches and SHAP values. Moreover, a bootstrap out-of-bag procedure is applied to verify the robustness of the results of both predictive performance and interpretability. The results show that the overall ESG score, as well as the social and governance components, exhibit limited predictability based on the selected variables. In contrast, the environmental score demonstrates higher predictive accuracy and a more stable interpretability structure. Tree-based models, particularly gradient boosting, consistently outperform alternative approaches, highlighting the importance of non-linear relationships. By the way, the general findings suggest that ESG scores, especially the social and governance dimensions, are difficult to explain through firms’ economic characteristics and their sectoral affiliation while they also outline the importance of the methodology’s choice."

"Negli ultimi anni, le tematiche ESG (ambientali, sociali e di governance) hanno assunto un ruolo sempre più rilevante, con enti internazionali ed europei che hanno lanciato diverse iniziative per incoraggiare l'adozione di pratiche di sostenibilità da parte delle imprese e la divulgazione delle loro performance in relazione agli aspetti ambientali, sociali e di governance delle loro attività. In questo nuovo scenario, fortemente incentrato sul concetto di finanza sostenibile, le metriche ESG hanno assunto un ruolo chiave, fornendo agli investitori un parametro di riferimento per valutare i rischi e le opportunità legati alle diverse opzioni di investimento. Tuttavia, permangono incertezze riguardo ai punteggi ESG. In particolare, non è chiaro quali siano i fattori determinanti di tali metriche. Nello specifico, la misura in cui le variabili finanziarie tradizionali o l'appartenenza a un settore specifico possano spiegare le performance di sostenibilità delle imprese è ancora oggetto di dibattito. Questa tesi indaga la prevedibilità e i fattori determinanti del punteggio ESG di Bloomberg per un campione di 600 imprese europee incluse nell'indice STOXX Europe 600. L'analisi applica una serie di tecniche di apprendimento automatico, tra cui regressione lineare, regressione logistica, alberi di regressione, random forest, gradient boosting e reti neurali, per prevedere il punteggio ESG e le sue tre componenti individuali (E, S e G), utilizzando variabili finanziarie e variabili dummy settoriali come caratteristiche esplicative. Lo studio persegue due obiettivi principali: in primo luogo, valutare le prestazioni predittive di diversi modelli; in secondo luogo, valutarne l'interpretabilità per identificare i fattori chiave delle prestazioni ESG. Le prestazioni del modello vengono valutate tramite metriche out-of-sample, mentre l'interpretabilità viene esaminata utilizzando sia approcci specifici del modello che valori SHAP. Inoltre, viene applicata una procedura bootstrap out-of-bag per verificare la robustezza dei risultati sia delle prestazioni predittive che dell'interpretabilità. I ​​risultati mostrano che il punteggio ESG complessivo, così come le componenti sociale e di governance, presentano una prevedibilità limitata sulla base delle variabili selezionate. Al contrario, il punteggio ambientale dimostra una maggiore accuratezza predittiva e una struttura di interpretabilità più stabile. I modelli basati su alberi, in particolare il gradient boosting, superano costantemente gli approcci alternativi, evidenziando l'importanza delle relazioni non lineari. Tra l'altro, i risultati generali suggeriscono che i punteggi ESG, in particolare le dimensioni sociali e di governance, sono difficili da spiegare attraverso le caratteristiche economiche delle imprese e la loro appartenenza settoriale, e sottolineano al contempo l'importanza della scelta metodologica."

"Performance ESG e Finanziarie: un'Analisi di Machine Learning sulle Imprese Europee"

ZATTI, GUGLIELMO
2024/2025

Abstract

"In the recent years, ESG (Environmental, Social, Governance) themes have seen their role increasing with international and European entities releasing several initiatives to encourage the adoption of sustainability practices by companies and the disclosure of their performance regarding environmental, social and governance aspects of their business activities. In this new scenario, hugely centered around the concept of sustainable finance, ESG metrics have assumed a key role as they provide investors with a benchmark to evaluate the risks and opportunities linked to their different investment opportunities. However, there is still uncertainty revolving around the ESG scores. Indeed, it is unclear which are the determinants of such ESG metrics. In particular, the extent to which traditional financial variables or sectoral affiliation can explain firms’ sustainability performance is still subject to debate. This thesis investigates the predictability and determinants of the Bloomberg ESG score for a sample of 600 European firms included in the STOXX Europe 600 index. The analysis applies a range of machine learning techniques, including linear regression, logistic regression, regression trees, random forests, gradient boosting, and neural networks, to predict the ESG score and its three individual components (E, S, and G), using financial variables and sectoral dummies as explanatory features. The study pursues two main objectives: first, to evaluate the predictive performance of different models; and second, to assess their interpretability to identify the key drivers of ESG performance. Model performance is evaluated through out-of-sample metrics while interpretability is examined using both model-specific approaches and SHAP values. Moreover, a bootstrap out-of-bag procedure is applied to verify the robustness of the results of both predictive performance and interpretability. The results show that the overall ESG score, as well as the social and governance components, exhibit limited predictability based on the selected variables. In contrast, the environmental score demonstrates higher predictive accuracy and a more stable interpretability structure. Tree-based models, particularly gradient boosting, consistently outperform alternative approaches, highlighting the importance of non-linear relationships. By the way, the general findings suggest that ESG scores, especially the social and governance dimensions, are difficult to explain through firms’ economic characteristics and their sectoral affiliation while they also outline the importance of the methodology’s choice."
2024
"ESG and Financial Performance: a Machine Learning Analysis on European Companies"
"Negli ultimi anni, le tematiche ESG (ambientali, sociali e di governance) hanno assunto un ruolo sempre più rilevante, con enti internazionali ed europei che hanno lanciato diverse iniziative per incoraggiare l'adozione di pratiche di sostenibilità da parte delle imprese e la divulgazione delle loro performance in relazione agli aspetti ambientali, sociali e di governance delle loro attività. In questo nuovo scenario, fortemente incentrato sul concetto di finanza sostenibile, le metriche ESG hanno assunto un ruolo chiave, fornendo agli investitori un parametro di riferimento per valutare i rischi e le opportunità legati alle diverse opzioni di investimento. Tuttavia, permangono incertezze riguardo ai punteggi ESG. In particolare, non è chiaro quali siano i fattori determinanti di tali metriche. Nello specifico, la misura in cui le variabili finanziarie tradizionali o l'appartenenza a un settore specifico possano spiegare le performance di sostenibilità delle imprese è ancora oggetto di dibattito. Questa tesi indaga la prevedibilità e i fattori determinanti del punteggio ESG di Bloomberg per un campione di 600 imprese europee incluse nell'indice STOXX Europe 600. L'analisi applica una serie di tecniche di apprendimento automatico, tra cui regressione lineare, regressione logistica, alberi di regressione, random forest, gradient boosting e reti neurali, per prevedere il punteggio ESG e le sue tre componenti individuali (E, S e G), utilizzando variabili finanziarie e variabili dummy settoriali come caratteristiche esplicative. Lo studio persegue due obiettivi principali: in primo luogo, valutare le prestazioni predittive di diversi modelli; in secondo luogo, valutarne l'interpretabilità per identificare i fattori chiave delle prestazioni ESG. Le prestazioni del modello vengono valutate tramite metriche out-of-sample, mentre l'interpretabilità viene esaminata utilizzando sia approcci specifici del modello che valori SHAP. Inoltre, viene applicata una procedura bootstrap out-of-bag per verificare la robustezza dei risultati sia delle prestazioni predittive che dell'interpretabilità. I ​​risultati mostrano che il punteggio ESG complessivo, così come le componenti sociale e di governance, presentano una prevedibilità limitata sulla base delle variabili selezionate. Al contrario, il punteggio ambientale dimostra una maggiore accuratezza predittiva e una struttura di interpretabilità più stabile. I modelli basati su alberi, in particolare il gradient boosting, superano costantemente gli approcci alternativi, evidenziando l'importanza delle relazioni non lineari. Tra l'altro, i risultati generali suggeriscono che i punteggi ESG, in particolare le dimensioni sociali e di governance, sono difficili da spiegare attraverso le caratteristiche economiche delle imprese e la loro appartenenza settoriale, e sottolineano al contempo l'importanza della scelta metodologica."
File in questo prodotto:
File Dimensione Formato  
Guglielmo_Zatti_Tesi_Magistrale_Finance_Aprile_2026.pdf

accesso aperto

Descrizione: Tesi di Laurea Magistrale in Finance
Dimensione 2.82 MB
Formato Adobe PDF
2.82 MB Adobe PDF Visualizza/Apri

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: [email protected].

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/34844