The ESG score represents a standard to evaluate companies that is increasingly popular. It shows how a company is performing from environmental, social and governance points of view and it is constantly monitored by the stakeholders. Nowadays it is widely diffused the belief according to which the mere profitability of companies is no more sufficient to justify an investment choice, but other factors need to be considered. ESG scores comprehend some of those factors. The ESG scores are published by rating agencies, which calculate them in a way that makes it possible to consider many variables, even ones not easily measurable, such as the compliance with determined standards in waste management, or the level of corruption within the company. The drawback of the construction of such a complex score is related to the fact that it is not always easy to understand which are the main drivers of a good ESG performance. Thus, with this work we tried to predict ESG scores by using only balance sheet metrics as explanatory variables, which represent data publicly available. We explored a dataset composed by companies that are part of the STOXX Europe 600. To conduct our work, we applied explainable machine learning models, which have been elaborated by using the Python programming language. In particular, the explainability of the models has been obtained by elaborating the Shapley-Lorenz marginal contributions of explanatory variables. Thanks to this method, we found that the net sales and EBIT are the most important variables to predict the magnitude of an ESG score. With this dissertation we aim to provide the stakeholders with a reliable methodology that makes it possible to know the ESG score of a determined company even without knowing in advance the technical data related to that score (that usually are fully known only by the rating agencies). With our study we are confident about the fact that the methodology implemented could also be executed in other research fields.

Il punteggio ESG rappresenta uno standard di valutazione per le aziende che sta diventando sempre più popolare. Esso illustra le performance di un'azienda dal punto di vista ambientale, sociale e di governance ed è costantemente monitorato dagli stakeholder. Al giorno d’oggi è ampiamente diffusa l’idea secondo cui la mera redditività delle imprese non sia più sufficiente a giustificare una scelta di investimento, ma è necessario considerare ulteriori fattori. I punteggi ESG comprendono alcuni di questi fattori. I punteggi ESG sono pubblicati dalle agenzie di rating, che li calcolano in modo da poter considerare molte variabili, tra cui rientrano anche alcune non facilmente misurabili, come ad esempio il rispetto di determinati standard nella gestione dei rifiuti prodotti o il livello di corruzione all'interno dell'azienda. Lo svantaggio della costruzione di uno score così complesso è legato al fatto che non è sempre facile capire quali siano i principali driver di una buona performance ESG. Pertanto, con questo lavoro si è cercato di prevedere i punteggi ESG utilizzando unicamente le metriche di bilancio come variabili esplicative, che rappresentano dati che sono pubblici. Abbiamo esplorato un set di dati composto da aziende che fanno parte dello STOXX Europe 600. Per condurre il nostro lavoro, abbiamo utilizzato modelli spiegabili di machine-learning, che sono stati elaborati utilizzando il linguaggio di programmazione Python. In particolare, la spiegabilità dei modelli è stata ottenuta tramite il calcolo dei valori Shapley-Lorenz relativi ai contributi marginali delle variabili esplicative. Tramite questa metodologia possiamo evincere che i ricavi di vendita e l'EBIT siano le variabili più importanti per prevedere l'entità di un punteggio ESG. Con la presente dissertazione miriamo a fornire una metodologia affidabile che permetta di conoscere il punteggio ESG di una determinata azienda anche non essendo a conoscenza dei dati tecnici relativi a tale punteggio (che di solito sono pienamente conosciuti solo dalle agenzie di rating). Con il nostro studio siamo fiduciosi del fatto che la metodologia implementata potrebbe essere applicata anche in altri campi di ricerca.

Explainable Machine Learning to predict ESG scores

DI BUDUO, RICCARDO
2021/2022

Abstract

The ESG score represents a standard to evaluate companies that is increasingly popular. It shows how a company is performing from environmental, social and governance points of view and it is constantly monitored by the stakeholders. Nowadays it is widely diffused the belief according to which the mere profitability of companies is no more sufficient to justify an investment choice, but other factors need to be considered. ESG scores comprehend some of those factors. The ESG scores are published by rating agencies, which calculate them in a way that makes it possible to consider many variables, even ones not easily measurable, such as the compliance with determined standards in waste management, or the level of corruption within the company. The drawback of the construction of such a complex score is related to the fact that it is not always easy to understand which are the main drivers of a good ESG performance. Thus, with this work we tried to predict ESG scores by using only balance sheet metrics as explanatory variables, which represent data publicly available. We explored a dataset composed by companies that are part of the STOXX Europe 600. To conduct our work, we applied explainable machine learning models, which have been elaborated by using the Python programming language. In particular, the explainability of the models has been obtained by elaborating the Shapley-Lorenz marginal contributions of explanatory variables. Thanks to this method, we found that the net sales and EBIT are the most important variables to predict the magnitude of an ESG score. With this dissertation we aim to provide the stakeholders with a reliable methodology that makes it possible to know the ESG score of a determined company even without knowing in advance the technical data related to that score (that usually are fully known only by the rating agencies). With our study we are confident about the fact that the methodology implemented could also be executed in other research fields.
2021
Explainable Machine Learning to predict ESG scores
Il punteggio ESG rappresenta uno standard di valutazione per le aziende che sta diventando sempre più popolare. Esso illustra le performance di un'azienda dal punto di vista ambientale, sociale e di governance ed è costantemente monitorato dagli stakeholder. Al giorno d’oggi è ampiamente diffusa l’idea secondo cui la mera redditività delle imprese non sia più sufficiente a giustificare una scelta di investimento, ma è necessario considerare ulteriori fattori. I punteggi ESG comprendono alcuni di questi fattori. I punteggi ESG sono pubblicati dalle agenzie di rating, che li calcolano in modo da poter considerare molte variabili, tra cui rientrano anche alcune non facilmente misurabili, come ad esempio il rispetto di determinati standard nella gestione dei rifiuti prodotti o il livello di corruzione all'interno dell'azienda. Lo svantaggio della costruzione di uno score così complesso è legato al fatto che non è sempre facile capire quali siano i principali driver di una buona performance ESG. Pertanto, con questo lavoro si è cercato di prevedere i punteggi ESG utilizzando unicamente le metriche di bilancio come variabili esplicative, che rappresentano dati che sono pubblici. Abbiamo esplorato un set di dati composto da aziende che fanno parte dello STOXX Europe 600. Per condurre il nostro lavoro, abbiamo utilizzato modelli spiegabili di machine-learning, che sono stati elaborati utilizzando il linguaggio di programmazione Python. In particolare, la spiegabilità dei modelli è stata ottenuta tramite il calcolo dei valori Shapley-Lorenz relativi ai contributi marginali delle variabili esplicative. Tramite questa metodologia possiamo evincere che i ricavi di vendita e l'EBIT siano le variabili più importanti per prevedere l'entità di un punteggio ESG. Con la presente dissertazione miriamo a fornire una metodologia affidabile che permetta di conoscere il punteggio ESG di una determinata azienda anche non essendo a conoscenza dei dati tecnici relativi a tale punteggio (che di solito sono pienamente conosciuti solo dalle agenzie di rating). Con il nostro studio siamo fiduciosi del fatto che la metodologia implementata potrebbe essere applicata anche in altri campi di ricerca.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/2089