This paper investigates the application of machine learning in credit rating. Through an extensive review of literature, it is found that the credit rating process necessitates the integration of machine learning techniques. Utilizing data from 1,559 Italian companies, the study addresses the issue of data imbalance through oversampling. Subsequently, seven active learning models are trained, with the Random Forest model identified as the most accurate predictor. It is also observed that deep learning algorithms generally yield favorable results, although artificial neural network models are susceptible to the influence of hardware performance, necessitating further enhancement. The paper further incorporates a feature importance analysis, highlighting the critical role of credit ratings and shareholders' funds in the credit assessment process in 2021. Additionally, a novel interpretability method, namely Rank Gradient Explainability (RGE), is introduced to enhance model transparency and credibility. The RGE method reveals that shareholders' funds are the most influential feature, and financial data from 2022 is the most critical across all financial years. Based on these findings, targeted recommendations are provided for credit rating agencies, operating companies, and financial researchers, emphasizing the importance and practical value of applying machine learning models to the credit rating system.

Questa ricerca esamina l'applicazione dell'apprendimento automatico nella valutazione del credito. Attraverso una revisione estensiva della letteratura, si è constatato che il processo di valutazione del credito richiede l'integrazione di tecniche di apprendimento automatico. Utilizzando dati provenienti da 1.559 aziende italiane, lo studio affronta il problema dell'imbalance dei dati attraverso il sovracampionamento. Successivamente, vengono addestrati sette modelli di apprendimento attivo, identificando il modello Random Forest come il predittore più accurato. Si osserva inoltre che gli algoritmi di deep learning producono generalmente risultati favorevoli, sebbene i modelli di reti neurali artificiali siano suscettibili all'influenza delle prestazioni hardware, richiedendo ulteriori miglioramenti. La ricerca include inoltre un'analisi dell'importanza delle caratteristiche, evidenziando il ruolo cruciale dei rating del credito e dei fondi dei soci nel processo di valutazione del credito nel 2021. Inoltre, viene introdotto un nuovo metodo di interpretazione, denominato Rank Gradient Explainability (RGE), per migliorare la trasparenza e la credibilità del modello. Il metodo RGE rivela che i fondi dei soci sono la caratteristica più influente e che i dati finanziari del 2022 sono i più critici tra tutti gli anni finanziari. Sulla base di queste scoperte, vengono fornite raccomandazioni mirate per le agenzie di rating del credito, le aziende operative e i ricercatori finanziari, sottolineando l'importanza e il valore pratico dell'applicazione dei modelli di apprendimento automatico al sistema di valutazione del credito.

APPLICATION OF MACHINE LEARNING MODELS IN CREDIT RATING ANALYSIS

ZHANG, CAOXUTONG
2023/2024

Abstract

This paper investigates the application of machine learning in credit rating. Through an extensive review of literature, it is found that the credit rating process necessitates the integration of machine learning techniques. Utilizing data from 1,559 Italian companies, the study addresses the issue of data imbalance through oversampling. Subsequently, seven active learning models are trained, with the Random Forest model identified as the most accurate predictor. It is also observed that deep learning algorithms generally yield favorable results, although artificial neural network models are susceptible to the influence of hardware performance, necessitating further enhancement. The paper further incorporates a feature importance analysis, highlighting the critical role of credit ratings and shareholders' funds in the credit assessment process in 2021. Additionally, a novel interpretability method, namely Rank Gradient Explainability (RGE), is introduced to enhance model transparency and credibility. The RGE method reveals that shareholders' funds are the most influential feature, and financial data from 2022 is the most critical across all financial years. Based on these findings, targeted recommendations are provided for credit rating agencies, operating companies, and financial researchers, emphasizing the importance and practical value of applying machine learning models to the credit rating system.
2023
APPLICATION OF MACHINE LEARNING MODELS IN CREDIT RATING ANALYSIS
Questa ricerca esamina l'applicazione dell'apprendimento automatico nella valutazione del credito. Attraverso una revisione estensiva della letteratura, si è constatato che il processo di valutazione del credito richiede l'integrazione di tecniche di apprendimento automatico. Utilizzando dati provenienti da 1.559 aziende italiane, lo studio affronta il problema dell'imbalance dei dati attraverso il sovracampionamento. Successivamente, vengono addestrati sette modelli di apprendimento attivo, identificando il modello Random Forest come il predittore più accurato. Si osserva inoltre che gli algoritmi di deep learning producono generalmente risultati favorevoli, sebbene i modelli di reti neurali artificiali siano suscettibili all'influenza delle prestazioni hardware, richiedendo ulteriori miglioramenti. La ricerca include inoltre un'analisi dell'importanza delle caratteristiche, evidenziando il ruolo cruciale dei rating del credito e dei fondi dei soci nel processo di valutazione del credito nel 2021. Inoltre, viene introdotto un nuovo metodo di interpretazione, denominato Rank Gradient Explainability (RGE), per migliorare la trasparenza e la credibilità del modello. Il metodo RGE rivela che i fondi dei soci sono la caratteristica più influente e che i dati finanziari del 2022 sono i più critici tra tutti gli anni finanziari. Sulla base di queste scoperte, vengono fornite raccomandazioni mirate per le agenzie di rating del credito, le aziende operative e i ricercatori finanziari, sottolineando l'importanza e il valore pratico dell'applicazione dei modelli di apprendimento automatico al sistema di valutazione del credito.
File in questo prodotto:
File Dimensione Formato  
APPLICATION OF MACHINE LEARNING MODELS IN CREDIT RATING ANALYSIS.pdf

accesso aperto

Dimensione 2.83 MB
Formato Adobe PDF
2.83 MB Adobe PDF Visualizza/Apri

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/27888