The aim of this thesis is the study of the macroeconomic determinants of the gold price and the dynamic of its evolution is studied by employing econometric and machine learning techniques, respectively the OLS model and the Support Vector Regression model. In order to identify its macroeconomic drivers, I built on the reports of the World Gold Council, the authority on gold, which point out that gold price depends on wealth and economic expansion, market risk and uncertainty, opportunity cost, momentum and positioning. They also point out the nature of gold as an investment and consumer good, performing well both in periods of crisis and good times. As previously mentioned, I employed the OLS model, that is still one of the most popular technique for regression analysis, and the Support Vector Machine algorithm. The latter is very useful for classification and regression of pattern, since it provides a powerful prediction model that accounts for non-linearity in the data. I made use of the Support Vector Regression, that works on the same principles as the SVM classification, but for regression problems. In particular, the SVM is used when the dependent variable is categorical, the SVR when it is numerical. A benefit of the SVR is that it does not depend on the distribution of the variables, unlike the OLS, that rests on Gauss-Markov assumptions, and permits for construction of non linear models without changing the regressors. The SVR is coupled with three types of kernel (linear, radial basis function and polynomial) that permit to deal with non-linear patterns in the data. The two techniques have been used to develop four models as functions of the lagged value of gold price, the GDP of the OECD, the world inflation, the corporate bond yields, the economic policy uncertainty index and the US treasury debt. The dataset contains 252 monthly observations spanning from January 1st 2000 to December 1st 2020. The results points out that the lagged value of the price 1 of gold has not a statistically significant impact on gold returns, hence the effect of the past on today’s return has been eliminated, and neither the GDP growth coefficient is statistically significant. Instead the world inflation is positively linked to gold returns and this confirms its status as an hedge against inflation, while the BAA corporate bond yields turned out to be negatively related to gold returns. The Global Economic Policy Uncertainty index (GEPU) has a positive effect on gold, and this signals its status as a safe haven asset, and lastly, between the US treasury debt and gold returns there is a positive relationship, since the growth of the public debt proxies economic instability. The accuracy of the models has been assessed by means of the RSME, the MAE, and an index that I constructed in order to grasp the percentage of times the predicted variation was of the same sign as the actual one. The models turned out to be very similar, however the SVR model coupled with the linear kernel has been the most suitable for predicting gold returns given the macroeconomic parameters taken into consideration. My study shows that the peculiarity of gold of being both a consumer good and an investment, that backs portfolios in periods of meltdown, has important implications for investors.

Lo scopo di questa tesi è lo studio delle determinanti macroeconomiche del prezzo dell'oro e la dinamica della sua evoluzione è studiata per mezzo di tecniche econometriche e di apprendimento automatico, rispettivamente il modello OLS e il modello di regressione a vettori di supporto. Al fine di identificare i suoi driver macroeconomici, ho fatto riferimento ai report del World Gold Council, l'autorità sull'oro, da cui emerge che il prezzo dell'oro dipende dalla ricchezza e dall'espansione economica, dal rischio e dall'incertezza del mercato, dal costo opportunità, dal momentum e dal posizionamento. Sottolineano inoltre la natura dell'oro sia come investimento che come bene di consumo, con buoni risultati sia nei periodi di crisi sia nei periodi di congiuntura favorevole. Come accennato in precedenza, ho utilizzato il modello OLS, il quale rimane una delle tecniche più popolari per l'analisi di regressione, e l'algoritmo Support Vector Machine. Quest'ultimo è molto utile per la classificazione e la regressione, poiché fornisce un potente modello di previsione che tiene conto delle non linearità nei dati. Ho poi impiegato la regressione a vettori di supporto, che si basa sugli stessi principi della classificazione SVM, ma è usata per problemi di regressione. In particolare, la SVM è adatta quando la variabile dipendente è categorica, la SVR quando è numerica. Un vantaggio della SVR è il fatto che non dipenda dalla distribuzione delle variabili, a differenza dell'OLS, la quale si basa sulle ipotesi di Gauss-Markov e che, inoltre, consente la costruzione di modelli non lineari senza modificare i regressori. Ho utilizzato la SVR insieme a tre tipi di kernel (lineare, Radial Basis Function e polinomiale), i quali permettono di trattare con pattern non lineari nei dati. Le due tecniche sono state utilizzate per sviluppare quattro modelli in funzione del valore ritardato del prezzo dell'oro, del PIL dell'OCSE, dell'inflazione mondiale, dei rendimenti dei titoli societari, dell'indice di incertezza della politica economica e del debito pubblico statunitense. Il set di dati contiene 252 osservazioni mensili che vanno dal 1 º gennaio 2000 al 1 º dicembre 2020. I risultati dimostrano che il valore ritardato del prezzo dell'oro non ha un impatto statisticamente significativo sul rendimento dell'oro, pertanto l'effetto del passato sul rendimento di oggi è stato eliminato, e neppure il coefficiente di crescita del PIL è statisticamente significativo. Invece l'inflazione mondiale è positivamente legata ai rendimenti dell’oro e questo conferma il suo status di copertura contro l'inflazione, mentre i rendimenti dei titoli societari BAA si sono rivelati negativamente correlati ai rendimenti dell’oro. L'indice GEPU (Global Economic Policy Uncertainty) ha un effetto positivo, e questo segnala il suo status di bene rifugio, e, infine, tra il debito del tesoro degli Stati Uniti e rendimenti dell'oro c'è un rapporto positivo poiché la crescita del debito pubblico rappresenta un’accresciuta instabilità economica. L'accuratezza dei modelli è stata valutata tramite il RSME, il MAE e un indice che ho costruito per cogliere la percentuale di volte in cui la variazione prevista è stata dello stesso segno di quella attuale. I modelli si sono rivelati molto simili, tuttavia il modello SVR accoppiato con il kernel lineare è risultato essere il più adatto per prevedere i rendimenti dell’oro, dati i parametri macroeconomici presi in considerazione. Il mio studio dimostra come la peculiarità dell'oro di essere sia un bene di consumo che un investimento, che sostiene i portafogli in periodi di crisi, ha importanti implicazioni per gli investitori.

Studio dell’andamento del prezzo dell’oro determinato da fattori macroeconomici: un approccio di machine learning

CASTIGLIONI, STEFANIA
2021/2022

Abstract

The aim of this thesis is the study of the macroeconomic determinants of the gold price and the dynamic of its evolution is studied by employing econometric and machine learning techniques, respectively the OLS model and the Support Vector Regression model. In order to identify its macroeconomic drivers, I built on the reports of the World Gold Council, the authority on gold, which point out that gold price depends on wealth and economic expansion, market risk and uncertainty, opportunity cost, momentum and positioning. They also point out the nature of gold as an investment and consumer good, performing well both in periods of crisis and good times. As previously mentioned, I employed the OLS model, that is still one of the most popular technique for regression analysis, and the Support Vector Machine algorithm. The latter is very useful for classification and regression of pattern, since it provides a powerful prediction model that accounts for non-linearity in the data. I made use of the Support Vector Regression, that works on the same principles as the SVM classification, but for regression problems. In particular, the SVM is used when the dependent variable is categorical, the SVR when it is numerical. A benefit of the SVR is that it does not depend on the distribution of the variables, unlike the OLS, that rests on Gauss-Markov assumptions, and permits for construction of non linear models without changing the regressors. The SVR is coupled with three types of kernel (linear, radial basis function and polynomial) that permit to deal with non-linear patterns in the data. The two techniques have been used to develop four models as functions of the lagged value of gold price, the GDP of the OECD, the world inflation, the corporate bond yields, the economic policy uncertainty index and the US treasury debt. The dataset contains 252 monthly observations spanning from January 1st 2000 to December 1st 2020. The results points out that the lagged value of the price 1 of gold has not a statistically significant impact on gold returns, hence the effect of the past on today’s return has been eliminated, and neither the GDP growth coefficient is statistically significant. Instead the world inflation is positively linked to gold returns and this confirms its status as an hedge against inflation, while the BAA corporate bond yields turned out to be negatively related to gold returns. The Global Economic Policy Uncertainty index (GEPU) has a positive effect on gold, and this signals its status as a safe haven asset, and lastly, between the US treasury debt and gold returns there is a positive relationship, since the growth of the public debt proxies economic instability. The accuracy of the models has been assessed by means of the RSME, the MAE, and an index that I constructed in order to grasp the percentage of times the predicted variation was of the same sign as the actual one. The models turned out to be very similar, however the SVR model coupled with the linear kernel has been the most suitable for predicting gold returns given the macroeconomic parameters taken into consideration. My study shows that the peculiarity of gold of being both a consumer good and an investment, that backs portfolios in periods of meltdown, has important implications for investors.
2021
Study of the evolution of gold price driven by macroeconomic factors: a machine learning approach
Lo scopo di questa tesi è lo studio delle determinanti macroeconomiche del prezzo dell'oro e la dinamica della sua evoluzione è studiata per mezzo di tecniche econometriche e di apprendimento automatico, rispettivamente il modello OLS e il modello di regressione a vettori di supporto. Al fine di identificare i suoi driver macroeconomici, ho fatto riferimento ai report del World Gold Council, l'autorità sull'oro, da cui emerge che il prezzo dell'oro dipende dalla ricchezza e dall'espansione economica, dal rischio e dall'incertezza del mercato, dal costo opportunità, dal momentum e dal posizionamento. Sottolineano inoltre la natura dell'oro sia come investimento che come bene di consumo, con buoni risultati sia nei periodi di crisi sia nei periodi di congiuntura favorevole. Come accennato in precedenza, ho utilizzato il modello OLS, il quale rimane una delle tecniche più popolari per l'analisi di regressione, e l'algoritmo Support Vector Machine. Quest'ultimo è molto utile per la classificazione e la regressione, poiché fornisce un potente modello di previsione che tiene conto delle non linearità nei dati. Ho poi impiegato la regressione a vettori di supporto, che si basa sugli stessi principi della classificazione SVM, ma è usata per problemi di regressione. In particolare, la SVM è adatta quando la variabile dipendente è categorica, la SVR quando è numerica. Un vantaggio della SVR è il fatto che non dipenda dalla distribuzione delle variabili, a differenza dell'OLS, la quale si basa sulle ipotesi di Gauss-Markov e che, inoltre, consente la costruzione di modelli non lineari senza modificare i regressori. Ho utilizzato la SVR insieme a tre tipi di kernel (lineare, Radial Basis Function e polinomiale), i quali permettono di trattare con pattern non lineari nei dati. Le due tecniche sono state utilizzate per sviluppare quattro modelli in funzione del valore ritardato del prezzo dell'oro, del PIL dell'OCSE, dell'inflazione mondiale, dei rendimenti dei titoli societari, dell'indice di incertezza della politica economica e del debito pubblico statunitense. Il set di dati contiene 252 osservazioni mensili che vanno dal 1 º gennaio 2000 al 1 º dicembre 2020. I risultati dimostrano che il valore ritardato del prezzo dell'oro non ha un impatto statisticamente significativo sul rendimento dell'oro, pertanto l'effetto del passato sul rendimento di oggi è stato eliminato, e neppure il coefficiente di crescita del PIL è statisticamente significativo. Invece l'inflazione mondiale è positivamente legata ai rendimenti dell’oro e questo conferma il suo status di copertura contro l'inflazione, mentre i rendimenti dei titoli societari BAA si sono rivelati negativamente correlati ai rendimenti dell’oro. L'indice GEPU (Global Economic Policy Uncertainty) ha un effetto positivo, e questo segnala il suo status di bene rifugio, e, infine, tra il debito del tesoro degli Stati Uniti e rendimenti dell'oro c'è un rapporto positivo poiché la crescita del debito pubblico rappresenta un’accresciuta instabilità economica. L'accuratezza dei modelli è stata valutata tramite il RSME, il MAE e un indice che ho costruito per cogliere la percentuale di volte in cui la variazione prevista è stata dello stesso segno di quella attuale. I modelli si sono rivelati molto simili, tuttavia il modello SVR accoppiato con il kernel lineare è risultato essere il più adatto per prevedere i rendimenti dell’oro, dati i parametri macroeconomici presi in considerazione. Il mio studio dimostra come la peculiarità dell'oro di essere sia un bene di consumo che un investimento, che sostiene i portafogli in periodi di crisi, ha importanti implicazioni per gli investitori.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/1807