The increasing unpredictability of financial markets, exacerbated by global events such as the Covid-19 pandemic and geopolitical conflicts, has revealed the limitations of traditional forecasting methods based on historical asset data. This thesis explores the integration of social media data with historical price information to enhance Bitcoin price prediction accuracy, leveraging statistical and mathematical models. Social media data, capturing user sentiment, offer an alternative and potentially complementary source of information, although their voluntary nature introduces inherent biases. To investigate these dynamics, this research employs Gaussian Graphical Models and Vector AutoRegressive (VAR) models with time-varying extensions to analyze relationships among variables. Additionally, ARIMA- GARCH and gamlss models extract residuals for Vine copula implementation. Vine Copula models are applied to model complex dependencies within multivariate data, accommodating features like asymmetry and heavy tails. D-vine copula quantile regression are employed to predict Bitcoin prices by estimating conditional means and medians. The accuracy of the proposed models is evaluated against observed Bitcoin prices using statistical validation metrics. This study highlights the value of integrating social media data and advanced statistical methods for a comprehensive view of Bitcoin market dynamics and public sentiment.

L’imprevedibilità crescente dei mercati finanziari, accentuata da eventi globali come la pandemia di Covid-19 e i conflitti geopolitici, ha messo in luce i limiti dei metodi tradizionali di previsione basati esclusivamente sui dati storici. Questa tesi analizza come l’integrazione dei dati dei social media con le informazioni sui prezzi storici possa migliorare l’accuratezza delle previsioni sui prezzi del Bitcoin, utilizzando modelli statistici e matematici. I dati dei social media, che riflettono il sentiment degli utenti, rappresentano una fonte alternativa e complementare, anche se la loro natura volontaria può introdurre alcuni bias. Per esplorare queste dinamiche, la ricerca utilizza Modelli Grafici Gaussiani e modelli grafici Vector AutoRegressive (VAR) con estensioni temporali per analizzare le relazioni tra le variabili. Inoltre, i modelli ARIMA-GARCH e gamlss vengono utilizzati per estrarre i residui necessari per l’applicazione dei modelli Vine copula. Questi modelli sono utilizzati per descrivere dipendenze complesse nei dati multivariati, considerando caratteristiche come l’asimmetria e le code pesanti. Il modello D-vine copula quantile regression viene poi applicato per prevedere i prezzi del Bitcoin, stimando medie e mediane condizionali. L’accuratezza dei modelli proposti è confrontata con i prezzi osservati del Bitcoin utilizzando indicatori di validazione statistica. Questo studio evidenzia l’importanza di combinare dati dei social media e metodi statistici avanzati per offrire una visione più completa delle dinamiche del mercato del Bitcoin e del sentiment pubblico.

Le informazioni provenienti dai social media possono aiutare a prevedere il valore del Bitcoin? Un confronto tra Vines e Modelli Grafici

MERLI, LORENZO
2023/2024

Abstract

The increasing unpredictability of financial markets, exacerbated by global events such as the Covid-19 pandemic and geopolitical conflicts, has revealed the limitations of traditional forecasting methods based on historical asset data. This thesis explores the integration of social media data with historical price information to enhance Bitcoin price prediction accuracy, leveraging statistical and mathematical models. Social media data, capturing user sentiment, offer an alternative and potentially complementary source of information, although their voluntary nature introduces inherent biases. To investigate these dynamics, this research employs Gaussian Graphical Models and Vector AutoRegressive (VAR) models with time-varying extensions to analyze relationships among variables. Additionally, ARIMA- GARCH and gamlss models extract residuals for Vine copula implementation. Vine Copula models are applied to model complex dependencies within multivariate data, accommodating features like asymmetry and heavy tails. D-vine copula quantile regression are employed to predict Bitcoin prices by estimating conditional means and medians. The accuracy of the proposed models is evaluated against observed Bitcoin prices using statistical validation metrics. This study highlights the value of integrating social media data and advanced statistical methods for a comprehensive view of Bitcoin market dynamics and public sentiment.
2023
Can social media information help forecast Bitcoin value? A comparison of Vines and Graphical Models
L’imprevedibilità crescente dei mercati finanziari, accentuata da eventi globali come la pandemia di Covid-19 e i conflitti geopolitici, ha messo in luce i limiti dei metodi tradizionali di previsione basati esclusivamente sui dati storici. Questa tesi analizza come l’integrazione dei dati dei social media con le informazioni sui prezzi storici possa migliorare l’accuratezza delle previsioni sui prezzi del Bitcoin, utilizzando modelli statistici e matematici. I dati dei social media, che riflettono il sentiment degli utenti, rappresentano una fonte alternativa e complementare, anche se la loro natura volontaria può introdurre alcuni bias. Per esplorare queste dinamiche, la ricerca utilizza Modelli Grafici Gaussiani e modelli grafici Vector AutoRegressive (VAR) con estensioni temporali per analizzare le relazioni tra le variabili. Inoltre, i modelli ARIMA-GARCH e gamlss vengono utilizzati per estrarre i residui necessari per l’applicazione dei modelli Vine copula. Questi modelli sono utilizzati per descrivere dipendenze complesse nei dati multivariati, considerando caratteristiche come l’asimmetria e le code pesanti. Il modello D-vine copula quantile regression viene poi applicato per prevedere i prezzi del Bitcoin, stimando medie e mediane condizionali. L’accuratezza dei modelli proposti è confrontata con i prezzi osservati del Bitcoin utilizzando indicatori di validazione statistica. Questo studio evidenzia l’importanza di combinare dati dei social media e metodi statistici avanzati per offrire una visione più completa delle dinamiche del mercato del Bitcoin e del sentiment pubblico.
File in questo prodotto:
File Dimensione Formato  
Master_thesis_PdfA.pdf

accesso aperto

Dimensione 8.77 MB
Formato Adobe PDF
8.77 MB Adobe PDF Visualizza/Apri

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/27845