Cyber risk is intrinsically uncertain and heterogeneous across countries, as it depends on a multiplicity of factors (economic, technological, and geopolitical). One of the main difficulties in the assessment of Cyber Risk concerns the limited availability and the uneven quality of data on the severity of cyber attacks, which hampers an accurate risk analysis and the design of targeted policies, especially in contexts characterized by incomplete information. This thesis proposes a new distributional approach for Cyber Risk inference based on optimal transport theory, with the aim of propagating information across countries in a geometrically coherent manner. In particular, each country is associated with a probability distribution of cyber-attack severity, while similarities between countries are represented through network structures that reflect economic and institutional linkages. The risk propagation mechanism is formulated as a Wasserstein barycentric interpolation problem on networks, in which missing or unreliable distributions are estimated as weighted barycentres of the distributions of neighboring countries. Unlike scalar approaches or methods based on componentwise averaging, the proposed methodology preserves the ordinal structure, dispersion, and shape of the distributions, ensuring results that are interpretable and economically coherent. The framework is applied using different network topologies (based on salience, cosine similarity, minimum spanning tree, and k-nearest neighbors). Robustness analyses and out-of-sample evaluations show that the propagation results are stable with respect to the choice of the network and the degree of data incompleteness. In addition, cascade-type experiments highlight the crucial role of network topology in shaping the diffusion of cyber shocks, revealing differences between dense and sparse structures. The proposed approach provides a tool for cyber-risk assessment in data-scarce contexts, and the integration of optimal transport geometry with network-based propagation makes it possible to infer and analyze cyber-risk distributions, supporting more informed decision-making under uncertainty.
Il rischio informatico è intrinsecamente incerto ed eterogeneo tra i diversi Paesi poiché dipende da una molteciplità di fattori (economici, tecnologici e geopolitici). Una delle principali difficoltà nella valutazione del Cyber Risk riguarda la disponibilità limitata e la qualità disomogenea dei dati sulla gravità degli attacchi informatici, che ostacola un’analisi accurata del rischio e la definizione di politiche mirate, soprattutto nei contesti caratterizzati da informazioni incomplete. Questa tesi propone un nuovo approccio distribuzionale per l’inferenza del Cyber Risk basato sulla teoria del trasporto ottimo, con l’obiettivo di propagare l’informazione tra Paesi in modo geometricamente coerente. In particolare, a ciascun Paese è associata una distribuzione di probabilità della severità degli attacchi informatici, mentre le relazioni di similarità tra Paesi sono rappresentate tramite strutture di rete che riflettono legami economici e istituzionali. Il meccanismo di propagazione del rischio viene formulato come un problema di interpolazione baricentrica di Wasserstein su reti, in cui le distribuzioni mancanti o poco affidabili vengono stimate come baricentri pesati delle distribuzioni dei Paesi vicini. A differenza degli approcci scalari o basati su medie componente per componente, la metodologia proposta preserva la struttura ordinale, la dispersione e la forma delle distribuzioni, garantendo risultati interpretabili e coerenti dal punto di vista economico. Il framework viene applicato utilizzando diverse topologie di rete,(basate sulla salienza, sulla similarità coseno, sull’albero di copertura minimo, sui k-nearest neighbors). Analisi di robustezza e valutazioni out-of-sample mostrano che i risultati della propagazione sono stabili rispetto alla scelta della rete e al grado di incompletezza dei dati. Inoltre, gli esperimenti di tipo “cascade” evidenziano il ruolo cruciale della topologia di rete nel modellare la diffusione degli shock informatici, mettendo in luce differenze tra strutture dense e sparse. L’approccio proposto fornisce uno strumento per la valutazione del cyber risk in contesti caratterizzati da scarsità di dati e, l’integrazione tra geometria del trasporto ottimo e propagazione su reti consente di inferire e analizzare distribuzioni di rischio informatico, supportando processi decisionali più informati in presenza di incertezza.
Un approccio di inferenza distribuzionale basato su reti per modellare il rischio informatico a livello nazionale
MAZZALI, ANDREA
2024/2025
Abstract
Cyber risk is intrinsically uncertain and heterogeneous across countries, as it depends on a multiplicity of factors (economic, technological, and geopolitical). One of the main difficulties in the assessment of Cyber Risk concerns the limited availability and the uneven quality of data on the severity of cyber attacks, which hampers an accurate risk analysis and the design of targeted policies, especially in contexts characterized by incomplete information. This thesis proposes a new distributional approach for Cyber Risk inference based on optimal transport theory, with the aim of propagating information across countries in a geometrically coherent manner. In particular, each country is associated with a probability distribution of cyber-attack severity, while similarities between countries are represented through network structures that reflect economic and institutional linkages. The risk propagation mechanism is formulated as a Wasserstein barycentric interpolation problem on networks, in which missing or unreliable distributions are estimated as weighted barycentres of the distributions of neighboring countries. Unlike scalar approaches or methods based on componentwise averaging, the proposed methodology preserves the ordinal structure, dispersion, and shape of the distributions, ensuring results that are interpretable and economically coherent. The framework is applied using different network topologies (based on salience, cosine similarity, minimum spanning tree, and k-nearest neighbors). Robustness analyses and out-of-sample evaluations show that the propagation results are stable with respect to the choice of the network and the degree of data incompleteness. In addition, cascade-type experiments highlight the crucial role of network topology in shaping the diffusion of cyber shocks, revealing differences between dense and sparse structures. The proposed approach provides a tool for cyber-risk assessment in data-scarce contexts, and the integration of optimal transport geometry with network-based propagation makes it possible to infer and analyze cyber-risk distributions, supporting more informed decision-making under uncertainty.| File | Dimensione | Formato | |
|---|---|---|---|
|
TESI_Finance_Andrea_Mazzali.pdf
accesso aperto
Descrizione: Tesi di laurea magistrale in Finance che indaga un possibile approccio di inferenza distribuzionale, basato sulle reti, per andare a modellare il rischio di attacchi informatici a livelli nazionale.
Dimensione
2.77 MB
Formato
Adobe PDF
|
2.77 MB | Adobe PDF | Visualizza/Apri |
È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/33849