The rapid evolution of enterprise networking toward cloud-centric and distributed architectures has made Software-Defined Wide Area Networking (SD-WAN) an essential enabler of agility, reliability, and centralized policy control. However, the operational benefits of SD-WAN are often undermined by the overwhelming volume and complexity of system alarms. Unoptimized alarm configurations frequently result in excessive or redundant notifications, obscuring genuine issues and overwhelming network operations teams. This challenge underscores the need for intelligent, fine-tuned alarm management strategies that balance responsiveness with operational stability. This thesis presents a comprehensive, Experimental, data-driven analysis of critical SD-WAN alarm behavior within a large-scale production environment. The study investigates how configurable parameters—particularly threshold levels and soak times—affect alarm frequency, accuracy, and network observability. By systematically examining both connectivity-related and performance-related alarm categories, the research identifies patterns that reveal the trade-off between rapid fault detection and the risk of false positives. Extended observation periods under varied operational conditions were used to evaluate the relationship between alarm sensitivity and system stability, yielding practical insights into optimal parameter calibration. The findings demonstrate that structured alarm tuning significantly enhances the effectiveness of network monitoring by reducing alert fatigue and improving incident prioritization. More importantly, the results establish that alarm configuration should not be treated as a static or administrative task, but as an ongoing analytical process that directly impacts SD-WAN performance, availability, and operational efficiency. Ultimately, this thesis contributes a validated methodology and practical framework for optimizing SD-WAN alarm management, enabling organizations to achieve a more reliable and proactive monitoring posture. The outcomes of this study also provide a foundation for future advancements in autonomous alarm tuning and AI-assisted fault correlation across multi-vendor, software-defined network environments.

La rapida evoluzione del networking aziendale verso architetture distribuite e incentrate sul cloud ha reso le tecnologie basate su Software-Defined Wide Area Networking (SD-WAN) un fattore essenziale per l'agilità, l'affidabilità e il controllo centralizzato delle politiche di gestione. Tuttavia, i vantaggi operativi dell'SD-WAN sono spesso compromessi dall'enorme volume e complessità degli allarmi di sistema. Configurazioni non ottimizzate spesso generano notifiche eccessive o ridondanti, oscurando i problemi reali e sovraccaricando gli addetti alle operazioni di rete. Questa sfida sottolinea la necessità di strategie di gestione degli allarmi intelligenti e ottimizzate che bilancino reattività e stabilità operativa. Questa tesi presenta un'analisi, sperimentale basata sui dati del comportamento degli allarmi critici SD-WAN in un ambiente di produzione su larga scala. Lo studio analizza come i parametri configurabili influenzino la frequenza degli allarmi, l'accuratezza e l'osservabilità della rete. Esaminando sistematicamente le categorie di allarmi relative sia alla connettività che alle prestazioni, questo lavoro identifica modelli che rivelano il compromesso tra il rapido rilevamento dei guasti e il rischio di falsi positivi. Sono stati utilizzati periodi di osservazione prolungati in diverse condizioni operative per valutare la relazione tra sensibilità degli allarmi e stabilità del sistema, fornendo spunti pratici per una calibrazione ottimale dei parametri. I risultati dimostrano che la regolazione strutturata degli allarmi migliora significativamente l'efficacia del monitoraggio della rete, riducendo gli interventi sugli allarmi e migliorando la priorità degli incidenti. Ancora più importante, i risultati stabili-scono che la configurazione degli allarmi non deve essere trattata come un'attività statica o amministrativa, ma come un processo analitico continuo che ha un impatto diretto sulle prestazioni, la disponibilità e l'efficienza operativa della SD-WAN. In definitiva, questa tesi fornisce una metodologia convalidata e un framework pratico per ottimizzare la gestione degli allarmi della SD-WAN, consentendo alle organizzazioni un monitoraggio più affidabile e proattivo e fornendo anche una base per futuri progressi nella regolazione autonoma degli allarmi in ambienti di rete multi-vendor e software-defined.

Analisi degli allarmi SD-WAN - un framework sperimentale per la messa a punto della configurazione basata sui dati e la gestione predittiva dei guasti nelle distribuzioni su larga scala

ANAND, SAURAV
2024/2025

Abstract

The rapid evolution of enterprise networking toward cloud-centric and distributed architectures has made Software-Defined Wide Area Networking (SD-WAN) an essential enabler of agility, reliability, and centralized policy control. However, the operational benefits of SD-WAN are often undermined by the overwhelming volume and complexity of system alarms. Unoptimized alarm configurations frequently result in excessive or redundant notifications, obscuring genuine issues and overwhelming network operations teams. This challenge underscores the need for intelligent, fine-tuned alarm management strategies that balance responsiveness with operational stability. This thesis presents a comprehensive, Experimental, data-driven analysis of critical SD-WAN alarm behavior within a large-scale production environment. The study investigates how configurable parameters—particularly threshold levels and soak times—affect alarm frequency, accuracy, and network observability. By systematically examining both connectivity-related and performance-related alarm categories, the research identifies patterns that reveal the trade-off between rapid fault detection and the risk of false positives. Extended observation periods under varied operational conditions were used to evaluate the relationship between alarm sensitivity and system stability, yielding practical insights into optimal parameter calibration. The findings demonstrate that structured alarm tuning significantly enhances the effectiveness of network monitoring by reducing alert fatigue and improving incident prioritization. More importantly, the results establish that alarm configuration should not be treated as a static or administrative task, but as an ongoing analytical process that directly impacts SD-WAN performance, availability, and operational efficiency. Ultimately, this thesis contributes a validated methodology and practical framework for optimizing SD-WAN alarm management, enabling organizations to achieve a more reliable and proactive monitoring posture. The outcomes of this study also provide a foundation for future advancements in autonomous alarm tuning and AI-assisted fault correlation across multi-vendor, software-defined network environments.
2024
SD-WAN Alarm Analysis - An Experimental Framework for Data-Driven Configuration Tuning and Predictive Fault Management in Large-Scale Deployments
La rapida evoluzione del networking aziendale verso architetture distribuite e incentrate sul cloud ha reso le tecnologie basate su Software-Defined Wide Area Networking (SD-WAN) un fattore essenziale per l'agilità, l'affidabilità e il controllo centralizzato delle politiche di gestione. Tuttavia, i vantaggi operativi dell'SD-WAN sono spesso compromessi dall'enorme volume e complessità degli allarmi di sistema. Configurazioni non ottimizzate spesso generano notifiche eccessive o ridondanti, oscurando i problemi reali e sovraccaricando gli addetti alle operazioni di rete. Questa sfida sottolinea la necessità di strategie di gestione degli allarmi intelligenti e ottimizzate che bilancino reattività e stabilità operativa. Questa tesi presenta un'analisi, sperimentale basata sui dati del comportamento degli allarmi critici SD-WAN in un ambiente di produzione su larga scala. Lo studio analizza come i parametri configurabili influenzino la frequenza degli allarmi, l'accuratezza e l'osservabilità della rete. Esaminando sistematicamente le categorie di allarmi relative sia alla connettività che alle prestazioni, questo lavoro identifica modelli che rivelano il compromesso tra il rapido rilevamento dei guasti e il rischio di falsi positivi. Sono stati utilizzati periodi di osservazione prolungati in diverse condizioni operative per valutare la relazione tra sensibilità degli allarmi e stabilità del sistema, fornendo spunti pratici per una calibrazione ottimale dei parametri. I risultati dimostrano che la regolazione strutturata degli allarmi migliora significativamente l'efficacia del monitoraggio della rete, riducendo gli interventi sugli allarmi e migliorando la priorità degli incidenti. Ancora più importante, i risultati stabili-scono che la configurazione degli allarmi non deve essere trattata come un'attività statica o amministrativa, ma come un processo analitico continuo che ha un impatto diretto sulle prestazioni, la disponibilità e l'efficienza operativa della SD-WAN. In definitiva, questa tesi fornisce una metodologia convalidata e un framework pratico per ottimizzare la gestione degli allarmi della SD-WAN, consentendo alle organizzazioni un monitoraggio più affidabile e proattivo e fornendo anche una base per futuri progressi nella regolazione autonoma degli allarmi in ambienti di rete multi-vendor e software-defined.
File in questo prodotto:
File Dimensione Formato  
Relazione_Tesi_CE_Anand_Saurav.pdf

accesso aperto

Dimensione 1.55 MB
Formato Adobe PDF
1.55 MB Adobe PDF Visualizza/Apri

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/33666