Data driven frameworks are the new dogma leading industries to obtain valued information from data analysis and processing. Enabling devices and technology to provide data, transmit and store them, while preserving their integrity, is a fundamental tool to support business operations in the new digital environment about which they make decisions. In the complementary way activation of the resources to provide accurate analysis of data is requested. Firstly, this study is going to approach a classification task to determine whether a gas meter is functioning or not at a set time on the basis of data provided by the meters. This result can be used to fill out a meter substitution priority plan automatically. Furthermore, the data chain generated by smart gas meters will be illustrated, the preparation phase of an appropriate data set for learning techniques will be presented, and feature selection criteria will be exposed. The obtained outcomes will be interpreted in the light of how much the nature of the data set may affect the performance of the classifiers. A further question will be then addressed, i. e., understanding which of the meter characteristics can influence its operative life. Nonparametric and semiparametric risk analysis methods have been performed to compare meters equipped with different components. This dissertation is meant to show how businesses can access an infinite volume of data more quickly thanks to innovative technologies, and by employing powerful algorithms and machine learning solutions can gain precious knowledge on how to enhance their structural capital continuously.

Tecniche di Machine Learning per l'identificazione del guasto nei contatori smart del gas. L’approccio Data Driven rappresenta l’assioma odierno che guida le aziende all’estrazione di informazione attraverso l’analisi e l’elaborazione dei dati. L’abilitazione delle tecnologie alla produzione di dati, alla loro trasmissione e conservazione, nonché alla preservazione della loro integrità, rappresenta uno strumento fondamentale al supporto delle operazioni aziendali, nel nuovo ambiente digitale in cui l’impresa opera. Complementare a questo aspetto é l’ attivazione delle risorse nella produzione di analisi accurate e consapevoli. Questa trattazione si occuperà, in primo luogo, di risolvere un quesito classificatorio volto a determinare se un contatore smart del gas possa essere definito funzionante o guasto all’istante di consultazione del modello, sulla base dei dati associati e prodotti dai contatori stessi. Il risultato ottenuto verrà utilizzato come variabile d’ingresso per un successivo modello economico, non compreso in questa trattazione, che abiliterà la compilazione automatica di una piano prioritario di sostituzione dei contatori. Verrà illustrata, di conseguenza, la catena del dato prodotta dai contatori e la preparazione di un data set utile a supportare la classificazione. Inoltre, verranno esaminate le tecniche utilizzate per la selezione delle variabili maggiormente informative e per questo incluse nei modelli individuati. Le prestazioni dei modelli saranno confrontate e valutate, alla luce della natura del data set, attraverso opportune metriche. Nella seconda parte di questa trattazione verranno proposti alcuni strumenti utili alla comprensione di come le caratteristiche del contatore possano influenzarne la vita operativa. Le tecniche utilizzate allo scopo, sia parametriche che non parametriche, sono proprie dell’ analisi del rischio e si configurano come una prima analisi per eseguire il confronto tra contatori equipaggiati con diversi componenti. Tale studio mostra come le imprese, grazie alle tecnologie innovative, possano accedere ad un volume infinito di dati più velocemente e impiegando opportune soluzioni di machine learning e algoritmi efficienti possano ricavare conoscenza utile a potenziare il proprio capitale strutturale.

Machine Learning Techniques for Fault Detection of Smart Gas Meters

RADICI, LETIZIA
2020/2021

Abstract

Data driven frameworks are the new dogma leading industries to obtain valued information from data analysis and processing. Enabling devices and technology to provide data, transmit and store them, while preserving their integrity, is a fundamental tool to support business operations in the new digital environment about which they make decisions. In the complementary way activation of the resources to provide accurate analysis of data is requested. Firstly, this study is going to approach a classification task to determine whether a gas meter is functioning or not at a set time on the basis of data provided by the meters. This result can be used to fill out a meter substitution priority plan automatically. Furthermore, the data chain generated by smart gas meters will be illustrated, the preparation phase of an appropriate data set for learning techniques will be presented, and feature selection criteria will be exposed. The obtained outcomes will be interpreted in the light of how much the nature of the data set may affect the performance of the classifiers. A further question will be then addressed, i. e., understanding which of the meter characteristics can influence its operative life. Nonparametric and semiparametric risk analysis methods have been performed to compare meters equipped with different components. This dissertation is meant to show how businesses can access an infinite volume of data more quickly thanks to innovative technologies, and by employing powerful algorithms and machine learning solutions can gain precious knowledge on how to enhance their structural capital continuously.
2020
Machine Learning Techniques for Fault Detection of Smart Gas Meters
Tecniche di Machine Learning per l'identificazione del guasto nei contatori smart del gas. L’approccio Data Driven rappresenta l’assioma odierno che guida le aziende all’estrazione di informazione attraverso l’analisi e l’elaborazione dei dati. L’abilitazione delle tecnologie alla produzione di dati, alla loro trasmissione e conservazione, nonché alla preservazione della loro integrità, rappresenta uno strumento fondamentale al supporto delle operazioni aziendali, nel nuovo ambiente digitale in cui l’impresa opera. Complementare a questo aspetto é l’ attivazione delle risorse nella produzione di analisi accurate e consapevoli. Questa trattazione si occuperà, in primo luogo, di risolvere un quesito classificatorio volto a determinare se un contatore smart del gas possa essere definito funzionante o guasto all’istante di consultazione del modello, sulla base dei dati associati e prodotti dai contatori stessi. Il risultato ottenuto verrà utilizzato come variabile d’ingresso per un successivo modello economico, non compreso in questa trattazione, che abiliterà la compilazione automatica di una piano prioritario di sostituzione dei contatori. Verrà illustrata, di conseguenza, la catena del dato prodotta dai contatori e la preparazione di un data set utile a supportare la classificazione. Inoltre, verranno esaminate le tecniche utilizzate per la selezione delle variabili maggiormente informative e per questo incluse nei modelli individuati. Le prestazioni dei modelli saranno confrontate e valutate, alla luce della natura del data set, attraverso opportune metriche. Nella seconda parte di questa trattazione verranno proposti alcuni strumenti utili alla comprensione di come le caratteristiche del contatore possano influenzarne la vita operativa. Le tecniche utilizzate allo scopo, sia parametriche che non parametriche, sono proprie dell’ analisi del rischio e si configurano come una prima analisi per eseguire il confronto tra contatori equipaggiati con diversi componenti. Tale studio mostra come le imprese, grazie alle tecnologie innovative, possano accedere ad un volume infinito di dati più velocemente e impiegando opportune soluzioni di machine learning e algoritmi efficienti possano ricavare conoscenza utile a potenziare il proprio capitale strutturale.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/14760