Time series classification is a tackling problem present in many disciplines, ranging from Economics to the Oil and Gas Industry. With the advent of the so called Big Data Revolution time series have become a key ingredient of any data analysis process. Parallel to this, the field of Machine Learning has seen an exponential growth and has gained a huge interest in the field of Physics, so much so that some even consider it a proper branch. In this work we intend to apply our Physics (and Machine Learning) knowledge to the analysis of oil wells production data. The goal is to build a working strategy to cluster such data so that it reflects the underground structure and condition of the considered extraction field. Given the premises an Unsupervised Learning algorithm will be our solution of choice. The clustering problem is well defined and has been deeply investigated. The use of this technique on time series is not conventional though, particularly in the oil industry, as demonstrated by the lack of specific articles in literature. Before showing our attempts though, we are firstly going to explain the basics about oil reservoirs, in order to establish a common language which is going to be used throughout the thesis. We will then explain the physical phenomena behind underground fluid movement and how they are related to the data considered in the analysis. Once those fundamental sections are treated, we will illustrate the inner workings K-Means Clustering, the core of the algorithm we developed. Then we will briefly explain the working principles of the simulator we used for testing said algorithm and show the promising results we obtained. Finally we are going to present an application of our method on a real extraction field, commenting our findings and proposing possible ways to improve it.
La classificazione delle serie temporali è un problema presente in molte discipline, dall'economia all'industria petrolifera e del gas. Con l'avvento della cosiddetta Big Data Revolution, le serie temporali sono diventate un ingrediente chiave di qualsiasi processo di analisi dei dati. Parallelamente a questo, il campo del Machine Learning ha visto una crescita esponenziale e ha riscosso un enorme successo nel campo della Fisica, tanto che alcuni lo considerano addirittura una branca vera e propria. In questo lavoro intendiamo applicare le nostre conoscenze di Fisica (e Machine Learning) all'analisi dei dati di produzione dei pozzi petroliferi. L'obiettivo è costruire una strategia di lavoro per raggruppare tali dati in modo che riflettano la struttura sotterranea e le condizioni del campo di estrazione considerato. Date le premesse, un algoritmo di unsupervised learning sarà la nostra soluzione. Il problema del clustering è ben definito ed è stato studiato a fondo. L'uso di questa tecnica sulle serie temporali non è però convenzionale, in particolare nell'industria petrolifera, come dimostrato dalla mancanza di articoli specifici in letteratura. Prima di mostrare i nostri tentativi, però, spiegheremo innanzitutto le basi sui giacimenti petroliferi, al fine di stabilire un linguaggio comune che verrà utilizzato durante la tesi. Spiegheremo quindi i fenomeni fisici alla base del movimento dei fluidi sotterranei e come sono correlati ai dati considerati nell'analisi. Una volta trattate queste sezioni fondamentali, illustreremo il funzionamento interno del K-Means Clustering, il nucleo dell'algoritmo che abbiamo sviluppato. Quindi spiegheremo brevemente i principi di funzionamento del simulatore che abbiamo utilizzato per testare il suddetto algoritmo e mostreremo i promettenti risultati che abbiamo ottenuto. Infine presenteremo un'applicazione del nostro metodo su un campo di estrazione reale, commentando i nostri risultati e proponendo possibili modi per migliorarlo.
Unsupervised Learning nell'industria del petrolio Dedurre informazione fisica dall'analisi dei dati di produzione
GILIO, DANIELE
2021/2022
Abstract
Time series classification is a tackling problem present in many disciplines, ranging from Economics to the Oil and Gas Industry. With the advent of the so called Big Data Revolution time series have become a key ingredient of any data analysis process. Parallel to this, the field of Machine Learning has seen an exponential growth and has gained a huge interest in the field of Physics, so much so that some even consider it a proper branch. In this work we intend to apply our Physics (and Machine Learning) knowledge to the analysis of oil wells production data. The goal is to build a working strategy to cluster such data so that it reflects the underground structure and condition of the considered extraction field. Given the premises an Unsupervised Learning algorithm will be our solution of choice. The clustering problem is well defined and has been deeply investigated. The use of this technique on time series is not conventional though, particularly in the oil industry, as demonstrated by the lack of specific articles in literature. Before showing our attempts though, we are firstly going to explain the basics about oil reservoirs, in order to establish a common language which is going to be used throughout the thesis. We will then explain the physical phenomena behind underground fluid movement and how they are related to the data considered in the analysis. Once those fundamental sections are treated, we will illustrate the inner workings K-Means Clustering, the core of the algorithm we developed. Then we will briefly explain the working principles of the simulator we used for testing said algorithm and show the promising results we obtained. Finally we are going to present an application of our method on a real extraction field, commenting our findings and proposing possible ways to improve it.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/14608