In recent decades, near-infrared spectroscopy (NIRS) has emerged as a valuable analytical method in a variety of fields, particularly in agriculture and animal husbandry for determining forage quality. This technique offers numerous advantages over traditional chemical analysis: it does not require specific sample preparation, is environmentally friendly since it does not involve the use of chemical reagents, rapid, non-destructive, and characterized by low labor costs. An additional strength of NIRS is its ability to simultaneously determine multiple organic parameters by exploiting a single spectral data set. Having established the effectiveness of near-infrared spectroscopy as a method of predicting the nutrivite properties of forage, a variety of regression models have been investigated over the decades that were capable of exploiting all the information implicitly contained in absorption spectra to identify a correlation with the organic composition of the biological samples under investigation, evaluating their compliance with quality standards. Alongside the regressors that are most frequently proposed in the literature, Support Vector Regression (SVR) have recently been considered in the presence of datasets that are the product of spectroscopic analyses. The present paper aims to investigate the potential of SVRs in the context of predicting acetic acid and other organic parameters that define the chemical composition of forage by exploiting NIR spectroscopic analysis of samples. The study is not limited to a simple evaluation of the predictive capabilities of a predefined model, but includes a phase of optimization of the regressor itself, with emphasis on the choice of optimal parameters and the use of data dimensionality reduction techniques. Also provided is an in-depth theoretical discussion of SVRs in order to clarify their working principles in linear and nonlinear regression problems.

Negli ultimi decenni la spettroscopia del vicino infrarosso (NIRS) si è imposta come metodo analitico di grande valore in svariati ambiti, in particolare in agricoltura e zootecnia per la determinazione della qualità del foraggio. Questa tecnica offre numerosi vantaggi rispetto alla tradizionale analisi chimica: non richiede una preparazione specifica del campione, è ecocompatibile poiché non prevede uso di reagenti chimici, rapida, non distruttiva e caratterizzata da bassi costi di manodopera. Un ulteriore punto di forza della NIRS è la sua capacità di determinare simultaneamente molteplici parametri organici, sfruttando un unico set di dati spettrali. Consolidata l’efficacia della spettroscopia nel vicino infrarosso come metodo di predizione delle proprietà nutritive del foraggio, sono stati indagati nel corso dei decenni svariati modelli di regressione che fossero in grado di sfruttare tutte le informazioni implicitamente contenute negli spettri di assorbimento per individuare una correlazione con la composizione organica dei campioni biologici in esame, valutandone il rispetto degli standard qualitativi. Accanto ai regressori che più frequentemente sono proposti in letteratura, recentemente sono state considerate le Macchine a Vettori di Supporto per la Regressione (SVR) in presenza di dataset che siano il prodotto di analisi spettroscopiche. Il presente elaborato si propone di approfondire le potenzialità delle SVR nell’ambito della previsione dell’acido acetico e di altri parametri organici che definiscono la composizione chimica del foraggio, sfruttando l’analisi spettroscopica NIR dei campioni. Lo studio non si limita a una semplice valutazione delle capacità predittive di un modello predefinito ma include una fase di ottimizzazione del regressore stesso, con particolare attenzione alla scelta dei parametri ottimali e all’impiego di tecniche di riduzione della dimensionalità dei dati. Viene inoltre fornita una trattazione teorica approfondita delle SVR al fine di chiarire i principi alla base del loro funzionamento in problemi di regressione lineare e non lineare.

Analisi predittiva di dati spettrografici tramite Support Vector Regression

CANCELLI, AURORA
2023/2024

Abstract

In recent decades, near-infrared spectroscopy (NIRS) has emerged as a valuable analytical method in a variety of fields, particularly in agriculture and animal husbandry for determining forage quality. This technique offers numerous advantages over traditional chemical analysis: it does not require specific sample preparation, is environmentally friendly since it does not involve the use of chemical reagents, rapid, non-destructive, and characterized by low labor costs. An additional strength of NIRS is its ability to simultaneously determine multiple organic parameters by exploiting a single spectral data set. Having established the effectiveness of near-infrared spectroscopy as a method of predicting the nutrivite properties of forage, a variety of regression models have been investigated over the decades that were capable of exploiting all the information implicitly contained in absorption spectra to identify a correlation with the organic composition of the biological samples under investigation, evaluating their compliance with quality standards. Alongside the regressors that are most frequently proposed in the literature, Support Vector Regression (SVR) have recently been considered in the presence of datasets that are the product of spectroscopic analyses. The present paper aims to investigate the potential of SVRs in the context of predicting acetic acid and other organic parameters that define the chemical composition of forage by exploiting NIR spectroscopic analysis of samples. The study is not limited to a simple evaluation of the predictive capabilities of a predefined model, but includes a phase of optimization of the regressor itself, with emphasis on the choice of optimal parameters and the use of data dimensionality reduction techniques. Also provided is an in-depth theoretical discussion of SVRs in order to clarify their working principles in linear and nonlinear regression problems.
2023
Predictive analysis of spectrographic data using Support Vector Regression
Negli ultimi decenni la spettroscopia del vicino infrarosso (NIRS) si è imposta come metodo analitico di grande valore in svariati ambiti, in particolare in agricoltura e zootecnia per la determinazione della qualità del foraggio. Questa tecnica offre numerosi vantaggi rispetto alla tradizionale analisi chimica: non richiede una preparazione specifica del campione, è ecocompatibile poiché non prevede uso di reagenti chimici, rapida, non distruttiva e caratterizzata da bassi costi di manodopera. Un ulteriore punto di forza della NIRS è la sua capacità di determinare simultaneamente molteplici parametri organici, sfruttando un unico set di dati spettrali. Consolidata l’efficacia della spettroscopia nel vicino infrarosso come metodo di predizione delle proprietà nutritive del foraggio, sono stati indagati nel corso dei decenni svariati modelli di regressione che fossero in grado di sfruttare tutte le informazioni implicitamente contenute negli spettri di assorbimento per individuare una correlazione con la composizione organica dei campioni biologici in esame, valutandone il rispetto degli standard qualitativi. Accanto ai regressori che più frequentemente sono proposti in letteratura, recentemente sono state considerate le Macchine a Vettori di Supporto per la Regressione (SVR) in presenza di dataset che siano il prodotto di analisi spettroscopiche. Il presente elaborato si propone di approfondire le potenzialità delle SVR nell’ambito della previsione dell’acido acetico e di altri parametri organici che definiscono la composizione chimica del foraggio, sfruttando l’analisi spettroscopica NIR dei campioni. Lo studio non si limita a una semplice valutazione delle capacità predittive di un modello predefinito ma include una fase di ottimizzazione del regressore stesso, con particolare attenzione alla scelta dei parametri ottimali e all’impiego di tecniche di riduzione della dimensionalità dei dati. Viene inoltre fornita una trattazione teorica approfondita delle SVR al fine di chiarire i principi alla base del loro funzionamento in problemi di regressione lineare e non lineare.
File in questo prodotto:
File Dimensione Formato  
tesi.pdf

accesso aperto

Dimensione 2.43 MB
Formato Adobe PDF
2.43 MB Adobe PDF Visualizza/Apri

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/28402