This Thesis is part of a collaboration between the University of Pavia and the company Brambati S.p.a.. The collaboration has several objectives aimed to improve the product, i.e., coffee roasting. One of these goals is the automatic generation of recipes set points. Currently, the user must enter 5 different signals in order to roast the coffee beans. The goal is to simplify the process by setting only one signal and the algorithm, generates the others, which can be later modified by the user. Along this path several works were already performed: Matlab tool that creates recipe generator from the databases storing the previous roasting, and an engineered prototype for the application of such generator. Nevertheless, in order to have an industrial application, the algorithm needs to be initialized from an empty database. The Thesis investigates this need. At first, we evaluate the portability of the model as an initialization tool: the model is identified on a database related to a different machine, of the same size, and used to generate set points for another one. The performance will be addressed using the mean absolute error (MAE) over a validation database.The performance gained from this approach was poor. The results improved by merging multiple databases from different machine. However, the differences between real and predicted signals are not negligible. A possible explanation of those results is that splitting the database in two distinct sets (identification and validation) removes important information from the learning set. To overcome this drawback, a new approach is proposed: we still consider a subset for addressing the performance, but the learning process uses the whole dataset, limited only by time simulating the natural grown of the database. The database uses a preloaded initial set of recipes, such recipes are forgotten as soon as there are enough real references in the local databased. For the initial recipes several alternatives were investigated: generic recipes provided by Brambati, real recipes from other plant of similar size. The update algorithm shows good results in every initialization: the error between the predicted and actual signals decreases in time and reach good performances. As outcome we propose the standard recipe. These recipes do not come from any previous roasting, so they are preferred to those coming from a real machine which may have copyright issues. This work only sketched the surface of the learning algorithm: the definition of the update rate, the composition of the default set, the definition of the forgetting factor are only some examples of the possible tuning for an optimal solution. As future developments, we propose validation on real machines and improvement of the learning algorithm.
Questa tesi fa parte di una collaborazione tra l'Università degli Studi di Pavia e l'azienda Brambati S.p.a.. La collaborazione ha diversi obiettivi volti a migliorare il prodotto, ovvero la torrefazione del caffè. Uno di questi obiettivi è la generazione automatica dei set point delle ricette. Attualmente, l'utente deve inserire 5 diversi segnali per tostare i chicchi di caffè. L'obiettivo è quello di semplificare il processo impostando un solo segnale e l'algoritmo, genera gli altri, che possono essere successivamente modificati dall'utente. Lungo questo percorso sono stati già eseguiti diversi lavori: strumento Matlab che crea un generatore di ricette dai database che memorizzano la tostatura precedente e un prototipo ingegnerizzato per l'applicazione di tale generatore. Tuttavia, per avere un'applicazione industriale, l'algoritmo deve essere inizializzato da un database vuoto. La Tesi indaga questa esigenza. In un primo momento, valutiamo la portabilità del modello come strumento di inizializzazione: il modello viene identificato su un database relativo a una macchina diversa, della stessa dimensione, e utilizzato per generare set point per un'altra. Le prestazioni verranno affrontate utilizzando l'errore medio assoluto (MAE) su un database di validazione. Le prestazioni ottenute con questo approccio sono state scarse; i risultati sono migliorati unendo più database da macchine diverse. Tuttavia, le differenze tra segnali reali e la loro previsione non sono trascurabili. Una possibile spiegazione di questi risultati è che la suddivisione del database in due insiemi distinti (identificazione e validazione) rimuove informazioni importanti dall'insieme di apprendimento. Per ovviare a questo inconveniente, viene proposto un nuovo approccio: si considera ancora un sottoinsieme per affrontare le prestazioni, ma il processo di apprendimento utilizza l'intero set di dati, limitato solo dal tempo che simula la crescita naturale del database. Il database utilizza un set iniziale di ricette precaricate, tali ricette vengono dimenticate non appena ci sono sufficienti riferimenti reali nel database. Per le ricette iniziali sono state studiate diverse alternative: ricette generiche fornite da Brambati, e vere e proprie ricette di altri impianti di dimensioni simili. L'algoritmo di aggiornamento mostra buoni risultati ad ogni inizializzazione: l'errore tra i segnali previsti e quelli effettivi diminuisce nel tempo e raggiunge buone prestazioni. Come risultato proponiamo la ricetta standard. Queste ricette non provengono da alcuna torrefazione precedente, quindi sono preferite a quelle provenienti da una vera macchina che potrebbe avere problemi di copyright. Questo lavoro ha solo abbozzato la superficie dell'algoritmo di apprendimento: la definizione della frequenza di aggiornamento, la composizione del set di default, la definizione del fattore di dimenticanza sono solo alcuni esempi della possibile messa a punto per una soluzione ottimale. Come sviluppi futuri, proponiamo validazione su macchine reali e miglioramento dell'algoritmo di apprendimento.
Portability of a set-points generator algorithm for coffee roasting plants.
RICCARDI, GABRIELE
2020/2021
Abstract
This Thesis is part of a collaboration between the University of Pavia and the company Brambati S.p.a.. The collaboration has several objectives aimed to improve the product, i.e., coffee roasting. One of these goals is the automatic generation of recipes set points. Currently, the user must enter 5 different signals in order to roast the coffee beans. The goal is to simplify the process by setting only one signal and the algorithm, generates the others, which can be later modified by the user. Along this path several works were already performed: Matlab tool that creates recipe generator from the databases storing the previous roasting, and an engineered prototype for the application of such generator. Nevertheless, in order to have an industrial application, the algorithm needs to be initialized from an empty database. The Thesis investigates this need. At first, we evaluate the portability of the model as an initialization tool: the model is identified on a database related to a different machine, of the same size, and used to generate set points for another one. The performance will be addressed using the mean absolute error (MAE) over a validation database.The performance gained from this approach was poor. The results improved by merging multiple databases from different machine. However, the differences between real and predicted signals are not negligible. A possible explanation of those results is that splitting the database in two distinct sets (identification and validation) removes important information from the learning set. To overcome this drawback, a new approach is proposed: we still consider a subset for addressing the performance, but the learning process uses the whole dataset, limited only by time simulating the natural grown of the database. The database uses a preloaded initial set of recipes, such recipes are forgotten as soon as there are enough real references in the local databased. For the initial recipes several alternatives were investigated: generic recipes provided by Brambati, real recipes from other plant of similar size. The update algorithm shows good results in every initialization: the error between the predicted and actual signals decreases in time and reach good performances. As outcome we propose the standard recipe. These recipes do not come from any previous roasting, so they are preferred to those coming from a real machine which may have copyright issues. This work only sketched the surface of the learning algorithm: the definition of the update rate, the composition of the default set, the definition of the forgetting factor are only some examples of the possible tuning for an optimal solution. As future developments, we propose validation on real machines and improvement of the learning algorithm.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/13241