Comparison and classification of samples are fundamental problems in the analysis of flow cytometry (FCM) data. The aim of the work described in this thesis is to demonstrate if Wasserstein distances and Wasserstein barycenters can be applied to these problems. First of all we will show some fundamental aspects of FCM, then we will introduce the ideas of optimal transport and Wassersten distance and we will prove some fundamental properties. In the third chapter we will show how the choice of the discretization method has a huge impact on Wasserstein distance's performance at comparison tasks. We will demonstrate that, when combined with adapting binning, the Wasserstein distance of first and second order can be a good metric for measuring the biological dissimilarity between samples. We will compare the performance with those obtained by the use of Probability Binning method. In the last chapter we will demonstrate how Wasserstein barycenters can be applied to the classification of FCM samples.

Il confronto e la classificazione di campioni sono problemi fondamentali per l'analisi dei dati di citometria a flusso (FCM). L'obiettivo di questo lavoro di tesi è quello di mostrare se le distanze e i baricentri di Wasserstein possono essere applicati a questi problemi. Innanzitutto esporremo alcuni aspetti fondamentali della tecnica della FCM, poi introdurremo i concetti di trasporto ottimo e distanza di Wasserstein e dimostreremo alcune proprietà fondamentali. Nel terzo capitolo mostreremo che la scelta del metodo di discretizzazione ha un forte impatto sulla bontà dei risultati ottenuti nell'utilizzo delle distanze di Wasserstein in compiti di confronto e che, quanto combinata con binning di tipo adattativo, le distanze di Wasserstein di primo e secondo ordine possono essere una buona metrica per misurare la dissimilarità biologica tra campioni. Confronteremo i risultati con quelli ottenuti col metodo del Probability Binning. Nell'ultimo capitolo dimostreremo come i baricentri di Wasserstein possono essere applicati alla classificazione di campioni di FCM.

Confronto e classificazione di campioni cellulari tramite applicazione della distanza di Wasserstein a dati di citometria a flusso

LEMBO, ANNALISA
2019/2020

Abstract

Comparison and classification of samples are fundamental problems in the analysis of flow cytometry (FCM) data. The aim of the work described in this thesis is to demonstrate if Wasserstein distances and Wasserstein barycenters can be applied to these problems. First of all we will show some fundamental aspects of FCM, then we will introduce the ideas of optimal transport and Wassersten distance and we will prove some fundamental properties. In the third chapter we will show how the choice of the discretization method has a huge impact on Wasserstein distance's performance at comparison tasks. We will demonstrate that, when combined with adapting binning, the Wasserstein distance of first and second order can be a good metric for measuring the biological dissimilarity between samples. We will compare the performance with those obtained by the use of Probability Binning method. In the last chapter we will demonstrate how Wasserstein barycenters can be applied to the classification of FCM samples.
2019
Comparison and classification of cellular samples by using Wassersein distance on flow cytometry data
Il confronto e la classificazione di campioni sono problemi fondamentali per l'analisi dei dati di citometria a flusso (FCM). L'obiettivo di questo lavoro di tesi è quello di mostrare se le distanze e i baricentri di Wasserstein possono essere applicati a questi problemi. Innanzitutto esporremo alcuni aspetti fondamentali della tecnica della FCM, poi introdurremo i concetti di trasporto ottimo e distanza di Wasserstein e dimostreremo alcune proprietà fondamentali. Nel terzo capitolo mostreremo che la scelta del metodo di discretizzazione ha un forte impatto sulla bontà dei risultati ottenuti nell'utilizzo delle distanze di Wasserstein in compiti di confronto e che, quanto combinata con binning di tipo adattativo, le distanze di Wasserstein di primo e secondo ordine possono essere una buona metrica per misurare la dissimilarità biologica tra campioni. Confronteremo i risultati con quelli ottenuti col metodo del Probability Binning. Nell'ultimo capitolo dimostreremo come i baricentri di Wasserstein possono essere applicati alla classificazione di campioni di FCM.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per contatti: unitesi@unipv.it

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/12718