Oggigiorno la maggior parte dei referti radiologici è in formato di testo libero “narrativo”. Questo tipo di refertazione è considerato un ostacolo alla rapida estrazione ed utilizzo delle informazioni cliniche da parte di specialisti del settore. Recentemente l’adozione di refertazione strutturata è raccomandata da diverse società mediche, come la European Society of Radiology (ESR) [1], grazie ai molteplici vantaggi che offre in termini di comprensibilità, standardizzazione, completezza del contenuto informativo, formulazione di statistiche clinico-scientifiche ecc. [2, 3]. Il lavoro di tesi è nato dalla volontà di rendere più fattibile l’utilizzo di questa tipologia di refertazione nella pratica clinica, sfruttando le potenzialità del Natural Language Processing (NLP) per compilare in maniera automatica il registro radiologico “ufficiale” della Società Italiana di Radiologia Medica e Interventistica (SIRM), riguardante la stadiazione dei pazienti con linfoma per mezzo di TC [3]. In collaborazione con la SC Radiologia Diagnostica per Immagini 1 (Dipartimento Servizi Diagnostici e per Immagini) della Fondazione IRCCS Policlinico San Matteo di Pavia, è stato definito il corpus di referti di lesioni linfonodali da utilizzare nello studio, le modalità e le specifiche di “annotazione”. Per quanto riguarda la scelta del modello di apprendimento, è stato approfondito lo stato dell’arte in ambito NLP e il task specifico di registry filling, l’architettura Transformer [4], nota per il meccanismo di attention, e le sue implementazioni. Il paradigma prescelto è stato applicato elaborando opportune strategie per adeguarlo ai dati a disposizione, raggiungendo prestazioni promettenti e competitive rispetto agli algoritmi precedentemente implementati in tale ambito. I risultati, inoltre, hanno dimostrato che un modello più piccolo ma fine-tuned su esempi clinici può raggiungere prestazioni migliori e ad un costo inferiore rispetto un language model di grandi dimensioni.

Analisi di referti radiologici riguardo lesioni linfonodali con modelli di intelligenza artificiale basati sul attention

BERGOMI, LAURA
2022/2023

Abstract

Oggigiorno la maggior parte dei referti radiologici è in formato di testo libero “narrativo”. Questo tipo di refertazione è considerato un ostacolo alla rapida estrazione ed utilizzo delle informazioni cliniche da parte di specialisti del settore. Recentemente l’adozione di refertazione strutturata è raccomandata da diverse società mediche, come la European Society of Radiology (ESR) [1], grazie ai molteplici vantaggi che offre in termini di comprensibilità, standardizzazione, completezza del contenuto informativo, formulazione di statistiche clinico-scientifiche ecc. [2, 3]. Il lavoro di tesi è nato dalla volontà di rendere più fattibile l’utilizzo di questa tipologia di refertazione nella pratica clinica, sfruttando le potenzialità del Natural Language Processing (NLP) per compilare in maniera automatica il registro radiologico “ufficiale” della Società Italiana di Radiologia Medica e Interventistica (SIRM), riguardante la stadiazione dei pazienti con linfoma per mezzo di TC [3]. In collaborazione con la SC Radiologia Diagnostica per Immagini 1 (Dipartimento Servizi Diagnostici e per Immagini) della Fondazione IRCCS Policlinico San Matteo di Pavia, è stato definito il corpus di referti di lesioni linfonodali da utilizzare nello studio, le modalità e le specifiche di “annotazione”. Per quanto riguarda la scelta del modello di apprendimento, è stato approfondito lo stato dell’arte in ambito NLP e il task specifico di registry filling, l’architettura Transformer [4], nota per il meccanismo di attention, e le sue implementazioni. Il paradigma prescelto è stato applicato elaborando opportune strategie per adeguarlo ai dati a disposizione, raggiungendo prestazioni promettenti e competitive rispetto agli algoritmi precedentemente implementati in tale ambito. I risultati, inoltre, hanno dimostrato che un modello più piccolo ma fine-tuned su esempi clinici può raggiungere prestazioni migliori e ad un costo inferiore rispetto un language model di grandi dimensioni.
2022
Transformer-based information extraction from Italian radiology reports investigating lymph-node lesions
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per contatti: unitesi@unipv.it

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/16485