Acute kidney injury (AKI) is an abrupt decrease in kidney function and is widespread in intensive care. Many AKI prediction models have been proposed, but only few rely on clinical notes and medical terminologies.In a previous work, a model to predict AKI was developed and internally validated using clinical notes enriched with single-word concepts from medical knowledge graphs. In that work, word embeddings were retrofitted based on the relationships among concepts in the Unified Medical Language System (UMLS). However, an analysis of the impact of using multi-word concepts is lacking. In this study, I’ll compare the use of the clinical notes as inputs for prediction withthe one of clinical notes retrofitted with both single-word (e.g. Heart) and multiword (e.g. Heart structure) concepts. Results show that: 1. retrofitting single-word concepts improved word representations and improved the performance of the prediction model. 2. retrofitting multi-word concepts improved the results, but not significantly. The improvement with multi-word concepts was small probably, due to the small number of multi-word concepts that could be annotated. Hence, multi-word concepts may prove even more beneficial when many multi-word concepts can be linked to the UMLS.
Uso di concetti composti da più parole per prevedere l’insufficienza renale acuta in terapia intensiva. L’ insufficienza renale acuta (Acute Kidney Injury, AKI) è una brusca diminuzione delle funzionalità renali ed è una sindrome molto diffusa nei reparti di terapia intensiva. In letteratura sono stati proposti molti modelli predittivi per l’AKI, ma solo pochi di essi si basano sulle note cliniche e sulle terminologie mediche.In un lavoro precedente, è stato sviluppato e validato internamente un modello per prevedere l'AKI utilizzando note cliniche arricchite da concetti medici, composti da una sola parola, provenienti da una o più ontologie del dominio clinico espresse tramite knowledge graph. In quel lavoro, è stata usata una tecnica nota come “retrofitting” per arricchire il processo di word embedding, basandosi sulle relazioni tra concetti dell'Unified Medical Language System (UMLS). Tuttavia, non era stata effettuata un'analisi dell'impatto dell'uso di concetti composti da più parole.Considerando queste premesse, in questo studio sono stati confrontati l'uso delle sole note cliniche come input per la previsione di AKI, con l'uso di note cliniche con in aggiunta i concetti medici, sia composti da una sola parola (e.g. Heart) che da più parole (e.g. Heart structure), mediante la tecnica del retrofitting.I risultati mostrano che: 1. il retrofit dei concetti di una sola parola migliora la rappresentazione delle parole e le prestazioni del modello di predizione; 2. il retrofit di concetti composti da più parole migliora i risultati ma non in maniera significativa. Sebbene con i concetti composti da più parole il miglioramento delle prestazioni fosse minimo, a causa del numero limitato di concetti che potevano essere annotati, quest’ultimi si sono dimostrati vantaggiosi, e vale la pena studiare metodi alternativi per includerli nei modelli predittivi per l’AKI.
Leveraging Multi-word Concepts to Predict Acute Kidney Injury in Intensive Care
BRANCATO, LORENZO
2022/2023
Abstract
Acute kidney injury (AKI) is an abrupt decrease in kidney function and is widespread in intensive care. Many AKI prediction models have been proposed, but only few rely on clinical notes and medical terminologies.In a previous work, a model to predict AKI was developed and internally validated using clinical notes enriched with single-word concepts from medical knowledge graphs. In that work, word embeddings were retrofitted based on the relationships among concepts in the Unified Medical Language System (UMLS). However, an analysis of the impact of using multi-word concepts is lacking. In this study, I’ll compare the use of the clinical notes as inputs for prediction withthe one of clinical notes retrofitted with both single-word (e.g. Heart) and multiword (e.g. Heart structure) concepts. Results show that: 1. retrofitting single-word concepts improved word representations and improved the performance of the prediction model. 2. retrofitting multi-word concepts improved the results, but not significantly. The improvement with multi-word concepts was small probably, due to the small number of multi-word concepts that could be annotated. Hence, multi-word concepts may prove even more beneficial when many multi-word concepts can be linked to the UMLS.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/16205