This master thesis work is devoted to the study of the theoretical background of Text Mining and its` practical application on practice using R programming language. With the help of such techniques including text pre-processing, topic modeling, and data visualization, the research shows how large scopes of unstructured textual data can be processed and, therefore, lead to insights regarding a particular subject. In the case of this project, the analysis is carried out upon the interviews with general managers of healthcare institutions in Lombardy. The discussion is aimed at innovation management practices in the healthcare industry. The algorithm presented in this work is based on the LDA method, / allowing to define the main topics of the examined data and turning them into knowledge. Keywords: text mining, topic modelling, LDA, R programming language

Questo lavoro di tesi magistrale è dedicato allo studio del background teorico del Text Mining e alla sua applicazione pratica con l'utilizzo del linguaggio di programmazione R. Con l'aiuto di tecniche quali la pre-elaborazione del testo, la modellazione dei temi e la visualizzazione dei dati, la ricerca mostra come ampie porzioni di dati testuali non strutturati possano essere elaborate e, quindi, portare ad approfondimenti su un particolare argomento. Nel caso di questa composizione, l'analisi è stata condotta su interviste a direttori generali di istituzioni sanitarie lombarde. La discussione verte sulle pratiche di gestione dell'innovazione nel settore sanitario. L'algoritmo presentato in questo lavoro si basa sul metodo LDA, che permette di definire gli argomenti principali dei dati esaminati e di trasformarli in conoscenza. Parole chiave: text mining, topic modelling, LDA, linguaggio di programmazione R

Il Text Mining come strumento per valutare le pratiche di gestione dell'innovazione nel settore sanitario. Il caso della Lombardia.

ABRAMENKO, MARIIA
2021/2022

Abstract

This master thesis work is devoted to the study of the theoretical background of Text Mining and its` practical application on practice using R programming language. With the help of such techniques including text pre-processing, topic modeling, and data visualization, the research shows how large scopes of unstructured textual data can be processed and, therefore, lead to insights regarding a particular subject. In the case of this project, the analysis is carried out upon the interviews with general managers of healthcare institutions in Lombardy. The discussion is aimed at innovation management practices in the healthcare industry. The algorithm presented in this work is based on the LDA method, / allowing to define the main topics of the examined data and turning them into knowledge. Keywords: text mining, topic modelling, LDA, R programming language
2021
Text Mining as a Tool to Assess Innovation Management Practices in the Healthcare Industry. The Case of Lombardy.
Questo lavoro di tesi magistrale è dedicato allo studio del background teorico del Text Mining e alla sua applicazione pratica con l'utilizzo del linguaggio di programmazione R. Con l'aiuto di tecniche quali la pre-elaborazione del testo, la modellazione dei temi e la visualizzazione dei dati, la ricerca mostra come ampie porzioni di dati testuali non strutturati possano essere elaborate e, quindi, portare ad approfondimenti su un particolare argomento. Nel caso di questa composizione, l'analisi è stata condotta su interviste a direttori generali di istituzioni sanitarie lombarde. La discussione verte sulle pratiche di gestione dell'innovazione nel settore sanitario. L'algoritmo presentato in questo lavoro si basa sul metodo LDA, che permette di definire gli argomenti principali dei dati esaminati e di trasformarli in conoscenza. Parole chiave: text mining, topic modelling, LDA, linguaggio di programmazione R
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/2218