The research conducted in this thesis consists in an analysis of arguments of Italian verbs from the T-PAS resource or Typed-Predicate Argument Structure (Jezek, Magnini, Feltracco, Bianchini & Popescu, 2014), using computational methods, mainly word embeddings. The main purpose is to identify the characteristics of prototypical arguments of verbs, exploiting the polysemy of verbs, and to show that this feature can be helpful in the investigation of prototypicality. We expect to individuate eventual patterns regarding prototypicality, which can be useful in applications and tasks of Natural Language Processing. Problems of semantic annotation, polysemy, and its formal and theoretical representation, in relation to computational methods are addressed. The experiments carried out on the data consist in the creation of a model that is able to predict the verbs’ argument fillers in the sentence, employing exclusively semantic information. To do so, the centroid will constitute the core of our model. Finally, from the obtained results, we demonstrate that the application of the concept of prototypicality to verbs’ arguments depends not only on the semantics of the verbs, but also on the semantics of the different meanings they convey. The application of the concept of prototypicality better suits the patterns’ arguments slots that can be filled by elements of a specific and circumscribed semantic field rather than by a generic and under-specified one.

La ricerca condotta in questa tesi consiste nell’analisi di argomenti di verbi italiani presi dalla risorsa T-PAS (Typed-Predicate Argument Structure) (Jezek, Magnini, Feltracco, Bianchini & Popescu, 2014), usando metodi computazionali, principalmente vettori di parole. Lo scopo principale è identificare le caratteristiche di argomenti prototipici dei verbi, sfruttando la polisemia dei verbi stessi, dimostrando come questa possa essere utile nell’investigare la prototipicità. Ci aspettiamo di individuare eventuali patterns riguardanti la prototipicità, che possano essere utili in applicazioni e compiti di Natural Language Processing. Sono affrontati problemi di annotazione semantica, polisemia e la sua rappresentazione formale e teorica, anche in relazione a metodi computazionali. Gli esperimenti svolti consistono nella creazione di un modello capace di predire i riempitivi degli argomenti di verbi nella frase, utilizzando esclusivamente informazione semantica. Per fare questo, il centroide costituirà il nucleo del nostro modello. Infine, dai risultati ottenuti, dimostriamo che l’applicazione del concetto di prototipicità meglio si adatta a slots di argomenti di pattern che possono essere riempiti da elementi di un campo semantico circoscritto e specifico piuttosto che da uno generico.

Selezione semantica dei verbi: Studio sulla prototipicità di argomenti usando vettori di parole.

ZELLA, GRETA
2021/2022

Abstract

The research conducted in this thesis consists in an analysis of arguments of Italian verbs from the T-PAS resource or Typed-Predicate Argument Structure (Jezek, Magnini, Feltracco, Bianchini & Popescu, 2014), using computational methods, mainly word embeddings. The main purpose is to identify the characteristics of prototypical arguments of verbs, exploiting the polysemy of verbs, and to show that this feature can be helpful in the investigation of prototypicality. We expect to individuate eventual patterns regarding prototypicality, which can be useful in applications and tasks of Natural Language Processing. Problems of semantic annotation, polysemy, and its formal and theoretical representation, in relation to computational methods are addressed. The experiments carried out on the data consist in the creation of a model that is able to predict the verbs’ argument fillers in the sentence, employing exclusively semantic information. To do so, the centroid will constitute the core of our model. Finally, from the obtained results, we demonstrate that the application of the concept of prototypicality to verbs’ arguments depends not only on the semantics of the verbs, but also on the semantics of the different meanings they convey. The application of the concept of prototypicality better suits the patterns’ arguments slots that can be filled by elements of a specific and circumscribed semantic field rather than by a generic and under-specified one.
2021
Semantic selection of verbs: A study about prototypicality of arguments using word embeddings.
La ricerca condotta in questa tesi consiste nell’analisi di argomenti di verbi italiani presi dalla risorsa T-PAS (Typed-Predicate Argument Structure) (Jezek, Magnini, Feltracco, Bianchini & Popescu, 2014), usando metodi computazionali, principalmente vettori di parole. Lo scopo principale è identificare le caratteristiche di argomenti prototipici dei verbi, sfruttando la polisemia dei verbi stessi, dimostrando come questa possa essere utile nell’investigare la prototipicità. Ci aspettiamo di individuare eventuali patterns riguardanti la prototipicità, che possano essere utili in applicazioni e compiti di Natural Language Processing. Sono affrontati problemi di annotazione semantica, polisemia e la sua rappresentazione formale e teorica, anche in relazione a metodi computazionali. Gli esperimenti svolti consistono nella creazione di un modello capace di predire i riempitivi degli argomenti di verbi nella frase, utilizzando esclusivamente informazione semantica. Per fare questo, il centroide costituirà il nucleo del nostro modello. Infine, dai risultati ottenuti, dimostriamo che l’applicazione del concetto di prototipicità meglio si adatta a slots di argomenti di pattern che possono essere riempiti da elementi di un campo semantico circoscritto e specifico piuttosto che da uno generico.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/2130