The dissertation presents theoretical starting points, procedures and results of an experiment comparing the automatic clustering of Italian direct Objects, operated by the agglomerative hierarchical algorithm of the Sketch Engine corpus tool, with the manual clustering of direct Objects carried out in the T-PAS resource. The aim of the cluster analysis provided is threefold: a) to define the differences occurring between a noun-oriented clustering approach (Sketch Engine) and a verb-oriented one (T-PAS), with respect to the capability of representing the various senses of a verb; b) to investigate the intrinsic phenomena to semantic selection of verbs and the construction of verb senses in context; c) to improve the semantic quality of automatic clusters against expert human intuition, by exposing the aspects verified as most complex. The thesis is developed under the Composition Theory’s approach to verb meaning and verbal polysemy, applied to clustering techniques. As highlighted by Pustejovsky (1995, 2002), in fact, the semantics of each verb is determined by the totality of its complementation patterns. Therefore, arguments play a fundamental role in verb meaning and verbal polysemy, thanks to the sense co-composition principle between verb and argument.
La dissertazione presenta basi teoriche, procedure e risultati di un esperimento di comparazione tra il clustering automatico di Oggetti diretti di verbi italiani, operato dall'algoritmo gerarchico agglomerativo dello strumento Sketch Engine, e il clustering manuale di Oggetti diretti effettuato nella risorsa T-PAS. Lo scopo della cluster analysis fornita è triplice: a) definire le differenze che si verificano tra un approccio di clustering noun-oriented (Sketch Engine) e uno verb-oriented (T-PAS), rispetto alla capacità di rappresentare i vari sensi di un verbo; b) indagare i fenomeni intrinseci alla selezione semantica dei verbi e alla costruzione dei sensi dei verbi in un dato contesto; c) migliorare la qualità semantica dei clusters automatici rispetto l'intuizione di parlanti ed esperti, mettendo in luce gli aspetti che sono stati empiricamente verificati come più complessi. La tesi si sviluppa seguendo l'approccio della Composition Theory al significato dei verbi e alla polisemia verbale, applicandolo alle tecniche di clustering. Come evidenziato da Pustejovsky (1995, 2002), infatti, la semantica di ogni verbo è determinata dalla totalità dei suoi pattern argomentali. Di conseguenza, gli argomenti verbali giocano un ruolo fondamentale nel significato dei verbi stessi e nella polisemia verbale, sulla base del principio di co-composizione del senso tra verbo e argomento.
Clustering di oggetti verbali: procedure automatiche e manuali a confronto
COLUCCI, ILARIA
2019/2020
Abstract
The dissertation presents theoretical starting points, procedures and results of an experiment comparing the automatic clustering of Italian direct Objects, operated by the agglomerative hierarchical algorithm of the Sketch Engine corpus tool, with the manual clustering of direct Objects carried out in the T-PAS resource. The aim of the cluster analysis provided is threefold: a) to define the differences occurring between a noun-oriented clustering approach (Sketch Engine) and a verb-oriented one (T-PAS), with respect to the capability of representing the various senses of a verb; b) to investigate the intrinsic phenomena to semantic selection of verbs and the construction of verb senses in context; c) to improve the semantic quality of automatic clusters against expert human intuition, by exposing the aspects verified as most complex. The thesis is developed under the Composition Theory’s approach to verb meaning and verbal polysemy, applied to clustering techniques. As highlighted by Pustejovsky (1995, 2002), in fact, the semantics of each verb is determined by the totality of its complementation patterns. Therefore, arguments play a fundamental role in verb meaning and verbal polysemy, thanks to the sense co-composition principle between verb and argument.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/850