This thesis falls within the field of typological and descriptive linguistics, with particular attention to valency theory and its applications to the study of contemporary Italian. A systematic analysis will be carried out on the valency patterns found in the Italian databases of ValPaL (Leipzig Valency Classes Project) and PaVeDa (Pavia Verbs Database), both of which are projects aimed at the cross-linguistic comparison of valency classes. Following the theoretical and methodological framework of these projects, the thesis proposes a structured investigation focused on revising and expanding the Italian contribution to the databases. The study examines the 94 Italian verb senses corresponding to those selected in ValPaL, and proposes corrections and additions concerning not only the basic coding frames and valency alternations attested, but also the examples provided for each alternation, the selection of Italian verb equivalents, the definitions of the alternations themselves, as well as their overall organization. The work adopts a specifically corpus-based approach, using data extracted from the ItTenTen20 corpus via the SketchEngine platform, and includes quantitative, qualitative, and distributional analyses of all relevant critical points. Correction proposals are also advanced with the aim of increasing the internal consistency of the database and improving its representativeness in relation to actual Italian usage. The thesis thus aims to provide an updated and systematic description of Italian valency classes, also addressing methodological and structural issues observed in the current database.

Questa tesi si inserisce nel contesto della linguistica tipologica e descrittiva, con particolare attenzione alla teoria della valenza verbale e alle sue applicazioni nello studio dell’italiano contemporaneo. Si procederà all’analisi sistematica dei pattern valenziali presenti nei database di italiano di ValPaL (Leipzig Valency Classes Project) e PaVeDa (Pavia Verbs Database), progetti volti all’esame comparativo delle classi di valenza in prospettiva cross-linguistica. Secondo il modello teorico e metodologico di tali progetti, viene quindi proposta un’indagine strutturata con focus sulla revisione e l’ampliamento del contributo italiano all’interno dei database. Lo studio prende in esame i 94 significati verbali italiani corrispondenti a quelli selezionati in ValPaL proponendo per ciascuno di essi correzioni e integrazioni riguardo non solo ai basic coding frame e alle alternanze valenziali presenti, ma anche agli esempi riportati per ciascuna di esse, alla selezione degli stessi corrispettivi verbali italiani, alle definizioni stesse delle alternanze, nonché alla loro organizzazione. Il lavoro prevede un approccio specificamente corpus-based, con dati estratti dal corpus ItTenTen20 tramite la piattaforma SketchEngine, e include analisi quantitative, qualitative e distribuzionali per tutti i punti ritenuti critici. Vengono inoltre avanzate proposte di correzione, con lo scopo di aumentare la coerenza interna del database e migliorarne la rappresentatività rispetto all’uso reale dell’italiano. La tesi ha quindi l’obiettivo di fornire una descrizione aggiornata e sistematica delle classi valenziali dell’italiano, anche discutendo alcune problematiche metodologiche e strutturali rilevate nel database attuale.

Il database di Italiano Standard in PaVeDa: criticità e proposte di miglioramento

CIPPARONE, IRENE
2024/2025

Abstract

This thesis falls within the field of typological and descriptive linguistics, with particular attention to valency theory and its applications to the study of contemporary Italian. A systematic analysis will be carried out on the valency patterns found in the Italian databases of ValPaL (Leipzig Valency Classes Project) and PaVeDa (Pavia Verbs Database), both of which are projects aimed at the cross-linguistic comparison of valency classes. Following the theoretical and methodological framework of these projects, the thesis proposes a structured investigation focused on revising and expanding the Italian contribution to the databases. The study examines the 94 Italian verb senses corresponding to those selected in ValPaL, and proposes corrections and additions concerning not only the basic coding frames and valency alternations attested, but also the examples provided for each alternation, the selection of Italian verb equivalents, the definitions of the alternations themselves, as well as their overall organization. The work adopts a specifically corpus-based approach, using data extracted from the ItTenTen20 corpus via the SketchEngine platform, and includes quantitative, qualitative, and distributional analyses of all relevant critical points. Correction proposals are also advanced with the aim of increasing the internal consistency of the database and improving its representativeness in relation to actual Italian usage. The thesis thus aims to provide an updated and systematic description of Italian valency classes, also addressing methodological and structural issues observed in the current database.
2024
The Standard Italian Database in PaVeDa: Critical Issues and Proposals for Improvement
Questa tesi si inserisce nel contesto della linguistica tipologica e descrittiva, con particolare attenzione alla teoria della valenza verbale e alle sue applicazioni nello studio dell’italiano contemporaneo. Si procederà all’analisi sistematica dei pattern valenziali presenti nei database di italiano di ValPaL (Leipzig Valency Classes Project) e PaVeDa (Pavia Verbs Database), progetti volti all’esame comparativo delle classi di valenza in prospettiva cross-linguistica. Secondo il modello teorico e metodologico di tali progetti, viene quindi proposta un’indagine strutturata con focus sulla revisione e l’ampliamento del contributo italiano all’interno dei database. Lo studio prende in esame i 94 significati verbali italiani corrispondenti a quelli selezionati in ValPaL proponendo per ciascuno di essi correzioni e integrazioni riguardo non solo ai basic coding frame e alle alternanze valenziali presenti, ma anche agli esempi riportati per ciascuna di esse, alla selezione degli stessi corrispettivi verbali italiani, alle definizioni stesse delle alternanze, nonché alla loro organizzazione. Il lavoro prevede un approccio specificamente corpus-based, con dati estratti dal corpus ItTenTen20 tramite la piattaforma SketchEngine, e include analisi quantitative, qualitative e distribuzionali per tutti i punti ritenuti critici. Vengono inoltre avanzate proposte di correzione, con lo scopo di aumentare la coerenza interna del database e migliorarne la rappresentatività rispetto all’uso reale dell’italiano. La tesi ha quindi l’obiettivo di fornire una descrizione aggiornata e sistematica delle classi valenziali dell’italiano, anche discutendo alcune problematiche metodologiche e strutturali rilevate nel database attuale.
File in questo prodotto:
File Dimensione Formato  
Il database di italiano standard in PaVeDa - ciriticità e proposte di miglioramento.pdf

accesso aperto

Dimensione 1.65 MB
Formato Adobe PDF
1.65 MB Adobe PDF Visualizza/Apri

È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14239/30564