La presente tesi si propone di descrivere il lavoro di annotazione manuale degli atti linguistici svolto sui dati di parlato contenuti nel corpus “WhAP!”, il primo corpus italiano di conversazioni WhatsApp. In particolare, il processo di annotazione pragmatica rappresenta uno dei primi passi verso la pubblicazione della risorsa, che al momento è ancora in fase di costruzione. Il lavoro unisce dunque concetti e metodologie tratte da branche separate ma allo stesso tempo comunicanti della Linguistica, vale a dire la linguistica dei corpora, la linguistica computazionale e la pragmatica. A partire dalle tassonomie degli atti linguistici di Austin e Searle, unite a proposte più recenti nate da lavori di annotazioni pragmatiche svolti da linguisti, si elaborerà un set di etichette che ben si adatti ai dati a disposizione. Tramite l’utilizzo del software di annotazione INCEpTION, si procederà dunque all’annotazione vera e propria, di cui verranno discussi i passaggi e le sfide metodologiche. L’obiettivo è quello di mettere a disposizione alla comunità scientifica una proposta di annotazione pragmatica di parte dei dati contenuti nel corpus, al fine di offrire le basi per future ricerche linguistiche che desiderino analizzare da un punto di vista pragmatico la varietà di italiano utilizzata nei messaggi vocali su WhatsApp, facendo uso di dati linguistici autentici. In questo modo, sarà possibile osservare il comportamento linguistico dei parlanti su questo servizio di messaggistica e accrescere la conoscenza pragmatica dei tratti e delle strutture linguistiche di questo linguaggio ibrido “in azione”.
Annotazione pragmatica del corpus "WhAP!": analisi degli atti linguistici nei messaggi vocali su WhatsApp
MARINO, GIULIA
2021/2022
Abstract
La presente tesi si propone di descrivere il lavoro di annotazione manuale degli atti linguistici svolto sui dati di parlato contenuti nel corpus “WhAP!”, il primo corpus italiano di conversazioni WhatsApp. In particolare, il processo di annotazione pragmatica rappresenta uno dei primi passi verso la pubblicazione della risorsa, che al momento è ancora in fase di costruzione. Il lavoro unisce dunque concetti e metodologie tratte da branche separate ma allo stesso tempo comunicanti della Linguistica, vale a dire la linguistica dei corpora, la linguistica computazionale e la pragmatica. A partire dalle tassonomie degli atti linguistici di Austin e Searle, unite a proposte più recenti nate da lavori di annotazioni pragmatiche svolti da linguisti, si elaborerà un set di etichette che ben si adatti ai dati a disposizione. Tramite l’utilizzo del software di annotazione INCEpTION, si procederà dunque all’annotazione vera e propria, di cui verranno discussi i passaggi e le sfide metodologiche. L’obiettivo è quello di mettere a disposizione alla comunità scientifica una proposta di annotazione pragmatica di parte dei dati contenuti nel corpus, al fine di offrire le basi per future ricerche linguistiche che desiderino analizzare da un punto di vista pragmatico la varietà di italiano utilizzata nei messaggi vocali su WhatsApp, facendo uso di dati linguistici autentici. In questo modo, sarà possibile osservare il comportamento linguistico dei parlanti su questo servizio di messaggistica e accrescere la conoscenza pragmatica dei tratti e delle strutture linguistiche di questo linguaggio ibrido “in azione”.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/2459