I disturbi dello spettro autistico (dall’inglese Autism Spectrum Disorders, ASD) descrivono un insieme eterogeneo di condizioni classificate nel Manuale diagnostico e statistico dei disturbi mentali (DSM-5) come disturbi dello sviluppo neurologico. Sebbene i meccanismi alla base dell'ASD non siano ancora completamente compresi, la letteratura più recente ricerca le cause nella genetica e/o in fattori ambientali di vario tipo. L’aumento nei tassi di prevalenza dell'ASD negli ultimi dieci anni suggerisce che l'ASD rappresenta un significativo problema di salute pubblica mondiale che stimola l’avanzamento della ricerca in questo campo. Gli ASD sono caratterizzati, a vari livelli di complessità e gravità, da difficoltà persistente nella comunicazione; infatti, gli individui con ASD presentano spesso schemi atipici nel parlato come tono monotono, stress ridotto, intonazione piatta e persino differenze nella struttura armonica del loro discorso. La presenza di anomalie prosodiche negli autistici è riconosciuta da clinici esperti. In questo elaborato di tesi si è quindi cercato di caratterizzare gli elementi prosodici che meglio contraddistinguono l’autismo al fine di supportare la diagnosi tradizionale, basata su criteri descrittivi, con tecniche capaci di valutazioni più quantitative e oggettive. Il contesto in cui si inserisce questo lavoro è quello del progetto VOCE, Comunicatore Visuale per la traduziOne automatiCa di Espressioni vocali in immagini e simboli. Il progetto vuole realizzare, in unico dispositivo, un’applicazione che consente la comunicazione tra un soggetto ASD che utilizza la comunicazione aumentativa ed alternativa (CAA) e uno con normali capacità verbali, sfruttando tecnologie digitali quali tecniche di signal processing, di machine learning e di intelligenza artificiale. L’elaborato scritto del presente lavoro di tesi si articola nei capitoli descritti di seguito. Nel Capitolo 1 vengono fornite conoscenze generali sull’autismo; in particolare se ne descrivono la sintomatologia, l’epidemiologia e l’evoluzione dei criteri diagnostici utilizzati da medici esperti per la sua valutazione. In ultimo si pone l’attenzione su uno dei possibili marcatori utilizzabili per la diagnosi di autismo, cioè la produzione verbale atipica. Nel Capitolo 2 vengono analizzate le tecniche di audio signal processing per la scomposizione del segnale vocale nelle caratteristiche del tratto vocale e della sorgente vocale. Si sono quindi evidenziati i lavori e gli studi in letteratura che sfruttano le caratteristiche acustiche per addestrare e testare approcci di apprendimento automatico al fine di caratterizzare il parlato autistico. Nel Capitolo 3 si descrive il corpus audio utilizzato, le tecniche di pre-processing e signal processing utilizzate per estrarre dal segnale vocale tre serie di caratteristiche acustiche, quali le caratteristiche del filtro tratto vocale, le caratteristiche della sorgente di eccitazione e le caratteristiche combinate sorgente-filtro. Infine, si delineano gli step seguiti per la classificazione al fine di distinguere il gruppo degli individui con ASD da quelli neurotipici. Nel Capitolo 4 si mostrano e discutono i risultati ottenuti dalla classificazione e dall’analisi statistica svolta sulle caratteristiche estratte.
Estrazione di caratteristiche acustiche per la classificazione automatica della voce di soggetti autistici e neurotipici in età pediatrica
VACCA, JESSICA
2021/2022
Abstract
I disturbi dello spettro autistico (dall’inglese Autism Spectrum Disorders, ASD) descrivono un insieme eterogeneo di condizioni classificate nel Manuale diagnostico e statistico dei disturbi mentali (DSM-5) come disturbi dello sviluppo neurologico. Sebbene i meccanismi alla base dell'ASD non siano ancora completamente compresi, la letteratura più recente ricerca le cause nella genetica e/o in fattori ambientali di vario tipo. L’aumento nei tassi di prevalenza dell'ASD negli ultimi dieci anni suggerisce che l'ASD rappresenta un significativo problema di salute pubblica mondiale che stimola l’avanzamento della ricerca in questo campo. Gli ASD sono caratterizzati, a vari livelli di complessità e gravità, da difficoltà persistente nella comunicazione; infatti, gli individui con ASD presentano spesso schemi atipici nel parlato come tono monotono, stress ridotto, intonazione piatta e persino differenze nella struttura armonica del loro discorso. La presenza di anomalie prosodiche negli autistici è riconosciuta da clinici esperti. In questo elaborato di tesi si è quindi cercato di caratterizzare gli elementi prosodici che meglio contraddistinguono l’autismo al fine di supportare la diagnosi tradizionale, basata su criteri descrittivi, con tecniche capaci di valutazioni più quantitative e oggettive. Il contesto in cui si inserisce questo lavoro è quello del progetto VOCE, Comunicatore Visuale per la traduziOne automatiCa di Espressioni vocali in immagini e simboli. Il progetto vuole realizzare, in unico dispositivo, un’applicazione che consente la comunicazione tra un soggetto ASD che utilizza la comunicazione aumentativa ed alternativa (CAA) e uno con normali capacità verbali, sfruttando tecnologie digitali quali tecniche di signal processing, di machine learning e di intelligenza artificiale. L’elaborato scritto del presente lavoro di tesi si articola nei capitoli descritti di seguito. Nel Capitolo 1 vengono fornite conoscenze generali sull’autismo; in particolare se ne descrivono la sintomatologia, l’epidemiologia e l’evoluzione dei criteri diagnostici utilizzati da medici esperti per la sua valutazione. In ultimo si pone l’attenzione su uno dei possibili marcatori utilizzabili per la diagnosi di autismo, cioè la produzione verbale atipica. Nel Capitolo 2 vengono analizzate le tecniche di audio signal processing per la scomposizione del segnale vocale nelle caratteristiche del tratto vocale e della sorgente vocale. Si sono quindi evidenziati i lavori e gli studi in letteratura che sfruttano le caratteristiche acustiche per addestrare e testare approcci di apprendimento automatico al fine di caratterizzare il parlato autistico. Nel Capitolo 3 si descrive il corpus audio utilizzato, le tecniche di pre-processing e signal processing utilizzate per estrarre dal segnale vocale tre serie di caratteristiche acustiche, quali le caratteristiche del filtro tratto vocale, le caratteristiche della sorgente di eccitazione e le caratteristiche combinate sorgente-filtro. Infine, si delineano gli step seguiti per la classificazione al fine di distinguere il gruppo degli individui con ASD da quelli neurotipici. Nel Capitolo 4 si mostrano e discutono i risultati ottenuti dalla classificazione e dall’analisi statistica svolta sulle caratteristiche estratte.È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: unitesi@unipv.it.
https://hdl.handle.net/20.500.14239/14349