Potenziare la comunicazione attraverso l’intelligenza artificiale

Alessia Prete, PhD student presso MSU di Fondazione Toscana Life Sciences

Oggi, la fusione dell’intelligenza artificiale (AI), del machine learning (ML) e del deep learning (DL) sta rivoluzionando il modo in cui le industrie operano.

Dalla sanità, alla finanza, fino ad arrivare alla produzione, le applicazioni industriali intelligenti che incorporano algoritmi di ML e DL stanno fornendo livelli di automazione, efficienza e precisione senza precedenti.

Una delle applicazioni più promettenti e innovative di ML e DL è il campo della comunicazione aumentativa e alternativa (CAA), che mira ad aiutare le persone con disturbi della comunicazione come disturbi del linguaggio, disabilità linguistiche e disordini dello spettro autistico.

uomo con visore 3D su uno sfondo digitale

La comunicazione aumentata. Tra le tecnologie impiegate nella CAA spiccano i predittori di parole basati su modelli statistici, ovvero modelli che si riferiscono solo alla frequenza delle singole parole, non tenendo conto però del contesto e della sfera di significatività in cui esse sono inserite.

Per superare questa limitazione, si fa largo uso di reti neurali dette “ricorrenti”, come ad esempio BiLSTM (Bidirectional Long–Short Term Memory) o GRU (Gated Recurrent Units).

La peculiarità di queste reti è la loro capacità di apprendere e conservare informazioni rilevanti nel tempo, fornendo un supporto prezioso alle applicazioni di CAA.

Tali reti neurali ricorrenti sono state utilizzate per costruire un sistema di predizione della parola successiva sulla base del contesto e della significatività che viene impiegato per fornire suggerimenti intelligenti in una tastiera virtuale. Questo sistema offre un fondamentale supporto a pazienti con movimenti residui minimi o in uno stato di “locked-in”, per i quali è necessario catturare i segnali cerebrali.

L’informatica al servizio della salute. Il dispositivo utilizza un casco per elettroencefalogramma (EEG) e un software specializzato per facilitare la comunicazione attraverso un supporto informatico come un tablet o un PC. Esso è personalizzato in base alle esigenze specifiche di ciascun paziente, ed è in grado di generare suggerimenti personalizzati e utili.

Questo aspetto di personalizzazione è cruciale per migliorare l’esperienza comunicativa del paziente e per consentire alla tastiera virtuale di funzionare come un “assistente ausiliario” di supporto nel modo più efficace e veloce possibile.

Alessia Prete, PhD student presso MSU

Riferimenti

A. Prete et al., “Deep Learning Techniques for text generation to support Augmentative and Alternative Communication”,2023 IEEE International Conference on Metrology for eXtended Reality, Artificial In telligence and Neural Engineering (MetroXRAINE).

K. Cho et al., “On the properties of neural machine translation: encoder–decoder approaches”. arXiv:1409.1259, 2014.

R. de Sousa Gomide et al., ”A new concept of assistive virtual keyboards based on a systematic review of text entry optimization techniques”. Research on Biomedical Engineering, vol. 32, no. 2, pp. 176–198, 2016.

C. L. Mitchell et al., ”Ability–based Keyboards for Augmentative and Alternative Communication: Understanding How Individuals’ Movement Patterns Translate to More Efficient Keyboards: Methods to Generate Keyboards Tailored to User–specific Motor Abilities”. Extended abstracts on Human factors in computing systems. CHI Conference, paper no. 412, 2022.