EchoSpeech, occhiali sviluppati dal Cornell Lab, sfruttano un’interfaccia di riconoscimento vocale-silenzioso basato su IA sonar per rilevare i movimenti delle labbra, permettendo di sbloccare il dispositivo con una password “sussurrata”.

Un futuro in cui sussurrare una password anziché digitarla potrebbe essere la norma. E’ questa l’idea dietro la creazione di un’interfaccia di riconoscimento vocale-silenzioso sviluppata dallo Smart Computer Interfaces for Future Interactions Lab di Cornell (NY, USA). L’interfaccia è in grado di riconoscere fino a 31 comandi eseguiti con il solo movimento delle labbra grazie all’uso di un sistema sonar basato sull’intelligenza artificiale che utilizza onde sonore per rilevare i movimenti delle labbra. 

Il sistema è stato implementato in un paio di occhiali chiamati EchoSpeech, che permettono di sbloccare il dispositivo con una password “sussurrata” e consumano pochissima energia. Il livello di precisione dell’interfaccia è del 95%, il che la rende una soluzione altamente affidabile. 

Le applicazioni potenziali di questa tecnologia sono molteplici: il sistema potrebbe essere utilizzato da persone con difficoltà di comunicazione, in ambienti che richiedono silenzio come biblioteche o ospedali, o ancora da professionisti che hanno bisogno di un metodo di input silenzioso. 

Secondo l’autore principale della ricerca, Ruidong Zhang, “per le persone che non possono vocalizzare il suono, questa tecnologia vocale silenziosa potrebbe essere un eccellente input per un sintetizzatore vocale. Potrebbe restituire ai pazienti la loro voce”. 

L’uso dell’onda sonora come mezzo per rilevare i movimenti delle labbra è anche una scelta vincente in termini di privacy, in quanto evita i problemi di privacy e di sicurezza legati all’uso di telecamere. Inoltre, i file audio generati sono di dimensioni inferiori rispetto a quelli video o di immagini statiche, il che li rende facilmente trasferibili tramite Bluetooth sui dispositivi dell’utilizzatore senza appesantire troppo la batteria. 

L’interfaccia di riconoscimento vocale-silenzioso rappresenta un passo avanti verso un futuro in cui la tecnologia sarà sempre più in grado di adattarsi alle esigenze delle persone e di semplificare le nostre attività quotidiane attraverso soluzioni intelligenti e altamente innovative.

Articolo precedenteChatGPT: Microsoft integra l’IA (Copilot) su OneNote
Articolo successivoSamsung taglia produzione chip memoria per calo domanda