Il meccanismo di traduzione si basa principalmente su meccanismi legati alle lingue scritte ma quasi la metà delle circa 7.000 lingue conosciute al mondo, quattro su dieci, non hanno una componente scritta. Così, queste lingue non scritte rappresentano un problema per i moderni sistemi di traduzione ad apprendimento automatico, che in genere convertono il parlato in parole scritte prima di tradurre nella nuova lingua e riportare il testo al parlato.

Nell’ambito del programma Universal Speech Translator (UST) di Meta, che sta lavorando per sviluppare la traduzione vocale in tempo reale in modo che gli utenti del metaverso possano interagire più facilmente, i ricercatori hanno analizzato l’Hokkien, una lingua non scritta parlata in tutta l’Asia e una delle lingue ufficiali di Taiwan.

I sistemi di traduzione automatica richiedono in genere ampi esempi etichettabili della lingua, sia scritta che parlata, su cui allenarsi – proprio ciò che le lingue non scritte come l’Hokkien non hanno.

Per ovviare a questo problema il CEO Mark Zuckerberg ha spiegato che “è stata utilizzata la traduzione da voce a unità (S2UT) per convertire il parlato in ingresso in una sequenza di unità acustiche direttamente nel percorso precedentemente sperimentato.” E “Poi abbiamo generato forme d’onda dalle unità. Inoltre, UnitY è stato adottato per un meccanismo di decodifica a due passaggi in cui il primo decodificatore genera testo in una lingua correlata (il mandarino) e il secondo decodificatore crea unità“.

Abbiamo sfruttato il mandarino come lingua intermedia per costruire pseudo-etichette, traducendo prima il parlato inglese (o hokkien) in testo mandarino e poi traducendolo in hokkien (o inglese) e aggiungendolo ai dati di addestramento“, ha proseguito.

Attualmente, il sistema consente a chi parla Hokkien di conversare con chi parla inglese, anche se in modo non fluido. Il modello è in grado di tradurre solo una frase completa alla volta, ma Zuckerberg è fiducioso che la tecnica possa essere applicata a un numero maggiore di lingue e che possa migliorare fino a offrire una traduzione in tempo reale.

Meta renderà disponibili le informazioni per incoraggiare altri ricercatori a lavorare alla traduzione orale dell’hokkien.

Articolo precedenteOPPO Find N2 ha svelato maggiori dettagli in un nuovo leak
Articolo successivoGalaxy S23: nuove cover in leak confermano il design
Carolina Napolano
La tecnologia, roba da donne: ecco la blogger per promuovere il lato rosa della tecnologia.