(20 de octubre del 2022. El Venezolano).- Meta ha asegurado que está desarrollando una tecnología basada en Inteligencia Artificial (IA) que sea capaz de traducir idiomas que no disponen de una gramática y una ortografía oficial, esto es, lenguas no escritas.
La compañía ha hecho un adelanto del desarrollo de su proyecto Universal Speech Translator (UST), con el que busca crear un modelo de traducción en tiempo real en todos los idiomas existentes, para «romper barreras y unir a las personas», según ha indicado en un comunicado.
Este proyecto, que se centra en fomentar la comunicación hablada en diferentes escenarios, tanto en el mundo real como en el metaverso, contempla dar soporte a todos los idiomas, independientemente de que sean escritos y hablados o exclusivamente hablados.
Meta ha comentado que, hasta ahora, la traducción mediante IA «se ha centrado principalmente en las lenguas escritas» y ha reconocido que existen más de 7.000 idiomas vivos en todo el mundo de los cuales cerca de la mitad «no disponen de un sistema de escritura estándar o ampliamente utilizado».
Asimismo, ha reiterado que es consciente de ese vacío existente en estos últimos debido a que los modelos de aprendizaje automático precisan de mayor información para desarrollar una traducción simultánea. Por ejemplo, gramática y ortografía.
Para hacer frente a este reto, ha creado su primer sistema de traducción para una lengua principalmente oral, como es el hokkien. Esta, que se habla en algunas regiones chinas, carece de una forma escrita estándar, por lo que inicialmente no se podría traducir mediante sus estándares de IA.
Para trabajar en este proyecto, la compañía señala que la recopilación de datos «fue un obstáculo importante», principalmente porque no tenía información suficiente para crear modelos de ‘machine leargning’, reportó Europa Press.
Para dar solución a esta falta de información, Meta aprovechó el chino mandarín como lengua intermedia para construir traducciones relativamente fieles. En primes lugar, tradujo el habla hokkien a texto mandarín. Como consecuencia de este paso intermedio, el resultado de la traducción mejoró al tomar como referencia los datos de un idioma similar.
A continuación, mediante un modelo de entrenamiento, se analizó la semántica y la oratoria de esta lengua y se comparó con otras lenguas que sí disponen de un formato escrito, como el inglés. Después, sintetizó la lengua inglesa a partir de textos escritos y originó una lengua paralela entre el hokkien y el inglés.