El nuevo sistema puede abrir los aproximadamente 7.000 idiomas hablados del mundo a la traducción por computadora.

Los investigadores del MIT han desarrollado un modelo novedoso de traducción de idiomas "sin supervisión", lo que significa que funciona sin necesidad de anotaciones ni orientación humana, lo que podría llevar a traducciones más rápidas y eficientes por computadora de muchos más idiomas.

Los sistemas de traducción de Google, Facebook y Amazon requieren modelos de capacitación para buscar patrones en millones de documentos, como documentos legales y políticos, o artículos de noticias, que han sido traducidos a varios idiomas por humanos. Pero estos datos de traducción requieren mucho tiempo y son difíciles de recopilar, y es posible que simplemente no existan para muchos de los 7,000 idiomas que se hablan en todo el mundo.

En un documento que se presentó esta semana en la Conferencia sobre Métodos Empíricos en el Procesamiento del Lenguaje Natural, los investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) de MIT describen un modelo que se ejecuta más rápido y más eficientemente que estos modelos monolingües.

El modelo aprovecha una métrica en las estadísticas, llamada distancia Gromov-Wasserstein, que esencialmente mide distancias entre puntos en un espacio computacional y los compara con puntos distanciados de manera similar en otro espacio. Aplican esa técnica a las "incrustaciones de palabras" de dos idiomas, que son palabras representadas como vectores, básicamente, matrices de números, con palabras de significados similares agrupadas entre sí. Al hacerlo, el modelo alinea rápidamente las palabras, o vectores, en ambas incrustaciones que están más estrechamente correlacionadas por distancias relativas, lo que significa que es probable que sean traducciones directas.

Artificial Intelligence - A Robotic Illustration

En los experimentos, el modelo de los investigadores funcionó con la misma precisión que los modelos monolingües de última generación, y en ocasiones con mayor precisión, pero mucho más rápido y utilizando solo una fracción de la potencia de cálculo.

Una posible ventaja del modelo es que produce automáticamente un valor que se puede interpretar como cuantificación, en una escala numérica, de la similitud entre idiomas. Esto podría ser útil para estudios de lingüística, dicen los investigadores. El modelo calcula cuán distantes están todos los vectores entre sí en dos incrustaciones, lo que depende de la estructura de la oración y otros factores. Si todos los vectores están muy cerca, obtendrán una puntuación cercana a 0, y cuanto más separados estén, mayor será la puntuación.

 

 

Fuente: MIT News

author image

About Juan Trinidad Mayo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

También podría gustarte...