Lilt Labs | Conexión entre investigación y práctica en la traducción

Por estas razones, la traducción automática neuronal es un enorme avance

Escrito por Chris Healy | 02-ago-2018 7:00:00

 

Si bien la traducción automática ha existido durante décadas, lo más extraño que leerás al respecto es la semejanza al Babel Fish, un dispositivo de traducción instantánea personal, listo para reemplazar a todos y cada uno de los traductores humanos. La parte que se omite es la relación de la traducción automática con los traductores humanos. Durante mucho tiempo, esta relación no era más que la posedición de texto mal traducido, un proceso que a la mayoría de los traductores les parece tedioso. Sin embargo, con la llegada de la traducción automática neuronal, la traducción automática no es algo que simplemente crea más trabajo tedioso para los traductores. Ahora es un socio para ellos, que los hace más rápidos y precisos.

 

Entonces, ¿cuál es el gran problema?

Antes de que nos adentramos en el nuevo y valiente mundo de la traducción del mañana, pongamos la tecnología en contexto. Antes de la traducción automática neuronal, históricamente han existido dos paradigmas principales. El primero fue la traducción automática basada en reglas (RBMT, por sus siglas en inglés); el segundo, dominante hasta muy recientemente, fue la traducción automática estadística (SMT) basada en frases.

A la hora de construir sistemas de traducción automática basados en reglas, los lingüistas y los científicos informáticos se unieron para escribir miles de reglas para traducir textos de un idioma a otro. Esto fue lo suficientemente bueno para que revisores monolingües pudieran tener una idea general de documentos importantes con contenido que, de otro modo, sería incomprensible en un idioma que no podían leer. Pero para realmente crear buenas traducciones, este enfoque tiene deficiencias obvias: exige muchísimo tiempo y, naturalmente, produce traducciones de baja calidad.

La SMT basada en frases, por otro lado, toma un gran volumen de texto bilingüe y crea un modelo estadístico de traducciones probables. El problema con la SMT es su dependencia de los sistemas. Por ejemplo, no puede asociar sinónimos o derivados de una sola palabra, ya que requiere el uso de un sistema complementario responsable de la morfología. También necesita un modelo de idiomas para garantizar la fluidez, pero esto se limita al entorno inmediato de una palabra. Por lo tanto, la SMT es propensa a generar errores gramaticales y es relativamente inflexible cuando encuentra frases que son diferentes de las incluidas en sus datos de entrenamiento.

Por último, nos encontramos ante la llegada de la traducción automática neuronal. Prácticamente, todos los sistemas de TAN usan lo que se conoce como arquitectura codificador-decodificador de atención. El sistema tiene dos redes neuronales principales, una que recibe una oración (el codificador) y la transforma en una serie de coordenadas o «vectores». Después, una red neuronal decodificadora transforma esos vectores en texto en otro idioma, con un mecanismo de atención en el medio, que ayuda a la red decodificadora a centrarse en las partes importantes de la producción del codificador.

El efecto de esta codificación es que un sistema de TAN aprende la similitud entre palabras y frases y las agrupa en el espacio. Por el contrario, un sistema de SMT solo ve un montón de palabras no relacionadas que pueden aparecer en una traducción con mayor o menor probabilidad.

Curiosamente, esta arquitectura es lo que hace posible la traducción zero-shot de Google, es decir, la traducción entre dos idiomas para los que no se haya entrenado al sistema antes. Una TAN multilingüe bien entrenada puede decodificar el mismo vector codificado en diferentes idiomas que conozca, sin importar que esos idiomas de origen y destino se hayan usado en el entrenamiento.

A medida que el decodificador avanza en la traducción, predice las palabras basándose en toda la oración hasta ese punto, lo cual significa que produce frases coherentes completas, a diferencia de la SMT. Lamentablemente, esto también significa que cualquier defecto que aparezca temprano en la oración tiende a ir aumentando, lo cual reduce la calidad del resultado. Algunos modelos de TAN también tienen dificultades con las palabras que no conocen, que generalmente son palabras poco comunes o nombres propios.

A pesar de sus defectos, la TAN representa una gran mejora en la calidad de la TA, y los defectos que tiene representan oportunidades.

 

Traductores y traducción automática: juntos al fin

Si bien las mejoras de la TA generalmente suponen un aumento en sus aplicaciones habituales (es decir, la posedición y la traducción automática), los verdaderos ganadores con la TAN son los traductores. Esto es particularmente cierto cuando un traductor puede usarla en tiempo real a medida que traduce, en lugar de poseditar la producción de la TA. Cuando el traductor trabaja activamente con un motor de TAN para crear una traducción, ambos pueden construir y aprender el uno del otro: el motor ofrece una traducción que el humano quizá no había tomado en cuenta, y el ser humano actúa como moderador y, por ende, maestro del motor.

Por ejemplo, durante el proceso de traducción, cuando el traductor corrige el comienzo de una frase, mejora las posibilidades de que el sistema acierte con el resto de la traducción. A menudo, lo único que se necesita es un impulso al comienzo de una oración para arreglar el resto, y los errores dejan de multiplicarse.

Mientras tanto, las mejoras características de la TAN en la gramática y la coherencia hacen que, cuando logra una traducción correcta, el traductor invierte menos tiempo en corregir la gramática, lo cual mejora los resultados de la TA y elimina por completo la necesidad de poseditar. Cuando tienen la oportunidad de trabajar juntos, los traductores y sus motores de TAN literalmente colaboran en la formación de las oraciones. Además de acelerar el proceso, y aquí hablo como traductor, es de verdad una experiencia gratificante.

 

¿A dónde vamos ahora?

Predecir el futuro es siempre arriesgado, pero si la calidad y la accesibilidad de la TAN siguen mejorando, paulatinamente se convertirá en un recurso indispensable para el traductor, como ya lo son las herramientas de traducción asistida por computadora y las memorias de traducción.

Muchas investigaciones actuales tienen que ver con la recopilación de mejores datos y con el desarrollo de sistemas que necesiten menos datos. Ambas áreas seguirán mejorando la calidad de la TA y acelerando su utilidad para los traductores. Esperemos que esta utilidad también llegue a más idiomas, especialmente los que tienen menos datos disponibles para el entrenamiento. Cuando eso ocurra, los traductores de esos idiomas podrán traducir cada vez más texto y mejorar gradualmente la disponibilidad de texto de calidad, tanto para el público como para seguir entrenando la TA. Como resultado, esto permitirá a esos traductores atender desafíos más grandes porque ya habrán desarrollado una base sólida.

Cuando se usa correctamente, la TAN tiene el potencial no solo de mejorar el trabajo de los traductores, sino también de acercar a toda la industria de la traducción a su meta de convertirse en el Babel Fish. No se encontrará en una aplicación o en un auricular, sino en redes de personas.