Traducción asistida por computadora interactiva y adaptativa

by John DeNero

14-nov-2016 0:00:00 6 Minute Read

Originalmente publicado en el blog de Kirti Vashee eMpTy Pages.

Lilt es una herramienta de traducción asistida por computadora interactiva y adaptativa que integra la traducción automática, las memorias de traducción y las bases terminológicas en una interfaz que aprende de los traductores. Usar Lilt es una experiencia completamente diferente a la posedición de traducciones automáticas; una experiencia que les encanta a nuestros usuarios y brinda importantes ventajas de productividad sin sacrificar la calidad. El primer paso para usar este nuevo tipo de herramienta es entender cómo la asistencia automática interactiva y adaptativa difiere de la TA convencional y cómo estas tecnologías se relacionan con nuevos y emocionantes desarrollos en la TA neuronal y el aprendizaje profundo.

La TA interactiva no traduce cada segmento solo una vez y deja que el traductor limpie el lío. En lugar de eso, cada palabra que el traductor escribe en el entorno de Lilt se integra a una nueva sugerencia de traducción automática en tiempo real. Mientras que las aplicaciones de mensajería de texto completan las palabras automáticamente, la TA interactiva completa oraciones automáticamente. La TA interactiva en realidad mejora la calidad de la traducción. En la posedición de TA convencional, la computadora sabe qué segmento se traducirá, pero no sabe nada sobre las decisiones de redacción que tomará el traductor. Las traducciones interactivas son más precisas porque pueden observar lo que el traductor ha escrito hasta ahora y actualizar sus sugerencias según toda la información disponible.

Incluso las primeras palabras de una traducción dan pistas sólidas sobre la estructura pretendida de una oración, y el sistema de Lilt reacciona en una fracción de segundo a cada palabra, lo cual mejora la productividad significativamente. Los investigadores de Lilt y Stanford publicaron el mejor método hasta ahora para hacer sugerencias precisas de traducción interactiva en su artículo de 2016 de la Association for Computational Linguistics «Models and Inference for Prefix-Constrained Machine Translation» (Modelos e inferencia para la traducción automática con prefijo limitado). A menudo, al usar la TA interactiva, corregir la primera parte de una traducción es lo único que se necesita; el sistema corrige automáticamente el resto, con la guía del traductor.

Si bien la TA interactiva mejora las sugerencias dentro de un segmento, la TA adaptativa funciona en todos los segmentos. La asistencia adaptativa de Lilt aprende automáticamente de los traductores en tiempo real mientras trabajan, de modo que los errores cometidos en un segmento y corregidos por el traductor, generalmente, no se repiten en segmentos posteriores. En cambio, un sistema de TA convencional, como Google Translate, siempre genera la misma traducción para el mismo segmento y, a menudo, repite errores, que deben corregirse cada vez. La TA personalizada, desarrollada por ejemplo por Microsoft Translator Hub, aprende de traducciones de ejemplo específicas para un proyecto o un cliente, y este entrenamiento adicional puede mejorar la calidad significativamente. Sin embargo, la TA personalizada no sigue adaptándose a medida que trabajan los traductores; en lugar de eso, se debe volver a entrenar periódicamente cuando se completen nuevos proyectos. La TA adaptativa de Lilt no requiere reentrenamiento porque aprende automáticamente de cada segmento confirmado por un traductor. Cuando un grupo de traductores colabora en un proyecto grande, cada segmento confirmado se integra al motor de traducción, de modo que las sugerencias ofrecidas a todos los integrantes del equipo se mejoran cada vez que alguien confirma un segmento. Cada actualización tarda menos de medio segundo. Al usar la TA adaptativa, los traductores notan que las sugerencias mejoran a medida que avanzan en un documento porque el sistema ha aprendido cómo ellos tradujeron la primera parte del documento al sugerir traducciones para el resto. Al igual que la TA interactiva, la TA adaptativa usa toda la información disponible para hacer las mejores sugerencias posibles.

La traducción automática, las memorias de traducción y las bases terminológicas han sido tradicionalmente tres fuentes aisladas de información que los traductores deben fusionar manualmente. Lilt combina las tres fuentes de manera automática. Una memoria de traducción brinda coincidencias exactas y parciales, pero también se usa para personalizar automáticamente las sugerencias de traducción automática. Una base terminológica se usa para garantizar la congruencia terminológica, incluso dentro de las sugerencias automáticas generadas por el motor de traducción interactiva. Un panel integrado ofrece diccionarios bilingües públicos y términos específicos de cada proyecto, además de una función de búsqueda de concordancia que fusiona automáticamente ejemplos de corpus públicos y coincidencias de memorias de traducción. Las coincidencias de los diccionarios y la concordancia se clasifican según su pertinencia mediante modelos de redes neuronales de similitudes de palabras y oraciones. Estos modelos neuronales aprenden automáticamente del uso para detectar las palabras de un documento que sean flexiones o derivaciones de términos en la base terminológica de un usuario, con lo que descubren patrones de morfología derivacional y flexiva. El uso integrado de todos los datos pertinentes para la traducción no solo mejora la precisión y la eficiencia, sino que en realidad reduce la configuración que se necesita para usar el sistema. Los traductores sencillamente agregan todos los recursos necesarios a Lilt al iniciar un proyecto, y todo se usa en conjunto para optimizar la interfaz y las sugerencias durante la traducción, la búsqueda en el diccionario y la búsqueda de concordancias.

Uno de los nuevos desarrollos más emocionantes en el campo de la traducción automática es la TA neuronal. Por primera vez, los sistemas neuronales pueden descubrir similitudes entre palabras y frases relacionadas, y se generan oraciones enteras de forma coherente en lugar de armarse de pequeños fragmentos independientes. La calidad de los mejores sistemas de traducción neuronal supera enormemente la de los sistemas convencionales de estadística, porque limpia los errores de concordancia y de estructura que han persistido en los sistemas de TA durante muchos años. Estas ventajas están disponibles incluso en un entorno convencional de posedición.

Las ventajas de calidad ofrecidas por las traducciones interactivas y adaptativas son generalmente mayores que las que se obtienen al cambiar a la TA neuronal, lo cual no es sorprendente: la traducción interactiva y adaptativa puede usar nueva información del traductor. Sin embargo, el descubrimiento más emocionante es que se pueden combinar las ventajas de la TA neuronal y la TA interactiva. En 2016, los investigadores de Lilt y Stanford demostraron que puede ser sumamente eficaz usar un sistema de traducción neuronal para completar automáticamente las traducciones parciales de forma interactiva (se predijo correctamente la próxima palabra que un traductor escribiría un 53-55 % de las veces en los documentos de software y noticias traducidos de inglés a alemán). Nuestra investigación sugiere que la traducción interactiva tiene aún más que ganar de la TA neuronal que de la posedición convencional.

La combinación de la traducción automática interactiva y la adaptativa ha demostrado ser especialmente eficaz cuando grandes equipos de traductores trabajan con un plazo limitado. En mayo de 2016, el portal de viajes europeo GetYourGuide contrató a la empresa e2f de California para localizar 1,77 millones de palabras de su catálogo en seis idiomas en dos semanas antes del inicio de la temporada de verano. Más de 100 traductores experimentados se sumaron a la tarea usando un motor compartido de TA adaptativa de Lilt para cada par de idiomas. Los traductores lograron velocidades mucho mayores que el promedio de la industria de 335 palabras por hora en todos los pares de idiomas, y el proyecto se terminó antes de lo previsto.

Lilt ganó el Premio TAUS a la Excelencia en la Innovación de 2016 al reemplazar la posedición con la asistencia automática interactiva y adaptativa. Este enfoque aprovecha nuevos descubrimientos en la traducción automática neuronal mucho más eficazmente que la TA tradicional. Además, proporciona a los traductores el control de su flujo de trabajo y ofrece una nueva interfaz integrada diseñada para facilitar el uso de esta tecnología avanzada. Creemos que el futuro es prometedor para aquellos traductores que adopten el nuevo método de Lilt de combinar la traducción automática, las memorias de traducción y las bases terminológicas; un futuro más agradable, más productivo y más centrado en los aspectos de la traducción que solo los humanos pueden hacer bien.