Tecnología para la TA interactiva

by Spence Green
3 Minute Read

Este artículo describe la tecnología que está detrás de las sugerencias interactivas de traducción de Lilt. Los detalles se publicaron primero en un artículo de conferencia académica, Models and Inference for Prefix-Constrained Machine Translation (Modelos e inferencia para la traducción automática con prefijo limitado).

Los sistemas de traducción automática pueden traducir oraciones enteras o documentos, pero también pueden usarse para terminar las traducciones empezadas por una persona, una forma de completar automáticamente a nivel de la oración. En la bibliografía lingüística computacional, la predicción del resto de una oración se llama traducción automática con prefijo limitado. El prefijo de una oración es la parte hecha por un traductor. La máquina sugiere un sufijo para completar la traducción. Estas sugerencias se proponen de forma interactiva a los traductores después de cada palabra que escriben. Los traductores pueden aceptar todo el sufijo propuesto o una parte de él con una sola tecla y ahorrar tiempo automatizando las partes más predecibles del proceso de traducción.

nulo
En colaboración con Minh-Thang Luong de la Universidad de Stanford, el departamento de investigación de Lilt publicó recientemente varios aportes científicos nuevos para la traducción automática con prefijo limitado en la LIV reunión anual de la Association for Computational Linguistics en Berlín. Además de brindar por primera vez en la bibliografía un modelo de traducción automática neuronal para hacer traducción con prefijo limitado, el artículo describe tres mejoras en el paradigma estadístico basado en frases ampliamente usado. Estas son: nuevas formas de medir la precisión del sufijo, nuevas técnicas de aprendizaje automático y nuevos algoritmos de sugerencias. El artículo describe cómo cada una de estas innovaciones mejora la calidad de las sugerencias de un sistema de traducción interactivo en experimentos a gran escala entre el inglés y el alemán. Los métodos descritos en el artículo se usan en todos los sistemas de producción de Lilt.

En un entorno interactivo, las primeras palabras del sufijo sugerido son críticas; estas palabras son el foco de la atención del usuario cuando redacta una traducción. El sistema descrito en este artículo está entrenado para ser especialmente sensible a estas primeras palabras. Para lograr este efecto, el sistema incluye una nueva forma de saber qué partes de la oración ya se han traducido, de modo que la sugerencia de lo que el traductor escribirá a continuación no sea redundante respecto al contenido existente. Los detalles técnicos incluyen una nueva estrategia de búsqueda de haz y un modelo conjunto jerárquico de alineación y traducción que juntos mejoran enormemente las sugerencias. En el caso de la combinación inglés-alemán, la precisión de la próxima palabra aumenta de un 28,5 % a un 41,2 %.

Un sistema de TA interactiva también podría mostrar varias sugerencias al usuario. Describimos un algoritmo para encontrar eficientemente las mejores palabras N a continuación directamente siguiendo un prefijo y sus mejores sufijos correspondientes. Nuestros experimentos muestran que este enfoque para la extracción de la lista de mejores N, combinado con otras mejoras, aumentó la precisión de sugerencia de la próxima palabra de las mejores 10 listas de un 33,4% a un 55,5 %. También entrenamos un sistema de traducción neuronal recurrente para la traducción con prefijo limitado. Este sistema neuronal ofrece predicciones aún más precisas que nuestro sistema mejorado basado en frases. Sin embargo, la inferencia es dos órdenes de magnitud más lenta, lo cual es problemático para un entorno interactivo. (No te pierdas los próximos resultados sobre la traducción neuronal rápida con prefijo limitado).

El artículo concluye con un análisis de errores manuales que revela las fortalezas y las debilidades del enfoque neuronal y el basado en frases para la traducción con prefijo limitado. Los modelos neuronales son especialmente buenos para producir resultados lingüísticos de un idioma de destino gramaticalmente correctos y bien formados. Sin embargo, también muestran la tendencia a omitir palabras de contenido importantes.