La forma más popular de encontrar una traducción para una oración del texto de origen con un modelo de secuencia a secuencia neuronal es una búsqueda de haz sencilla. La oración de destino se predice una palabra a la vez y, después de cada predicción, se conserva una cantidad fija de posibilidades (normalmente entre 4 y 10) para seguir explorando. Esta estrategia puede ser insuficiente porque estas decisiones locales difíciles no tienen en cuenta el resto de la traducción y no pueden revertirse más adelante.
Este artículo describe la tecnología que está detrás de las sugerencias interactivas de traducción de Lilt. Los detalles se publicaron primero en un artículo de conferencia académica, Models and Inference for Prefix-Constrained Machine Translation (Modelos e inferencia para la traducción automática con prefijo limitado). Los sistemas de traducción automática pueden traducir oraciones enteras o documentos, pero también pueden usarse para terminar las traducciones empezadas por una persona, una forma de completar automáticamente a nivel de la oración. En la bibliografía lingüística computacional, la predicción del resto de una oración se llama traducción automática con prefijo limitado. El prefijo de una oración es la parte hecha por un traductor. La máquina sugiere un sufijo para completar la traducción. Estas sugerencias se proponen de forma interactiva a los traductores después de cada palabra que escriben. Los traductores pueden aceptar todo el sufijo propuesto o una parte de él con una sola tecla y ahorrar tiempo automatizando las partes más predecibles del proceso de traducción.