La façon la plus populaire de trouver une traduction pour une phrase source avec un modèle neuronal de séquence à séquence est une recherche de faisceau simple. La phrase cible est prédite un mot à la fois et après chaque prédiction, un nombre fixe de possibilités (généralement entre 4 et 10) est conservé pour une exploration plus approfondie. Cette stratégie peut être sous-optimale car ces décisions locales difficiles ne prennent pas le reste de la traduction en compte et ne peuvent pas être rétablies plus tard.
Les systèmes de traduction automatique neuronale génèrent des traductions un mot à la fois. Ils peuvent toujours générer des traductions fluides car ils choisissent chaque mot en fonction de tous les mots générés jusqu'à présent. Généralement, ces systèmes sont simplement formés pour générer le mot suivant correctement, en fonction de tous les mots précédents. Un problème systématique avec cette approche mot par mot de la formation et de la traduction est que les traductions sont souvent trop courtes et omettent le contenu important. Dans l'article Neural Machine Translation with Reconstruction, les auteurs décrivent une nouvelle façon intelligente de former et de traduire. Pendant la formation, leur système est encouragé non seulement à générer chaque mot suivant correctement mais également à générer correctement la phrase source d'origine en fonction de la traduction qui a été générée. De cette manière, le modèle est récompensé pour générer une traduction qui est suffisante pour décrire tout le contenu de la source d'origine.
Cet article décrit la technologie derrière les suggestions de traduction interactives de Lilt. Les détails ont été publiés pour la première fois dans un article de conférence universitaire, Models and Inference for Prefix-Constrained Machine Translation .(Les modèles et l'inférence de la traduction automatique déterminée par les préfixes) Les systèmes de traduction automatique peuvent traduire des phrases ou des documents entiers, mais ils peuvent également être utilisés pour terminer des traductions qui ont été commencées par une personne, une forme d'achèvement automatique au niveau de la phrase. Dans la littérature linguistique informatique, la prédiction du reste d'une phrase est appelée traduction automatique déterminée par les préfixes. Le préfixe d'une phrase est la partie écrite par un traducteur. Un suffixe est suggéré par la machine pour compléter la traduction. Ces suggestions sont proposées de manière interactive aux traducteurs après chaque mot qu'ils saisissent. Les traducteurs peuvent accepter la totalité ou une partie du suffixe proposé avec un seul clic sur le clavier, ce qui permet d'économiser du temps en automatisant les parties les plus prévisibles du processus de traduction.