Initialement publié sur le blog eMpTy Pages de Kirti Vashee.
Lilt est un outil de traduction interactive et adaptative assistée par ordinateur qui intègre la traduction automatique, les mémoires de traduction et les bases de données terminologiques dans une interface qui apprend des traducteurs. Utiliser Lilt est une expérience entièrement différente de la post-édition des traductions automatiques, une expérience que nos utilisateurs aiment et qui permet des gains de productivité substantiels sans compromettre la qualité. La première étape vers l'utilisation de ce nouvel outil est de comprendre à quel point l'assistance automatique interactive et adaptative est différente de la traduction automatique, et comment ces technologies sont inhérentes aux nouveaux développements passionnants en traduction automatique neuronale et en apprentissage profond.
La traduction automatique interactive ne traduit pas seulement chaque segment une fois et laisse au traducteur le soin de faire le ménage. Au lieu de cela, chaque mot que le traducteur saisit dans l'environnement de Lilt est intégré dans une nouvelle suggestion de traduction automatique en temps réel. Alors que les applications de messagerie texte complètent automatiquement des mots, la traduction automatique interactive complète automatiquement des phrases entières. En fait, la traduction automatique interactive améliore la qualité de la traduction. Dans la post-édition de traduction automatique classique, l'ordinateur sait quel segment sera traduit, mais ne sait rien des décisions relatives à la phraséologie qu'un traducteur prendra. Les traductions interactives sont plus précises car elles peuvent observer ce que le traducteur a saisi jusqu'à présent et mettre à jour leurs suggestions en fonction de toutes les informations disponibles.
Même les premiers mots d'une traduction fournissent des indices forts sur la structure prévue d'une phrase, et le système de Lilt réagit en une fraction d'une seconde à chaque mot, ce qui fournit une augmentation significative de la productivité. Les chercheurs de Lilt et Stanford ont publié la meilleure méthode pour faire des suggestions de traduction interactive précises dans leur article de l'Association de la linguistique informatique en 2016 : Models and Inference for Prefix-Constrained Machine Translation. (Les modèles et interférences de la traduction automatique déterminée par les préfixes) Souvent, lorsque vous utilisez la traduction automatique, la correction de la première partie d'une traduction est tout ce qui est nécessaire ; le reste est automatiquement corrigé par le système, qui suit la direction du traducteur.
Alors que la traduction automatique interactive améliore les suggestions dans un segment, la traduction automatique adaptative fonctionne sur l'ensemble des segments. L'assistance adaptative de Lilt apprend automatiquement des traducteurs en temps réel à mesure qu'ils travaillent, afin que toutes les erreurs faites dans un segment et corrigées par le traducteur ne soient généralement pas répétées dans des segments ultérieurs. Par contraste, un système de traduction automatique classique comme Google Translate renvoie toujours la même traduction pour le même segment et répète souvent des erreurs, qui doivent être corrigées à chaque fois. La traduction automatique personnalisée, construite par exemple par Microsoft Translator Hub, apprend des exemples de traductions qui sont spécifiques à un projet ou à un client, et cette formation supplémentaire peut améliorer la qualité substantiellement. Cependant, la traduction automatique personnalisée ne continue pas à s'adapter à mesure que les traducteurs travaillent ; au lieu de cela, elle doit être mise à jour périodiquement lorsque de nouveaux projets sont terminés. La traduction automatique adaptative de Lilt ne nécessite pas du tout de mise à jour car elle apprend automatiquement à partir de chaque segment qui est confirmé par un traducteur. Lorsqu'un groupe de traducteurs collabore sur un grand projet, chaque segment confirmé est intégré au moteur de traduction, afin que les suggestions données à tous les coéquipiers soient améliorées chaque fois que quiconque confirme un segment. Chaque mise à jour prend moins d'une demi-seconde. Lorsqu'ils utilisent la traduction automatique, les traducteurs trouvent que les suggestions s'améliorent à mesure qu'ils progressent dans un document parce que le système a appris comment ils ont traduit la première partie du document et qu'il suggère des traductions pour le reste. Tout comme la traduction automatique interactive, la traduction automatique adaptative utilise toutes les informations disponibles pour faire les meilleures suggestions possibles.
La traduction automatique, les mémoires de traduction et les bases de données terminologiques ont été conventionnellement trois sources d'informations isolées que les traducteurs devaient fusionner manuellement. Lilt combine les trois sources automatiquement. Une mémoire de traduction fournit des correspondances précises et partielles, mais est également utilisée pour personnaliser automatiquement des suggestions de traduction automatique. Une base de données terminologique est utilisée pour assurer la cohérence terminologique, même dans les suggestions automatiques générées par le moteur de traduction interactif. Un panneau de lexique intégré comprend des dictionnaires bilingues publics et des termes spécifiques au projet, ainsi que la recherche de concordance qui fusionne automatiquement des exemples de corpus public et de correspondance de mémoire de traduction. Les correspondances de lexique et de concordance sont classées en fonction de la pertinence en utilisant des modèles de réseau neuronal de mots et de phrases similaires. Ces modèles neuronaux apprennent automatiquement de l'utilisation pour détecter quels mots dans un document sont fléchis ou dérivés de formes de termes dans la base de données terminologique d'un utilisateur, découvrant des modèles de morphologie fléchie et dérivée. L'utilisation intégrée de toutes les données pertinentes à la traduction améliore non seulement la précision et l'efficacité, mais réduit en fait la quantité de configuration requise pour utiliser le système. Les traducteurs ajoutent simplement toutes les ressources pertinentes sur Lilt lors du commencement d'un projet, et tout cela est utilisé ensemble pour optimiser l'interface et les suggestions pendant la traduction, la consultation du lexique et de la recherche de concordance.
L'un des nouveaux développements les plus passionnants dans le domaine de la traduction automatique est la traduction automatique neuronale. Pour la première fois, les systèmes neuronaux sont en mesure de découvrir des similitudes entre des mots et des groupes de mots connexes, et des phrases complètes sont générées de manière cohérente au lieu d'être regroupées à partir de petits fragments indépendants. La qualité des meilleurs systèmes de traduction neuronale dépasse de loin celle des systèmes statistiques classiques, nettoyant souvent des erreurs de structure et de phrase conventionnées qui ont persisté dans des systèmes de traduction automatique pendant de nombreuses années. Ces gains sont disponibles même dans un cadre de post-édition classique.
Les gains de qualité de la traduction interactive et adaptative sont souvent plus gros que les gains de la traduction automatique neuronale, ce qui n'est pas surprenant : la traduction interactive et adaptative peut utiliser de nouvelles informations du traducteur. Cependant, la découverte la plus passionnante est que les gains de la traduction automatique neuronale et de la traduction automatique interactive peuvent être combinés. En 2016, les chercheurs de Lilt et de Stanford ont montré qu'utiliser un système de traduction neuronale pour compléter des traductions partielles automatiquement de manière interactive pouvait être extrêmement efficace, prédisant correctement le mot suivant qu'un traducteur saisirait 53 à 55 % du temps dans des logiciels et des documents de presse traduits de l'anglais à l'allemand. Notre recherche suggère que la traduction interactive a encore plus à gagner de la traduction automatique neuronale que la post-édition classique.
La combinaison de la traduction automatique interactive et adaptative s'est révélée particulièrement efficace lorsque de grandes équipes de traducteurs travaillent avec des délais serrés. En mai 2016, le portail de voyage européen GetYourGuide a conclu un contrat avec e2f, basé en Californie, pour localiser 1,77 million de mots de leur catalogue dans 6 langues en l'espace de deux semaines avant le début des vacances d'été. Plus de 100 traducteurs expérimentés ont contribué à l'effort, en utilisant un moteur de traduction automatique adaptative de Lilt partagé pour chaque paire de langues. Les traducteurs ont réalisé des vitesses bien au-dessus de la moyenne de l'industrie de 335 mots par heure dans toutes les paires de langues et le projet a été terminé avant l'échéance.
Lilt a remporté le prix d'excellence en innovation TAUS 2016 en remplaçant la post-édition par une assistance automatique interactive et adaptative. Cette approche de Lilt tire parti de nouvelles découvertes de la traduction automatique neuronale beaucoup plus efficacement que la traduction automatique traditionnelle. En outre, cette approche laisse aux traducteurs le contrôle de leur flux de travail et fournit une nouvelle interface intégrée conçue pour faciliter l'utilisation de cette technologie avancée. Nous pensons que l'avenir est radieux pour les traducteurs qui adoptent la nouvelle façon de combiner la traduction automatique, les mémoires de traduction et les bases de données terminologiques, un avenir plus agréable, plus productif et plus concentré sur les aspects de la traduction que seuls les humains peuvent faire correctement.