Les meilleurs concepts informatiques de traduction automatique démystifiés

by Adrienne Lumb

15 mars 2019 00:00:00 4 Minute Read

Les termes informatiques autrefois utilisés dans les communautés scientifiques sont devenus omniprésents dans notre vie quotidienne, les informations que nous lisons, les produits que nous consommons et la technologie que nous utilisons. Certains sont utilisés de manière interchangeable les uns avec les autres (incorrectement), d'autres ont une définition et une application des plus floues. Compte tenu de cela, nous avons pensé que nous pourrions apporter plus de clarté aux termes informatiques les plus importants liés à la traduction automatique (MT) que vous pourriez rencontrer.

Intelligence artificielle (IA)

Beaucoup de personnes considèrent l'IA comme un nouveau concept. L'émergence de l'IA dans les entreprises qui prétendent utiliser la technologie de l'IA a augmenté au cours de la dernière décennie. Cependant, l'IA existe depuis plus de 60 ans. Le terme est utilisé de manière hasardeuse dans les contextes commerciaux, souvent dans le but de générer de l'engouement autour d'un produit ou d'une offre. Un article de Forbes récemment publié détaillant un rapport publié par la société de capital-risque basée à Londres, MMC, révèle que près de la moitié de toutes les « start-ups du secteur de l'IA », n'utilisent pas réellement l'IA.

Alors qu'est-ce qu'est exactement l'IA ? L'IA est la science de la programmation des ordinateurs pour imiter l'intelligence humaine et compléter les tâches comme les humains. Les tâches peuvent inclure la résolution de problèmes liés à la logique, au raisonnement, à la planification et à la perception. Les gens pensent souvent que l'IA évoque une représentation d'un robot hautement capable qui ressemble à un humain. Cependant, vous rencontrez l'IA dans des applications quotidiennes pratiques telles que :

les logiciels de reconnaissance vocale comme Siri et Alexa
les filtres anti-spam dans les e-mails qui utilisent la logique de tri
les chatbots
la saisie prédictive dans les requêtes de recherche

l'apprentissage automatique (ML)

Le ML est un sous-ensemble d'IA et est essentiellement la façon dont une application d'IA apprend. Les méthodes de ML sont conçues pour identifier les modèles dans les données et en apprendre le plus possible, sans que cela leur soit spécifiquement demandé. Un exemple de ML est tout ce qui utilise un algorithme. Plutôt qu'un chemin d'apprentissage linéaire, le ML entraîne un système dans une boucle de connaissance circulaire : le système reçoit une commande, collecte des données, enseigne l'algorithme, l'essaie et collecte des retours, puis utilise ces informations pour améliorer l'algorithme. Une méthode utilisant le ML apprend et s'améliore en permanence. Plus les données qu'il collecte, et desquelles il apprend, sont nombreuses, plus il est précis.

Vous faites l'expérience de la ML dans votre vie quotidienne chaque fois que vous saisissez une requête dans un moteur de recherche. Netflix et Spotify utilisent le ML pour suggérer des médias et de la musique en fonction de votre comportement d'affichage et d'écoute. Les voitures autonomes sont un autre exemple, elles apprennent des objets qui les entourent et répondent en conséquence.

Interaction homme-machine (IHM)

L'IHM est le domaine d'étude qui explore la façon dont les humains interagissent avec les ordinateurs. Apple, par exemple, effectue des recherches détaillées sur l'IHM pour connaître la façon dont les utilisateurs interagissent avec les iPhones. Lors des cycles de conception, ils utilisent leurs observations sur le comportement humain pour améliorer l'expérience de leurs produits. Les équipes de conception de l'expérience utilisateur (UX) et de l'interface utilisateur (UI) utilisent les principes d'IHM pour créer des expériences faciles et convaincantes que les consommateurs souhaitent utiliser.

Réseau neuronal artificiel (RNA)

Les RNA sont un sous-ensemble d'algorithmes de ML, modélisés en fonction des réseaux neuronaux de notre cerveau. Ils sont composés d'un ensemble d'unités de calcul connectées appelées neurones. Alors que les réseaux neuronaux fonctionnent de la même manière que les algorithmes de ML généraux, ils sont bien meilleurs pour apprendre des commandes plus élevées et des distributions complexes inhérentes à des ensembles de données de grande taille et diversifiés, en particulier les images et le texte.

MT

La traduction automatique (MT) est un sous-ensemble de la linguistique informatique qui traduit automatiquement le texte d'une langue à une autre. La MT inclut des méthodes d'apprentissage statistique et neuronale, dans lesquelles la machine fournit des résultats en fonction de la plus haute probabilité d'une correspondance correcte dans une base de données. Les systèmes de MT s'entraînent sur différentes sources, y compris les données récupérées sur le Web, les données synthétiques générées par d'autres systèmes de traduction automatique et les données générées par les utilisateurs.

MT neuronale (NMT)

La traduction automatique neuronale (NMT) est une forme de traduction automatique où un RNA est utilisé pour traduire les phrases source pour obtenir une phrase cible bien formée. Les RNA peuvent apprendre des distributions de données d'ordre plus élevées, ce qui leur permet de prédire les traductions avec plus de précision, même avec des phrases et des chaînes de texte plus longues. Avec un style autorégressif de prédictions, ils fonctionnent beaucoup mieux qu'un système statistique, en particulier lorsque la traduction implique de compléter un préfixe.

Traitement automatique du langage naturel (TALN)

Un sous-champ de l'IA, le TALN se concentre sur la façon de faire en sorte que les machines soient en mesure de comprendre le langage humain. Le TANL se concentre sur la traduction automatique et d'autres tâches de traitement d'IA liées au langage humain, y compris la syntaxe, la sémantique, le discours et la parole.

Human-in-the-loop (HITL)

L'HITL est un concept d'informatique par lequel une machine apprend du travail d'un humain et l'aide également à le faire. C'est une boucle de retours interactifs continue entre le système informatique et l'humain. Dans le cas de la NMT, l'ordinateur apprend du comportement des traducteurs et fait des suggestions en conséquence.

Des remerciements tout particuliers à Aditya Shastry pour avoir contribué à cet article.