Aclaramos los conceptos más importantes de la informática para la traducción automática

by Adrienne Lumb

15-mar-2019 0:00:00 4 Minute Read

Los términos de la informática que antes se usaban exclusivamente en las comunidades científicas ahora están siempre presentes en nuestra vida cotidiana: las noticias que leemos, los productos que consumimos y la tecnología que usamos. Algunos se usan como sinónimos de otros (incorrectamente), otros tienen definiciones y aplicaciones poco claras. A la luz de lo anterior, pensamos que podríamos aclarar los términos más importantes de la traducción automática (TA) que puedes encontrar.

Inteligencia artificial (IA)

Muchas personas piensan que la IA es un concepto nuevo; en la última década, se ha disparado la aparición de la IA en empresas que afirman usar esta tecnología. Sin embargo, la IA existe hace más de 60 años. El término se usa de forma descuidada en contextos comerciales, a menudo para generar expectativas en torno a un producto o una oferta. Un artículo reciente de Forbes que detalla un informe de MMC, la empresa de capital de riesgo de Londres, revela que casi la mitad de todas las «startups de IA» no utilizan la IA de ningún modo.

Entonces, ¿qué es exactamente la IA? La IA es la ciencia de programar computadoras para imitar la inteligencia humana y hacer tareas parecidas a las de los humanos. Las tareas pueden ser resolver problemas relacionados con la lógica, el razonamiento, la planificación y la percepción. Las personas cuando piensan en la IA se imaginan un robot muy capaz y parecido a un humano. Sin embargo, te encuentras con la IA en aplicaciones prácticas cotidianas como las siguientes:

Un software de reconocimiento de voz, como Siri y Alexa
Filtros de correo electrónico no deseado que usan la lógica de clasificación
Bots de chat
Escritura predictiva en las consultas de búsqueda

Aprendizaje automático (AA)

El AA es una subclase de la IA y es fundamentalmente la forma en que aprende una aplicación de IA. Los métodos del AA están diseñados para identificar patrones y aprender de los datos, sin recibir instrucciones específicas para hacerlo. Un ejemplo del AA es cualquier cosa que use un algoritmo. En lugar de ser una ruta de aprendizaje lineal, el AA entrena un sistema en un bucle de conocimiento circular; el sistema recibe un comando, recoge datos, enseña el algoritmo, lo prueba y recoge retroalimentación y, luego, usa esa información para mejorar el algoritmo. Un método que usa el AA aprende y mejora continuamente. Mientras más datos recopile, y aprenda de ellos, más preciso será.

Tú experimentas el AA en tu vida diaria cada vez que escribes una consulta en un motor de búsqueda. Netflix y Spotify usan el AA para sugerir medios y música según tu comportamiento de visualización y escucha. Los automóviles autónomos son otro ejemplo: aprenden de los objetos que los rodean y responden.

Interacción persona-computadora (IPO)

La IPO es el estudio de la interacción de los humanos con las computadoras. Apple, por ejemplo, lleva a cabo una amplia investigación de la IPO sobre cómo los usuarios interactúan con los iPhones. Durante los ciclos de diseño, usan sus observaciones sobre el comportamiento humano para mejorar la experiencia de sus productos. Los equipos de diseño para la experiencia del usuario (UX) y la interfaz de usuario (UI) usan principios de la IPO para crear experiencias fáciles y atractivas que los consumidores quieran usar.

Red neuronal artificial (RNA)

Las RNA son un subconjunto de algoritmos del AA cuyo modelo está inspirado en las redes neuronales de nuestro cerebro. Se componen de un conjunto bien conectado de unidades de computación llamadas neuronas. Si bien las redes neuronales funcionan como los algoritmos generales del AA, son mucho mejores para aprender distribuciones complejas y de orden más alto inherentes a los conjuntos de datos grandes y diversos, especialmente imágenes y textos.

Traducción automática (TA)

La TA es un subconjunto de la lingüística computacional que traduce automáticamente el texto de un idioma a otro. La TA incluye métodos de aprendizaje estadístico y neuronal, en los que la máquina proporciona resultados basados en la probabilidad más alta de una coincidencia correcta desde una base de datos. Los sistemas de la TA se entrenan con varias fuentes, como los datos rastreados de la Web, los datos sintéticos generados a partir de otros sistemas de TA y los datos generados por los usuarios.

Traducción automática neuronal (TAN)

La TAN es una forma de traducción automática en la que se usa una RNA para traducir oraciones del texto origen y obtener una oración bien formada para el texto de destino. Las RNA pueden aprender distribuciones de datos de orden más alto y predecir las traducciones con una mejor precisión, incluso con frases y cadenas de texto más largas. Con un estilo autorregresivo de predicciones, es significativamente mejor que un sistema estadístico, especialmente cuando la traducción implica completar un prefijo.

Procesamiento de lenguaje natural (PLN)

El PLN, que es un subcampo de la IA, se centra en cómo hacer que las máquinas entiendan el idioma de los seres humanos. El PLN se concentra en la TA y otras tareas de procesamiento de la IA relacionadas con el lenguaje humano, incluida la sintaxis, la semántica, el discurso y el habla.

Humano en el bucle (HITL)

El HITL es un concepto de la informática en el que una máquina aprende del trabajo de un humano y lo asiste. Es un bucle de retroalimentación interactivo y continuo entre el sistema informático y el humano. En el caso de la TAN, la computadora aprende del comportamiento de los traductores y hace sugerencias congruentes con dicho comportamiento.

Agradecemos especialmente a Aditya Shastry por contribuir a esta publicación.