¿Cómo funciona el traductor de Google? Te lo explicamos en detalle
Te traemos los entresijos de una de las herramientas más usadas para que conozcas cómo funciona el algoritmo del traductor de Google.
15 diciembre, 2018 09:34Si afirmamos que todos hemos usado el traductor de Google, no generalizamos. La plataforma vive en un proceso de mejora continuo y así lo ha demostrado los últimos años. Es una herramienta indispensable que nos ha sacado de apuros, pero ¿cómo funciona esta tecnología que tanto nos simplifica la vida?
Actualmente el Traductor de Google funciona con 103 idiomas distintos y a diario es usado por más de 200 millones de personas. Y, pese a que vio la luz en 2007 y ya lleva más de diez años entre nosotros, nos ha sorprendido su funcionamiento. Ni lingüistas ni filólogos, te desvelamos qué hay tras las bambalinas de Google Translate.
Primer paso: bucear en textos traducidos
Gestionar 100 idiomas debe ser una tarea realmente agotadora para los programadores de Google. Pues bien, es más sencillo de lo que a priori parece si la traducción se logra a través de automatismos. Google Translate trabaja con el aprendizaje automático a través de ejemplos. Así lo explica Peter Norvig, Director de Investigación en Google, en uno de los blogs de la compañía.
En los inicios de la herramienta los programadores pusieron empeño en que la tecnología que tenían entre manos comprendiera cada palabra. Esto se traducía, y nunca mejor dicho, en que lograra diferenciar entre categorías gramaticales, comprendiendo la complejidad de cada idioma. Lo que sucedió es que se encontraron con un trabajo imposible de materializar. Millones de palabras, billones de combinaciones y reglas distintas para cada idioma.
La solución para enfrentarse a tal cantidad de información fue preparar al traductor para sumergirse en la web. Los programadores pensaron que la mejor manera de encontrar patrones y ejemplos era localizarlos en los millones de textos ya traducidos disponibles en la web. De esta forma el traductor podía fijarse en frases completas y tener en cuenta el contexto, no tratar cada palabra de manera individualizada.
El software que lo cambió todo con el inglés de base
Las funcionalidades automáticas que proporciona Google se consiguen a través de un software que realiza una «traducción automática estadística» (TAE). Tal y como cuentan en websa100, lo que hace el asistente es buscar patrones similares buceando entre millones de documentos. Estos se van ensanchando a diario y mejoran nuestra experiencia.
El engranaje que logra que todo se desarrolle correctamente es el inglés. La TAE «trabaja traduciendo primero al inglés como idioma de paso intermedio y luego al idioma de destino, haciendo una referencia cruzada de la frase en cuestión». Es decir, en vez de traducir directamente el idioma, el texto o palabra se lleva primero al inglés para devolverla en el lenguaje deseado.
Este funcionamiento optimiza enormemente el trabajo del traductor. El inglés funciona como nexo por un motivo de peso. La disponibilidad de textos traducidos a este idioma son incontables. Millones de documentos que la plataforma tiene guardados para sí. Lo que permite que una traducción sea exacta, mejorable o directamente horrenda, es el material disponible para Google. El inglés es el salvoconducto ideal porque es probable que existan traducciones en casi cualquier idioma.
La cantidad de traducciones entre el inglés y el telugu (lengua hablada en algunos estados de la India), por ejemplo, será mayor que entre ese mismo y el español. Y así con todo idioma usado en la herramienta. Estadísticamente la traducción será mucho mejor si primero se traduce al inglés.
La competencia de Google, su mayor aliada
Llegados a este punto podemos afirmar que el procesamiento de la gramática que logra Google Translate es una genialidad. Y mejorar la experiencia del usuario puede convertirse en una batalla campal para la empresa de California.
Desde Inverse advierten de la fuerte competencia de las compañías por desarrollar la tecnología más eficaz. Lo obvio resulta ser que el lugar de origen de la empresa determine lo buenas que sean en su ámbito, y así consiguen que Google también les eche el ojo para mejorar su traducción en ese idioma ¿Por qué? Porque los idiomas con muchos textos digitalizados y de calidad tendrán una mejor traducción que los que no dispongan de ellos. Si un idioma escasea de textos traducidos al inglés, es probable que el resultado cojee (y es en estos casos cuando Google requiere de ayuda externa).
Cuanto mayor sea la base de datos mejor se procesará la gramática y mayor precisión conseguirá el usuario de la herramienta
2016, el año de la mejora
Los obstáculos son muchos pero las mejoras también. De hecho, si eres asiduo en el uso de estas herramientas posiblemente hayas notado una mejora en el Traductor de Google. Y es que la compañía implantó un sistema llamado Zero-Shot Translation en el año 2016. La herramienta se esfuerza ahora en comprender mejor la semántica y darle un significado a la frase. Para Google es un hito clave que permite perfeccionar también la traducción por voz, y así la forma en la que funciona esta herramienta en los Google Pixel Bands.
Las posibilidades del «Deep Learning»
En el año 2016 Google quiso concretar la tecnología basada en estadística centrándose en el «Deep Learning». La intención era mejorar la calidad futura de los servicios del traductor de Google para que la traducción de voz en tiempo real permita que dos interlocutores puedan mantener una conversación en lenguas diferentes.
Tal y como explicaban en «The Independent» la tecnología basada en el aprendizaje profundo permite que el traductor le dé sentido a la frase, no traduzca de forma aislada o a pedazos. Esto permite que la herramienta nos aporte una traducción que habrá establecido también relaciones entre idiomas, buscando precisar al milímetro.
El aprendizaje profundo logra buscar coincidencias entre el idioma a traducir y otro similar para ofrecernos una traducción perfeccionada
El reto de los traductores de voz: van un paso más allá
Y si la puesta en marcha de un traductor funcional ha sido todo un periplo, los retos futuros no se quedan cortos. Google pone ahora las miras en lograr una traducción por voz instantánea y viable a través de la inteligencia artificial. Tirar de IA parece la única solución para rematar una tecnología que clama por la perfección. Pese a que ya es viable usar esta herramienta, no logra una precisión tan acertada como Google Translate.
Los rasgos culturales acaban por interferir por completo en cómo se traduzca una oración. Y ya no solo eso, la entonación o la intención también alteran el significado de las palabras. Los rasgos idiomáticos infieren directamente en el resultado de la traducción y dificultan la tarea del algoritmo que el traductor de Google estaba usando hasta la fecha.
Lo que está claro es que un traductor es una tecnología en constante perfeccionamiento. Y si algo destacamos de todo ello es que la herramienta logra funcionar sin entrenamiento por parte de traductores especializados o expertos lingüistas. De hecho, Google nos invita a colaborar en la mejora de la plataforma. Si eres multilingüe y te apetece, pásate por la Comunidad de Translate y podrás ayudar a la compañía.