mujer telefono movil

mujer telefono movil

Software

La nueva IA de Google es capaz de traducir con la voz de la otra persona, como si hablase nuestro idioma

El nuevo traductor de Google es capaz de traducir la voz directamente, sin necesidad de pasar por texto, lo que le permite imitar nuestra voz.

16 mayo, 2019 10:03

Noticias relacionadas

Es innegable que el traductor de Google ha roto barreras lingüísticas que de otra manera aún permanecerían en pie. Podemos traducir cualquier texto que nos encontremos con una gran precisión, e incluso es capaz de seguir mejorando gracias al aprendizaje automático. Hasta podemos usar el micrófono, y reconocerá las palabras que decimos y las traducirá.

Aunque pueda parecer que es imposible mejorar eso, la verdad es que aún estamos muy lejos de un verdadero traductor universal. Sigue siendo un estorbo necesario en las conversaciones, un proceso que tenemos que seguir si queremos entender a la otra persona. Pero puede que en las próximas décadas eso se termine. Que simplemente podamos escuchar a nuestro interlocutor en nuestro idioma nativo, sin importar cuál sea el suyo.

Un traductor capaz de traducir la voz directamente

Google ha dado un paso de gigante en esa dirección, con el desarrollo de Translatotron. Detrás de ese nombre de ciencia ficción hay una herramienta igualmente futurista: es capaz de traducir voz a voz de manera directa. Eso significa que podemos escuchar a la otra persona hablar en nuestro idioma; en vez de tener que leer lo que ha dicho. Incluso es capaz de imitar la voz de la otra persona, para que realmente parezca que hablamos la misma lengua.

Translatotron es un sistema experimental, basado en un modelo de secuencia-a-secuencia que no requiere un texto intermedio. A diferencia de otros, este sistema no necesita escribir en texto lo que hemos dicho, para a continuación traducirlo. La traducción se hace directamente sobre las palabras que hemos dicho.

google traductor

google traductor

Lo interesante es que Google ha decidido ir en dirección contraria al resto de traductores. Por ejemplo, evita dividir las tareas si es posible, simplemente traduciendo conforme nos escucha; esto tiene sus ventajas, como una mayor velocidad y un mejor reconocimiento de palabras que no tienen que ser traducidas, como nombres propios.

Esto permite obtener un gran rendimiento, como podemos comprobar en las muestras, en las que se traduce al inglés lo que una persona está diciendo en español.  El resultado es mucho más natural y rápido; esto último es importante para que la conversación sea lo más natural posible, sin pausas incómodas esperando a que el traductor termine.

Nuestra voz habla en otros idiomas

Pero más interesante incluso es que este sistema es capaz de imitar nuestra voz; el método permite analizar mejor la tonalidad y la manera en la que hablamos, y la IA es capaz de aplicar esas características a la frase que ha traducido. El resultado es sorprendente, teniendo en cuenta lo difícil de la tarea; en algunos ejemplo, realmente parece como si la otra persona que habla español hubiese empezado a hablar en inglés.

Google afirma que este es el primer traductor capaz de traducir voz a voz de manera directa de un idioma a otro. Puede ser una pieza clave para crear traductores que funcionen de manera completamente natural; como con dispositivos como el traductor universal de Star Trek.