Una inteligencia artificial que es capaz de cantar como Adele y Britney Spears
Investigadores japoneses crean una tecnología de síntesis de voz con aprendizaje profundo
21 diciembre, 2018 12:54Pocas cosas quedaban pendientes en la 'checklist' de la inteligencia artificial. En los últimos meses estos 'cerebros' digitales han conseguido dar clases, pintar cuadros o identificar objetos sin haberlos visto antes. Y ahora, también, cantan,
La empresa Techno-Speech y el Laboratorio de Procesamiento del Lenguaje del Instituto Tecnológico de Nagoya han desarrollado una tecnología que sintetiza voces cantando y que puede reproducir la calidad de una voz humana con más precisión que nunca. Ni Adele o Britney Spears se le escapan. ¿No lo cree? Escuche esto.
Los socios llevan colaborando en el avance de este tipo de tecnologías desde hace tiempo, de hehco, la empresa nipona ya ha lanzado algún producto, como un karaoke comercial, que incorporaba estas voces sintéticas. Pero ahora han dado un paso más allá.
El equipo de investigación tomó un registro de un cantante "específico" de dos horas. Con esa base de datos, ha sido capaz de reproducir la calidad de la voz humana, con sus características únicas, y su estilo a la hora de cantar. Algo imposible sin la ayuda de distintas técnicas de inteligencia artificial, en especial, de 'deep learning'.
"Cuando se sintetizan, se pueden producir voces cantando con alta calidad simplemente introduciendo cualquier partitura con su letra", dicen sus creadores en el comunicado de prensa. Además, son capaces de hacerlo en tres idiomas: japonés, inglés y chino.
La siguiente pregunta obligatoria es "¿para qué?". Los investigadores ven muchas posibilidades: para reproducir la voz de un artista (por ejemplo, si ha fallecido), usarlo en producciones musicales o en el desarrollo de videojuegos, retransmitir en directo vídeos de Youtubers virtuales, para sistemas de postproducción con actores virtuales, para generar audios flexibles para el aprendizaje de idiomas extranjeros o para los dispositivos de habla de pacientes con dificultades en la laringe.
Los resultados finales del proyecto se presentarán en marzo de 2019 en la reunión de primavera de la Sociedad Acústica de Japón.