Los increíbles vídeos de Movie Gen, la nueva IA de Meta que también puede generar el sonido de manera realista
- Meta ha anunciado que ha creado un modelo de IA generativa capaz de crear vídeos con sonido muy realistas.
- Más información: Los vídeos que genera esta IA se han vuelto virales: transforma lo que grabas con tu móvil en escenas de Hollywood
Si creías que ChatGPT fue revolucionario, o que la creación de imágenes con Dall-E y otros servicios era peligrosa, prepárate para el siguiente paso: la generación de vídeos por IA. Como es habitual en el sector OpenAI fue la primera en 'disparar', con la presentación de Sora, una IA tan sorprendente que la propia organización decidió limitar su uso para evitar que Internet se llenase de vídeos falsos.
Sin embargo, ese futuro parece inevitable a estas alturas. No sólo han aparecido apps para crear vídeos con IA que son accesibles libremente por cualquiera, sino que su calidad está mejorando a marchas forzadas. Ya se está alcanzando un nivel tal, que es muy difícil distinguir un vídeo falso de uno real, y ahora, Meta acaba de dar otro paso de gigante con un aspecto que normalmente es olvidado: el audio.
Y es que, hasta ahora, todos los generadores de vídeo se han centrado en eso, en crear vídeo; algo que ya de por sí es difícil, y añadir una pista de audio lo es aún más. En realidad, ya existen generadores de sonido por IA, pero la dificultad se encuentra en sincronizar ambos apartados, el vídeo y el audio, para crear una experiencia convincente. Y eso es justo lo que Meta afirma haber conseguido.
La nueva IA de Meta se llama Movie Gen, y una de sus características estrellas es la generación de audio. En vez de crear una banda sonora al mismo tiempo que el vídeo, el proceso implica primero crear el vídeo, y luego usar un modelo de generación de audio con 13.000 millones de parámetros. Este modelo es capaz de analizar el vídeo e incluir lo que el usuario está pidiendo a través de una línea de texto.
Por ejemplo, si tenemos un vídeo de un 'quad', podemos indicar que queremos el sonido del motor acelerando, con música de guitarra de fondo, y la IA lo comprenderá y generará audio alineado con los eventos que están ocurriendo en el vídeo. Aunque los vídeos publicados por Meta no son perfectos, ya suponen un gran avance respecto a no tener sonido en absoluto.
La creación de vídeo también es llamativa y compite directamente con Sora en cuestión de calidad. Movie Gen está optimizado tanto para creaciones de texto a imagen, como de texto a vídeo, y el resultado son vídeos e imágenes en alta definición que podrían haber sido sacados de una película, de ahí el nombre de la IA.
Sin embargo, todo el mundo sabe que las películas se reproducen a 24 fotogramas por segundo, y Movie Gen todavía no llega a eso: es capaz de crear vídeos de hasta 16 segundos a 16 fotogramas por segundo. Sin embargo, Meta presume de que su modelo es capaz de razonar en aspectos vitales como el movimiento de los objetos y las interacciones entre estos, además del movimiento de la cámara.
Además de texto, la IA también puede crear vídeos a partir de imágenes. Esto permite, por ejemplo, convertirnos en el protagonista de una película; en una de las demostraciones, una foto de una mujer es suficiente para indicar a la IA que queremos que lleve una chaqueta rosa, pinchando de DJ y con un guepardo al lado. Tal vez más impresionante sea la edición de vídeo, que permite modificar elementos como por ejemplo, darles trajes victorianos a unos pingüinos o meter nuestra sesión de entrenamientos en un estadio olímpico.
Por el momento, Movie Gen está disponible sólo para empleados de Meta y para "unos pocos colaboradores externos", incluyendo algunos cineastas; por lo tanto, la compañía está siguiendo una estrategia similar a la de OpenAI, al menos de momento. Sin embargo, en el futuro esta IA estará integrada en WhatsApp, Instagram, y el resto de apps de Meta, como ya lo está la creación de imágenes con Meta AI.