Los impresionantes vídeos de Sora, la nueva IA que te va a hacer dudar de todo lo que veas a partir de ahora
La creación de vídeo sin conocimientos técnicos ya es una realidad con Sora de OpenAI, con un realismo impresionante.
16 febrero, 2024 15:21Hace algo más de un año, ChatGPT provocó un auténtico terremoto en el sector tecnológico. Por primera vez, una IA generativa estaba al alcance del gran público, y no era un simple concepto futurista; era real, y cualquiera podía usarla para crear textos de cualquier tipo.
Pocas semanas después, las IA capaces de crear imágenes, como Dall-E y Midjourney, demostraron que ni la industria ni los internautas estaban preparados para semejante potencial. Ahora, acabamos de ver un salto tan, o incluso más grande, con la presentación de Sora.
Sora es la nueva IA de OpenAI, creadores de ChatGPT y Dall-E y comandados por una de las figuras más polémicas del sector, Sam Altman. Calificado como un genio visionario por unos, y por un loco avaricioso por otros, Altman ha dejado atrás el miedo por la IA y ha pisado el acelerador en el desarrollo de nuevos modelos multimodales, capaces de crear todo tipo de contenido a través de texto, imágenes y vídeo.
Los vídeos de Sora
El resultado de esta apuesta es Sora. Esta no es la primera Inteligencia Artificial capaz de crear vídeos, ni mucho menos; pero es, sin duda alguna, la más avanzada. La diferencia respecto a otros proyectos de creación de vídeo como el de Google es abrumadora; comparar vídeos creados por ambas IA es como comparar los gráficos de una PlayStation con los de una PlayStation 5, es como si hubiesen pasado varias generaciones entre ambos. Pero en realidad, han sido desarrollados casi al mismo tiempo.
Prompt: Una mujer elegante camina por una calle de Tokio con luces de neon brillantes y señales de ciudad animadas. Lleva una chaqueta de cuero, un bestido rojo largo, y botas negras, y transporta un bolso negro. Lleva gafas de sol y pintalabios rojo. Camina de manera confiada y casual. La calle está húmeda y refleja, creando un efecto de espejo de las coloridas luces. Varios peatones caminan.
Los vídeos compartidos por OpenAI demuestran cómo este modelo es capaz de coger texto y crear vídeos con diversos estilos y ‘dirección’; desde creaciones realistas que parecen haber sido grabadas con una cámara en lugares reales, hasta escenas animadas que podrían encajar perfectamente en la próxima película de Pixar.
Prompt: Escena animada con un plano cercano de un monstruo pequeño y mullido arrodillándose al lado de una vela roja que se está fundiendo. El estilo del arte es 3D y realista, con un enfoque en la iluminación y la textura. El estado de ánimo es de maravilla y curiosidad, con el monstruo mirando la llama con los ojos y la boca abiertos. Su pose y expresión muestran un sentido de la inocencia y diversión, como si estuviese explorando el mundo por primera vez. El uso de colores cálidos y luz dramática mejora la atmósfera de la imagen.
La clave de este realismo, según OpenAI, está en que Sora es capaz de entender “cómo los objetos existen en el mundo físico”, y por eso no sufren de los problemas habituales de la creación de vídeos, como la mezcla entre objetos que tantas pesadillas provocaron las primeras creaciones hace un par de años. Sin embargo, confiesan que aún queda por mejorar, especialmente en la simulación de físicas.
Prompt: Una bandada de aviones de papel vuelan a través de una densa jungla, volando entre los árboles como si fuesen aves migratorias.
Prompt: Un gato despertando a su dueña durmiente pidiendo el desayuno. La dueña intenta ignorar al gato, pero el gato intenta nuevas tácticas y finalmente la propietaria saca un alijo secreto de premios de la almohada para mantener al gato un poco más.
A nadie se le escapa que Sora es como la Caja de Pandora, y que una vez abierta será imposible volver a cerrarla. La creación de vídeos profesionales será tan fácil como escribir lo que queremos, y eso puede tener consecuencias gravísimas para millones de personas; desde la pérdida de puestos de trabajo que inevitablemente conllevará, a la creación de vídeos falsos para engañar a la población, como políticos compartiendo crímenes falsos cometidos por su rival o tiendas que muestran productos falsos.
Prompt: Metraje histórico de California durante la fiebre del oro.
Prompt: Arqueólogos descubren una silla de plástico en el desierto, escavando y y quitando el polvo con gran cuidado. Fallo: en este ejemplo, Sora no considera la silla como un objeto rígido, llevando a interacciones físicas imprecisas.
Por eso, por el momento Sora no está disponible para el público, y no se puede usar incluso si tenemos una suscripción a los servicios de OpenAI. Sólo una cantidad limitada de personas del ‘equipo rojo’ de OpenAI, que serán las encargadas de encontrar daños y riesgos potenciales pueden crear vídeos. La compañía también ha confirmado que ofrecerá acceso a varios “artistas, diseñadores y cineastas” para que den su opinión.
Te puede interesar
- OpenAI ya añade marcas de agua a DALL-E 3: así identificarás cuando una imagen es generada por IA
- Adiós a Google: los creadores de ChatGPT trabajan en su propio buscador de Internet potenciado por IA
- Hablo con ChatGPT en mi móvil y ya es más un amigo que un sustituto de Alexa