Google sigue en pie de guerra contra OpenAI y ayer dejó asombrado a medio mundo con el despliegue de su nueva plataforma llamada Veo que se encarga de generar vídeos con inteligencia artificial simplemente majestuosos. DeepMind, la organización de investigación de IA de Google, ha desvelado un modelo que puede generar una variedad infinita de mundos 3D jugables.
Los videojuegos casi siempre han usado motores de juego encargados de crear esos mundos en 3D basados siempre en unas reglas fijas para la creación 'manual' de los entornos por los que el jugador se mueve, vuela o conduce. Algunos juegos han preferido una técnica llamada generación por procedimientos (procedural generation), que crea entornos aleatorios 'correctos' según explora el jugador; Minecraft es el mejor ejemplo uso de esta técnica en sus mundos.
Lo que permite asistir a un mundo que va generándose de forma aleatoria y correcta para que la exploración sea uno de sus principios básicos. No ha sido el único juego y otros ya en su día basaron su experiencia en este tipo de generación aleatoria como fue el legendario Diablo 2, en el que cada vez que se empezaba una partida desde cero el mapa se generaba de nuevo para que el jugador tuviera que explorarlo de nuevo.
Teniendo esto en mente es más fácil entender la dimensión que ofrece Genie 2, el modelo sucesor de Genie de DeepMind, que fue lanzado a principios de este año y puede generar desde una única imagen y una descripción de texto una escena interactiva en tiempo real. En este aspecto es similar a otros modelos bajo desarrollo como Fei-Fei Li de World Labs y Decart.
DeepMind desde su web clama que Genie 2 puede generar una vasta diversidad de mundos 3D en los que los usuarios pueden hacer acciones como saltar y nadar al usar el ratón o el teclado para moverse por ese entorno generador con IA. Este modelo se habría entrenado en vídeos y es capaz de simular interacciones con objetos, animaciones, iluminación, física de objetos, reflejos e incluso el comportamiento de NPCs (Non Player Controlled).
Esta enorme capacidad para generar mundos que parecen videojuegos tipo AAA, como sería los de Elden Ring o Grand Theft Auto 5, se debe a que los datos de entrenamiento del modelo contienen partidas de títulos populares, aunque DeepMind en este sentido no ha querido revelar detalles sobre la fuente de datos.
Hay otro aspecto a tener muy en cuenta y es que Genie 2 puede generar mundos consistentes con distintas perspectivas como vistas en primera persona o isométrica de hasta un minuto. De hecho, la gran mayoría de estos mundos tienen una duración de 10 a 20 segundos.
Y otro punto, Genie 2 responde inteligentemente a las acciones que hace el usuario al pulsar las teclas en el teclado al identificar el personaje y moverlo correctamente. El paso dado aquí por DeepMind es increíble, ya que incluso su modelo puede identificar que las teclas de flechas deberían de mover el robot y no el entorno u otros NPCs.
Recuerda los niveles creados
Según TechCrunch el gran aspecto diferenciador para entender mejor el logro de DeepMind —al revés que otros simuladores como Oasis de Decart para Minecraft que genera a baja resolución y olvida rápidamente los niveles creados— Genie 2 puede recordar partes de la escena simulada que no están en la vista del jugador y así recrearlas para hacerlas visibles.
La limitación actual de Genie 2 es el borrado del progreso cada minuto, por lo que DeepMind actualmente posiciona el modelo como una herramienta creativa y de investigación. Una limitación que podría evaporarse en cualquier momento, ya que Google ha invertido cantidades ingentes de recursos en lo que entiende como "el próximo gran avance en IA".
Ya en octubre DeepMind contrató a Tim Brooks, que fue el jefe de desarrollo de Sora de OpenAI, la increíble herramienta para generar vídeo desde un prompt y que dejó estupefacto a medio mundo cuando fue desvelado. Brooks trabajaría en tecnologías de generación de vídeo y simuladores de mundos sumándose Tim Rocktäschel, conocido por sus experimentos de mundos abiertos en juegos como NetHack de Meta.