Esta inteligencia artificial crea obras de arte con sólo describirlo con una frase
DALL-E sorprende con su nueva versión capaz de generar imágenes inventadas con una resolución cuatro veces mayor.
9 abril, 2022 16:25Noticias relacionadas
Desde un astronauta cabalgando por el espacio, hasta una planta creciendo de la palma de la mano, la inteligencia artificial sorprende al mundo por su nueva capacidad de realismo al crear obras sugeridas por los humanos. DALL-E, inteligencia artificial creada por Open-AI hace un año, consigue superarse en una nueva versión mejorada que genera imágenes con una resolución cuatro veces mayor.
Esta IA, nació en 2021 bautizada con un juego de palabras entre el robot WALL·E de Pixar y el pintor español Salvador Dalí. Su propósito es impulsar la capacidad creativa de esta tecnología, aprendiendo a construir imágenes a partir de simples frases en lenguaje natural.
Lejos de lo anecdótico de las pinturas surrealistas que consigue crear, los conocimientos adquiridos por esta tecnología servirán en el futuro en múltiples aplicaciones a disposición de profesionales o usuarios. Creando de cero nuevas imágenes o modificando algunas ya existentes, sus creadores lucen con orgullo el crecimiento de esta IA, pero manteniendo medidas para evitar que se use de forma abusiva o violenta.
Creando o modificando
En múltiples estilos artísticos o con calidad fotográfica, la inteligencia artificial de esta compañía sin ánimo de lucro fundada por Sam Altman y Elon Musk, y respaldada por Microsoft, ha mejorado su pincelada considerablemente en un año. Los ejemplos que se vieron en su lanzamiento poco tienen que ver con los que han mostrado ahora.
DALL-E 1 se entrenó en un principio con 12.000 millones de parámetros de GPT-3, otra inteligencia artificial destinada a analizar y expresarse como los humanos de la que han surgido otros sistemas que saben programar a partir de frases simples. Ahora DALL-E 2 se basa en CLIP, un sistema de visión por ordenador que OpenAI también anunció el año pasado.
Según explica a The Verge el investigador de OpenAI Prafulla Dhariwal la nueva versión construye la imagen comenzando con una "bolsa de puntos" y luego llenando un patrón con mayor detalle. Así surge la imagen de un árbol naciendo de una mano.
Ver esta publicación en Instagram
"Puede crear obras de arte originales y combinar conceptos, atributos y estilos", explican sus creadores. Solo con darle una descripción como "Un Shiba Inu vistiendo una boina y un jersey de cuello alto negro", la IA genera la imagen, aprovechando el uso del lenguaje conseguido con GPT-3. Las fotos o pinturas resultantes son ahora de 1024 x 1024 píxeles, un salto sobre los 256 x 256 píxeles que entregaba el modelo original.
Otra de sus funciones es la de modificar imágenes ya existentes o recrear otra obra con un estilo diferente con una calidad mucho más acertada como se puede ver en las comparativas ofrecidas por la compañía.
Prohibidos desnudos
Estas capacidades y la calidad obtenida abren la puerta a múltiples usos, aunque no se sepa pintar, solo con describir una escena al sistema, cualquier persona puede obtener un cuadro con buena resolución para colgar en el salón de su casa. Que la inteligencia artificial mejore en su capacidad artística impulsa su uso para crear contenidos de muchos tipos, aunque también crece el debate de si será capaz de quitarle el trabajo a profesionales dedicados a lo mismo.
DALL·E 2 is here! It can generate images from text, like "teddy bears working on new AI research on the moon in the 1980s".
— Sam Altman (@sama) April 6, 2022
It's so fun, and sometimes beautiful.https://t.co/XZmh6WkMAS pic.twitter.com/3zOu30IqCZ
El modelo completo de DALL-E nunca se ha hecho público, solo se comparten ejemplos de los que es capaz de hacer. También se ha cedido acceso a ciertos desarrolladores que han podido perfeccionar sus propias herramientas. Un ejemplo es la popular aplicación móvil Wombo's Dream, que genera imágenes de cualquier cosa que los usuarios describan en una variedad de estilos artísticos.
No obstante, para evitar que esta tecnología se use de forma peligrosa. OpenAI restringe sus IA y pone límites en su uso. En este caso, los usuarios tienen prohibido generar imágenes que "no tengan clasificación G" y "puedan causar daño", como símbolos de odio, desnudez, gestos obscenos o "grandes conspiraciones o eventos relacionados con importantes eventos geopolíticos en curso".
Otra medida de seguridad es una marca de agua que indica la propiedad del trabajo generado por DALL-E, aunque se puede recortar. Tampoco se pueden generar caras reconocibles basadas en un nombre.