Google arregla lo peor de Gemini al generar imágenes con IA: así las puedes retocar ahora para mejorarlas
- Imagen 3 de Gemini ya está disponible en España para generar imágenes con IA de forma totalmente gratuita desde el mes de septiembre.
- Más información: Google se adelanta a ChatGPT con el modo conversacional de su IA: Gemini Live ya es gratis para todos en Android.
A menos de una semana de conocer la disponibilidad global de Imagen 3 en Gemini para la generación gratuita de imágenes con inteligencia artificial, ahora se ha descubierto la próxima y gran novedad: ofrecerá más control al usuario para determinar el aspecto final de la imagen con IA.
Google tuvo que cancelar el despliegue de su experiencia de generación de imágenes con IA por el lío que se montó en febrero. Retrasó su disponibilidad global, y en esos momentos se desconocía cuando tendría listo Gemini para que ofreciera una experiencia que puede ser vista en ChatGPT con DALL-E, que permite la edición de imágenes desde marzo, u otras como Midjourney.
El resto de soluciones para crear este tipo de imágenes suelen ofrecer ciertos ajustes para modificar el aspecto de la imagen final como puede ser su relación de aspecto, o si ha de tener un acabado tipo fotografía o más tirando a una ilustración. El problema de Imagen 3 es que todas las imágenes creadas actualmente son cuadradas; es el único formato posible.
En la versión beta 15.41.34.29.arm64 de la app de Google se ha podido activar desde Android Authority unos ajustes en desarrollo que permiten cambiar el tamaño de las imágenes que produce Gemini. Y aquí se incluyen todo tipo de opciones como puede ser el formato 16:9 para pantallas más anchas o los comunes 4:3 y 3:4.
Si con este cambio ya se acerca a otras soluciones como Midjourney o Firefly de Adobe, parece que hay un desarrollo bien interesante, no solo por permitir cambiar la relación de aspecto de la imagen, sino porque al ampliar el 'lienzo' de la imagen generada de 1:1 a 4:3, todo el espacio vacío lo rellena con IA para enriquecerla.
Es prácticamente el relleno generativo de Firefly en Photoshop de Adobe para así dejar al usuario que si se ha generado la imagen de una mascota, a cambiar su relación de aspecto se pueda rellenar con un nuevo prompt tecleado por el usuario, tal como lo enseña Android Authority desde un vídeo con este desarrollo activo en Gemini.
Aquí Google está desarrollando distintas formas de dar a los usuarios más control sobre lo que Gemini genera. Otro de ellos se descubrió la semana pasada para poder ir añadiendo elementos a la primera imagen generada y así ir mejorándola según se va describiendo a través de los prompts.
Así que sumada a este nuevo desarrollo, según Android Authority, se puede decir que próximamente Google actualizará Gemini con una notable mejora en la generación de imágenes para que el usuario tenga más control sobre lo que se va generando.