OpenAI tiene varios frentes abiertos desde la generación de imágenes por IA de Firefly de Adobe y a Bard de Google como su IA que ya está integrándose con las apps que más usan los usuarios desde sus móviles. Ahora acaba de anunciar la llegada de DALL-E 3, el nuevo 'motor' que usará para propiciar que su generador de imágenes sea capaz de llevar al límite los detalles en las imágenes generadas, o que los textos introducidos (prompts) realmente valgan para crear esas estupendas ilustraciones por IA.
Justo hace unas horas OpenAI anunció DALL-E 3, la última versión de su modelo de síntesis de imágenes por IA que se integra plenamente con ChatGPT. Ahora su gran capacidad es renderizar imágenes siguiendo al detalle cada una de las descripciones complejas y una gestión más eficaz de todos los detalles que aparecen en las mismas.
Esta gran novedad de los creadores de ChatGPT se incluye en el previo que estará disponible para los suscriptores en ChatGPT Plus y Enterprise a primeros de octubre. OpenAI no ha dado ningún detalle técnico sobre DALL-E 3, el modelo por IA que ha sido entrenado anteriormente gracias a los millones de imágenes creadas por artistas y fotógrafos, algunas con licencia de sitios web como Shutterstock (ya declaró que había usado contenido protegido con derechos de autor).
Aquí sigue por el mismo camino, aunque se han aplicado nuevas técnicas de entrenamiento y se ha consumido mucho más tiempo en el entrenamiento computacional. Todo para que DALL-E 3 sea capaz de llevar al máximo los detalles que ahora se pueden encontrar en las imágenes que genera. Este tipo de generadores todavía tienen varios frentes de batalla, y uno ha sido su incapacidad para crear manos reales.
La gran mejora de esta actualización es que DALL-E 3 sigue al detalle cada uno de los prompts introducidos. Es decir, que no dejará ninguno de lado para que así la descripción resulte en la imagen deseada. También se han reducido las posibles imperfecciones o deformaciones para que casi aparezcan inadvertidas en un primer vistazo. Esto último es la gran diferencia si se le compara a DALL-E 2. De hecho, es capaz de renderizar las manos de una forma más efectiva.
También, no ha querido dejar ningún tipo de espacio para que sea ocupado por nuevas alternativas como Ideogram. En este caso tiene que ver con los textos que se pueden generar en las imágenes. Esta es otra de las mayores diferencias con la anterior versión, ya que ahora se puede introducir un 'prompt' en el que se aclare que aparezca un terapeuta diciendo 'me siento vacío por dentro'. Es decir, que se van a poder crear memes con textos para ilustrar de mejor forma lo que se quiera expresar con la imagen.
Integración con ChatGPT
Finalmente, DALL-E 3 se integrará en ChatGPT a través de la suscripción para que así las conversaciones que se tengan con el chatbot puedan ser ilustradas con las imágenes generadas por IA. Otro puntazo es que ChatGPT será capaz de renderizar imágenes basadas en el contexto del chat que se tenga con el usuario. Dista un poco de lo nuevo de Google en España para Bard que incluye la posibilidad de incluir imágenes en los chats con su IA, aunque éstas prestadas desde su buscador.
Hay otro último punto que es bien importante: DALL-E 3 rechazará las solicitudes de los usuarios que quieran aplicar el estilo de un artista contemporáneo. Y finalmente, y de una forma para evitar futuros litigios, OpenAI ofrece un formulario donde cualquier artista o creador puede optar a que sus imágenes no sean usadas para entrenar modelos futuros de DALL-E.
Es una forma de escudarse ante todos los problemas que se están generando debido al uso inapropiado de imágenes propiedad de artistas humanos, a la vez que la política de derechos de autor de EE. UU. mantiene que el arte generado con inteligencia artificial no puede recibir la protección habitual de derechos de autor. Lo que significa que todo gráfico generado con IA es de dominio público; aquí se puede hacer una referencia a Ideogram, que todo el contenido generado puede ser descargado por cualquiera para convertirse en toda una red social donde compartir este tipo de imágenes es una de sus mejores experiencias.
Otro detalle que explica OpenAI desde su web sobre el nuevo DALL-E es que se han implementando filtros de detección de palabras e imágenes para limitar su habilidad para producir contenido dañino, sexual y violento. También rechazará las solicitudes de generación de imágenes de figuras públicas, según Ars Technica, para así evitar que aparezcan fotos fake como las del anterior presidente de Estados Unidos en las que aparecía arrestado. Todo esto está generando un gran revuelo y simplemente hay que echar un ojo a lo sucedido aquí en España con el caso 'Almendralejo'.