Imagen promocional de Amazon Nova.

Imagen promocional de Amazon Nova. Amazon Omicrono

Software

Así es Amazon Nova, la familia de modelos de IA capaz de generar imágenes y vídeos con gran rapidez

Publicada

Si algo ha demostrado el éxito brutal de ChatGPT, alcanzando los 200 millones de usuarios semanaleses la importancia de la IA en España. Tanto, que ha hecho mover ficha a Apple con Apple Intelligence y a Google con su modelo Gemini. Amazon también se ha sumado al carro presentando Nova, su nueva familia de modelos de inteligencia artificial multimodales centrados exclusivamente en texto.

El anuncio ha sido llevado a cabo en la conferencia re:Invent 2024, y ha sido la división de Amazon Web Services (AWS) la que ha dado a conocer dicha familia, compuesta de estos cuatro modelos. No solo eso; además de los modelos de IA de texto, Amazon ha anunciado un modelo de generación de imágenes y otro modelo para generar vídeos, aunque estos ya están disponibles.

La idea de Amazon Nova es la de impulsar aplicaciones de inteligencia artificial generativa capaces de procesar texto, imágenes y vídeos. Algunas de las aplicaciones que atisba Amazon en este futuro incluyen la comprensión de gráficos y vídeos, generar metraje y procesar solicitudes de texto. Unos modelos que estarán disponibles en Amazon Bedrock, el servicio de API para aglutinar modelos fundacionales (FM) de alto rendimiento.

Amazon Nova, la familia de modelos de IA

Los nuevos modelos dentro de Amazon Nova se pueden englobar en tres categorías: texto, imágenes y vídeo. En cuanto a imágenes se presenta Amazon Nova Canvas, un modelo de inteligencia artificial generativa, valga la redundancia, de imágenes. Respecto a la generación de vídeos, Amazon ha dado a conocer Amazon Nova Reel. Es en el texto donde se encuentran los mayores cambios.

En este bloque se han presentado cuatro modelos. Amazon Nova Micro, Amazon Nova Lite, Amazon Nova Pro, y Amazon Nova Premier, siendo este último "el modelo multimodal más capaz de Amazon para tareas de razonamiento complejas". Esta es la lista de utilidades y funciones asociadas con cada uno de estos modelos:

  • Micro: un modelo de texto de coste muy bajo que ofrece respuestas rápidas, sin apenas latencia. Disponible en Amazon Bedrock.
  • Lite: un modelo multimodal también de bajo coste y que puede procesar entradas de texto, imágenes y vídeos a una alta velocidad. Un paso intermedio entre Micro, y el siguiente modelo, Pro. Disponible en Amazon Bedrock.
  • Pro: un modelo multimodal "de gran capacidad" que amplía su gama de tareas combinando aspectos como el coste, la velocidad y la precisión. Disponible en Amazon Bedrock.
  • Premier: el modelo multimodal más potente de la familia, ideado para tareas de razonamiento complejas. Además, Amazon usará Nova Premier como "profesor para desarrollar modelos personalizados". Disponible el próximo trimestre de 2025.

Micro, Lite, Pro y Premier, así como Canvas y Reel son modelos integrados por Bedrock, este servicio que permite usar modelos de gestión de alto rendimiento de empresas dedicadas a IA a través de una única API. Una característica común de los cuatro modelos, además de los otros dos dedicados a imágenes y vídeos, es que admiten ajustes personalizados; los clientes pueden indicarles ejemplos de sus propios datos etiquetados para aumentar su precisión.

Un ejemplo es Nova, que puede aprender del cliente a partir de sus propios datos. "Luego, Amazon Bedrock entrena un modelo personalizado que proporcionará respuestas personalizadas", expone Amazon en un comunicado. Además, los modelos también admiten la llamada destilación, que permite transferir un conocimiento específico desde un modelo "docente" más grande y altamente capaz a un modelo más pequeño y eficiente, más económico y rápido de usar.

Los seis modelos de la familia Nova están adscritos con los principios de inteligencia artificial generativa responsable de Amazon AWS. En este caso, al estar suscritos a este marco de seguridad, los modelos ofrecen información transparente sobre sus casos de uso, las prácticas de IA responsables y sus limitaciones, a través del AWS AI Service Cards.

Una de las muchas aplicaciones de estos modelos de Amazon Nova incluye lógicamente los anuncios de Amazon Ads. Usando Amazon Nova Canvas o Nova Reel, los usuarios pueden crear campañas con imágenes y vídeos de forma más rápida y experimentar con más estrategias usando la creatividad. Amazon ha puesto varios ejemplos, incluyendo una ciudad hecha de pasta creada con Amazon Nova Reels.

Ciudad hecha de pasta con Nova Reels.

Amazon asegura que las marcas que usan herramientas de inteligencia artificial generativa "anuncian cinco veces más productos y el doble de imágenes por producto anunciado", lo que lleva a modificar los estándares de publicidad de los anunciantes. Amazon también relata que la comprensión visual es un factor determinante para crear este material creativo. Amazon Nova Pro, en otro ejemplo, sugiere varios ejemplos de subtítulos para redes sociales, para un solo vídeo mudo de apenas 12 segundos.