En mayo de este año OpenAI dejó boquiabierto a medio mundo al mostrar las extraordinarias virtudes del modo conversacional de GPT-4o, el que ha sido su último modelo de lenguaje mayor hasta la presentación hoy misma de una versión reducida: GPT-4o mini.
Un anuncio que llega a los días de la disponibilidad en Android de la IA de Anthropic con la app de Claude. Otra gran experiencia que se esperaba que estuviese disponible en los móviles de Android y que ofrece una gran alternativa a la propia ChatGPT o Gemini de Google lanzado hace un par de meses en España.
GPT-4o mini ha sido denominado por la compañía como el modelo pequeño más capaz y eficiente en coste disponible a día de hoy, y su plan es integrar imagen, vídeo y audio próximamente. Este modelo mini de IA es una versión empequeñecida de GPT-4o, el modelo más rápido y potente de GPT-4o.
La gran actualización de su modelo anunciado en mayo, aparte de hacer temblar a Google con su Gemini, se caracteriza por mejorar sus capacidades de texto, audio y vídeo con la habilidad de manejar 50 idiomas a una velocidad de vértigo, y sin dejar de lado la calidad en las consultas que se hagan a ChatGPT con esta versión; gratuita hasta cierto límite según número de consultas.
La 'o' de GPT-4o es para la experiencia 'omni' de ChatGPT (texto, audio y vídeo) y el nuevo modelo de IA mini anunciado hace unas horas es parte de la multimodalidad o la habilidad del usuario para incluir todo tipo de contenido multimedia al igual que el chatbot es capaz de generarlo; a la espera se está para el lanzamiento del modo conversacional donde ChatGPT será similar a la IA de la película Her protagonizada por Joaquín Phoenix.
Sus capacidades
GPT-4o mini puntúa con un 82 % en MMLU y mejora enormemente en el chat a GPT-4 en la tabla LMSYS. Es capaz de cubrir tareas de menor coste y latencia como apps que encadenan o paralelizan múltiples llamadas de modelo, o interactuar con clientes con respuestas de texto rápidas en tiempo real (lo que sería un chatbot de soporte a cliente). Estas son sus mejores capacidades:
- Razonamiento: GPT-4o mini es mejor que otros modelos pequeños en tareas de razonamiento de texto y visión. 82,0 % en MMLU contra el 77,9 % de Gemini Flash y Claude Haiku con 73,8 %.
- Matemáticas y programación: destaca en ambas materias mejorando a otros modelos pequeños. En MGSM, GPT-4o puntúo con 87,0 %, mientras que Gemini Flash 75,5 % y Claude Haiku 71,7 %.
- Multimodal: gran rendimiento en MMMU, un test de razonamiento multimodal, para puntuar 59,4 % comparado al 56,1 % de Gemini Flash y 50,2 % de Claude Haiku,
Brad Lightcap, director de operaciones de OpenAI, declaró a la CNBC que el mundo es multimodal y las personas lo procesan a través de los sentidos al ver, oír y decir cosas. GPT-4o mini está disponible desde hoy mismo en la versión gratuita de ChatGPT y los suscriptores de ChatGPT Plus y Team según lo dicho por OpenAI. Los usuarios de ChatGPT Enterprise tendrán disponible la versión mini de la IA de OpenAI a partir de la próxima semana.
En España de momento no está desplegado GPT-4o mini, pero debería de ser en horas o días cuando lo estuviera, al igual que sucedió cuando se anunció GPT-4o en el mes de mayo. Una gran llegada que sigue lo visto con Gemini nano, como la versión reducida de la IA de Google y sirve para tareas que no exigen el consumo de tantos recursos.