ChatGPT se actualiza a lo grande con una nueva IA que 'razona': así son o1-preview y mini, disponibles ya en España
OpenAI o1-preview es el primero de los mayores modelos de lenguaje que está centrado en el razonamiento en vez de responder rápido.
13 septiembre, 2024 09:36Hace un par de días se conoció que OpenAI estaría a punto de revelar Strawberry, una IA que trata las consultas de los usuarios de una manera bien distinta: razona durante unos segundos para responder a preguntas más complejas. Y hace unas horas se ha anunciado OpenAI o1, un nuevo modelo de IA como un avance significativo y que representa un nuevo nivel de la capacidad de la inteligencia artificial generativa. OpenAI ha dado los detalles de las dos versiones que se pueden comenzar a usar ya en España.
En la noticia aparecida hace dos días se dejó claro que este nuevo modelo está diseñado para consumir más tiempo 'pensando' antes de dar una respuesta al usuario. Muy diferente de lo que sucede con uno de los últimos modelos presentados por OpenAI con GPT-4o, que de hecho, gracias a su gran capacidad para responder casi de inmediato, su modelo conversacional está poniendo contra las cuerdas a la misma Google con Gemini Live.
Es justamente lo que acaba de explicar OpenAI con su nuevo modelo de IA: capaz de razonar tareas más complejas y resolver problemas más complicados que modelos anteriores para ciertas tareas que tienen que ver con la ciencia, la programación y las matemáticas.
Desde hoy mismo se está desplegando la primera versión de estas series en ChatGPT y su API. Es un previo y se esperan actualizaciones periódicas y mejoras al mismo. También se incluirán evaluaciones de rendimiento para la próxima actualización que justamente se encuentra en desarrollo.
OpenAI o1 ha sido entrenado para que consuma más tiempo 'pensando' o razonando los problemas antes de responder, tal como haría una persona. A través de este entrenamiento el modelo de lenguaje de IA aprende a optimizar sus procesos de razonamiento, intenta distintas estrategias y reconoce sus errores.
La IA que 'piensa'
En las pruebas llevadas a cabo, la próxima actualización del modelo rinde de forma similar a los estudiantes que cursan un doctorado (PhD) para enfrentarse a tareas de pruebas de rendimiento en física, química y biología. Este modelo también es capaz de ofrecer muy buenos resultados en matemáticas y programación.
Hay un dato que deja bien clara la importancia de OpenAI o1, si GPT-4o llegó a resolver correctamente el 13 % de los problemas de IMO (International Mathematics Olympiad), este modelo de razonamiento resuelve el 83 %. Sus capacidades para la programación fueron evaluadas y alcanzó el percentil 89 en Codeforce (obtuvo una puntuación superior del 89 % frente al resto).
Al estar en una primera fase de desarrollo, este nuevo modelo no tiene todas las capacidades que sí ofrece GPT-4o en lo multimodal. Es decir, que de momento es solo texto y no es capaz de explorar la web para buscar información o que se pueda subir imágenes y archivos para que los analice.
OpenAI o1-mini
Si OpenAI o1 está dedicado al completo en tareas bien complejas en ciencia, programación, matemáticas y otros campos similares —como podría ser para ayudar a la investigación en temas de salud para anotar los datos de secuenciación celular o ayudar a los físicos a generar fórmulas matemáticas complicadas para la óptica cuántica— se ha anunciado también OpenAI o1-mini.
Justo en julio se anunció GPT4-o mini como un modelo con importantes capacidades, pero que no exige tantos recursos, OpenAI o1-mini va por el mismo camino para ofrecer una solución eficiente para los desarrolladores. Un modelo más rápido y más barato que es bien efectivo en programación.
Un modelo más pequeño que es un 80 % más económico que o1-preview, lo que le convierte en uno bien potente para ahorrar en costes para cierto tipo de aplicaciones que no requieren tanto razonamiento.
Ambos modelos, tanto o1-preview como o1-mini ya están disponibles desde hoy mismo en ChatGPT en España y pueden ser seleccionados manualmente desde el selector de modelos, aunque hay ciertas limitaciones de consultas semanales: 30 mensajes para o1-preview y 50 para o1-mini.
Este índice se incrementará próximamente con la capacidad de activar ChatGPT de forma automática para que seleccione el modelo más adecuado según la consulta. Finalmente, el objetivo de OpenAI es lanzar el modelo 01-mini próximamente a todos los usuarios que utilizan ChatGPT de forma gratuita según mantiene desde su anuncio en la web.