DeepSeek Omicrono Omicrono

Software

Qué es DeepSeek, la inteligencia artificial china que ha superado a ChatGPT en capacidades y eficiencia por sorpresa

Este chatbot chino de código abierto ha llamado la atención en las últimas semanas por sus capacidades frente a los principales rivales.

Más información: DeepSeek deja en ridículo a OpenAI con Janus Pro 7B, su IA de generación de imágenes que también las 'entiende'

Marta Sanz Romero

Publicada 27 enero 2025 10:43h

Actualizada 28 enero 2025 15:32h

El mundo de la inteligencia artificial está viviendo una revolución. El 2025 ha empezado con fuerza en este sector, en el que empresas chinas están conseguido poner nerviosos a los gigantes de Estados Unidos. OpenAI lanzó O3 la semana pasada, su nuevo modelo capaz de razonar y completamente gratis. Su respuesta ha sido DeepSeek, el chatbot chino que está captando todas las miradas y ya ha provocado el desplome de Nvidia, que pierde 400.000 millones de capitalización, y una caída del 3% del Nasdaq vinculada directamente con las tecnológicas estadounidenses.

El entusiasmo por este nuevo agente es tal que la aplicación para usar el chatbot de DeepSeek se ha colocado en el primer puesto de la App Store de EEUU, destronando a ChatGPT. Son tres las claves por las que esta startup china ha puesto contra las cuerdas a los reyes de la IA: su rendimiento, su precio y su condición de código abierto.

El pasado 20 de enero, DeepSeek presentó R1, un modelo especializado en resolver problemas complejos generando cadenas de razonamiento. Una propuesta similar a la que ya presentó OpenAI con su modelo o1 en 2024. La primera sorpresa llegaba en el propio documento de presentación, al ver los resultados del modelo en los principales benchmarks, a pesar de usar chips inferiores, como señala The Wall Street Journal.

Potente, barato y abierto

En la siguiente gráfica se puede apreciar como el modelo DeepSeek-R1 se mide de cerca, incluso supera a OpenAI-o1, en la mayoría de benchmarks o pruebas de rendimiento del mercado. Atrás quedan modelos como DeepSeek V3 que se presentó sin capacidad de razonamiento a finales del mes de diciembre de 2024. En solo un mes, la startup china ha conseguido plantar cara al rey de esta industria. Aún así, los expertos advierten que, aunque es una gran promesa, está tecnología aún está por detrás de la de OpenAi y Google.

Con estos resultados, el siguiente acierto ha sido el precio. El modelo estrella de DeepSeek es gratuito, pero la empresa cobra a los usuarios que conectan sus propias aplicaciones al modelo y la infraestructura informática de DeepSeek. Mientras que OpenAI pide 57,80 euros (438 yuanes en China) por el uso de un millón de tokens de salida, DeekSeek solo pide 2,10 euros (16 yuanes), tal y como ya señalaba Reuters.

Vídeo | DeepSeek, la nueva aplicación que altera el tablero de la inteligencia artificial Nacho Castañón

En la web de DeepSeek se puede probar el chatbot y activar la cadena de razonamiento que se despliega por completo hasta llegar a la respuesta final. La máquina dialoga consigo misma expresándose como lo haría un humano. Solo hay que activar el botón DeepThink para poder compararlo con la capacidad de razonamiento de otros rivales como OpenAI. En versiones anteriores este chatbot ha mostrado cierta censura con políticas sensibles en China.

La transparencia de DeepSeek sería la tercera pata de su reciente éxito. Esta empresa suele lanzar sus modelos opensource, es decir, abre el código para que toda la comunidad de desarrolladores y otras empresas puedan hacer uso de la tecnología.

DeepSeek R1 isn't just "25x cheaper than GPT o1"...

It is better than the unreleased OpenAI o3 at the same cost at coding on Codeforces and ARC-AGI! pic.twitter.com/JNOZJhTpiw
— Deedy (@deedydas) January 27, 2025

Una estrategia que gigantes como OpenAI y Google dejaron atrás hace tiempo. En el propio paper, DeepSeek detalla su trabajo para crear su modelo de razonamiento con muchos más detalles de los que suelen dar las empresas privadas.

El futuro de DeepSeek R1

Esa apertura pone a disposición de la comunidad global la posibilidad de mejorar otros proyectos, nutrirse de la tecnología de DeepSeek. R1 es un modelo de gran tamaño, que permite ejecutar solo una parte concreta según el uso que se le vaya a dar, pero que requiere un gran hardware para ejecutarlo. La empresa china lo ha lanzado para que otras empresas puedan utilizarlo de forma comercial.

La propia compañía china ya le está dando un uso como entrenador de sus futuros modelos de inteligencia artificial, explica el divulgador Carlos Santana en su canal de Youtube. Utilizando los datos sintéticos y razonados que genera R1, se nutren y entrenan otros modelos de menor tamaño sin capacidad de razonamiento de DeepSeek y cuyos resultados también están desafiando en los benchmarks a modelos de mayor tamaño. La IA entrenando a la IA del futuro.

Potente, barato y abierto

El futuro de DeepSeek R1

Más en Software