Deepseek
DeepSeek: El Gigante de la IA con el que China Quiere Dominar el Mundo
DeepSeek es el nuevo modelo de inteligencia artificial que está causando sensación en el mundo tecnológico.
Con capacidades avanzadas de procesamiento de lenguaje y generación de contenido, se perfila como una alternativa potente a los gigantes del sector.
Su precisión, rapidez y comprensión contextual la convierten en una herramienta ideal para tareas complejas como programación, análisis de datos y generación de texto creativo

¿Preparado para tu próxima aventura?
🚀 DeepSeek Sacude el Tablero: La IA China que Desafía a EE.UU. con un Presupuesto Mínimo 🌍
En menos de un mes, DeepSeek, un proyecto secundario de un pequeño laboratorio de Inteligencia Artificial (IA) en China, representado por el ícono de una ballena, ha irrumpido con fuerza en la geopolítica de la IA.
El primer gran impacto llegó en Navidad de 2024, cuando DeepSeek lanzó su modelo de IA, V3, asegurando alcanzar un nivel de inteligencia comparable a ChatGPT, pero con una inversión sorprendentemente baja de solo cinco millones de dólares.
El golpe definitivo fue aún más contundente. El 20 de enero de 2025, mientras Donald Trump asumía su segundo mandato como presidente de Estados Unidos y anunciaba junto a Sam Altman la gigantesca inversión de 500 mil millones de dólares en IA con el proyecto Stargate, China respondió con un movimiento inesperado: DeepSeek lanzó su modelo más avanzado hasta la fecha, el DeepSeek-R1.
¿Está naciendo un nuevo titán de la IA que pondrá en jaque a Occidente? 🔥
La compañía china aplicó los mismos estándares de evaluación que ChatGPT para demostrar que su modelo R1, a pesar de las limitaciones impuestas por EE.UU. en la adquisición de chips avanzados de NVIDIA, alcanza un rendimiento equiparable al O1 de OpenAI.
Además, DeepSeek introdujo un factor clave que podría hacer tambalear el valor de varias empresas estadounidenses en la bolsa.
Mientras que utilizar el O1 de OpenAI implica un costo mensual de 200 dólares, DeepSeek-R1 se ofrece de manera totalmente gratuita.
Este movimiento ha generado un impacto sísmico en Silicon Valley, desafiando la idea dominante de que solo con inversiones multimillonarias se pueden alcanzar capacidades avanzadas en inteligencia artificial.
¿Qué es DeepSeek y cómo opera su modelo DeepSeek-R1?
DeepSeek es una iniciativa de un laboratorio chino de Inteligencia Artificial con una plantilla de menos de 200 empleados y creador de dos modelos de IA.
El primero, V3, fue lanzado en Navidad de 2024, seguido poco después por su versión más avanzada, DeepSeek-R1, presentada oficialmente el 20 de enero de 2025.
DeepSeek-R1 fue entrenado en solo dos meses, utilizando técnicas innovadoras y el hardware disponible, a pesar de las restricciones impuestas por EE.UU. sobre la adquisición de chips avanzados.
Según explica el experto español Gustavo Entrala en su canal de YouTube, la compañía empleó un enfoque basado en aprendizaje profundo, alimentando el modelo con enormes volúmenes de datos para que pueda detectar patrones y generar predicciones.
El chatbot DeepSeek-R1 se encuentra disponible gratuitamente en el sitio deepseek.com y en la aplicación DeepSeek para Android e iPhone.

¿La falta de chips potentes hace que DeepSeek sea inferior a ChatGPT o Gemini?
La respuesta es que no, presta atención a los siguientes detalles
Cuando se evalúa la calidad de un modelo de IA, se usan métricas conocidas como benchmark.
Aunque hay varios estándares para comparar, lo sorprendente de DeepSeek es que, para medir el rendimiento de sus modelos, decidió usar ¡el benchmark de OpenAI!
La empresa china ha utilizado el propio sistema de comparación de OpenAI para medir su rendimiento frente al gigante estadounidense.
El benchmark de OpenAI incluye pruebas de matemáticas (AIME), biología, física y química (GPQA), dos exámenes de programación y otro de lógica y razonamiento conocido como Zebra.
Al comparar DeepSeek-R1 con el modelo más avanzado de OpenAI, O1, los resultados son sorprendentes, con una igualdad casi total, como se puede ver en el siguiente gráfico:

¿De qué manera DeepSeek ha logrado superar las restricciones de hardware?
La clave está en las innovaciones radicales en sus algoritmos, que han permitido optimizar al máximo los chips disponibles.
Una de las técnicas más destacadas es la destilación, donde un modelo “aprendiz” interactúa con un modelo más avanzado, intercambiando millones de preguntas hasta que el modelo joven “destila” todo el conocimiento del mayor.
Por supuesto, OpenAI no ha tardado en reaccionar, acusando a DeepSeek de usar ChatGPT O1 en su entrenamiento, respaldado por supuestas evidencias.
Pero DeepSeek no se detuvo ahí. Para lograr que DeepSeek-R1 pueda reflexionar y generar respuestas mucho más precisas, también implementó el Reinforcement Learning, una técnica que permite al modelo “pensar” por sí mismo.
Además, para mejorar aún más la eficiencia, han simplificado el proceso de inferencia—el momento en que hacemos una consulta a la IA. Gracias a nuevas técnicas de compresión, DeepSeek ha logrado hacer este proceso más rápido y eficiente. ¡Todo un avance!

¿Quién está detrás de DeepSeek?
DeepSeek forma parte de un proyecto más grande, High-Flyer, una organización que maneja fondos de inversión cuánticos y gestiona alrededor de 8.000 millones de dólares en activos, según The Wall Street Journal.
Desde hace años, esta firma ha integrado la IA en sus decisiones de inversión, una estrategia que ha sido clave para su éxito.
Liang Wenfeng, el fundador de DeepSeek, es un ingeniero y matemático que ha combinado su pasión por las inversiones con su conocimiento técnico. Nació en 1985 en Sanyang, una ciudad costera del sur de China con una larga historia de comercio internacional.
Destacó académicamente desde joven y se graduó en la Universidad de Shenyang. Durante su etapa universitaria, comenzó a desarrollar algoritmos de IA para la selección de acciones.
En 2015, fundó High-Flyer junto a dos compañeros de universidad y, en ese momento, adquirió sus primeros chips de NVIDIA.
Con el crecimiento de la empresa, High-Flyer empezó a contratar a estudiantes de posgrado en IA de diversas universidades chinas para trabajar en la creación de un modelo de inteligencia artificial de alto nivel, mucho más avanzado que los modelos actuales.
En 2024, compartió con la publicación china 36Kr: “Para los tecnólogos, el hecho de que otros sigan tu trabajo es una gran sensación de logro. El código abierto es más una cultura que una estrategia comercial, y contribuir a él nos brinda respeto”.
A finales de 2022, cuando OpenAI lanzó su primer modelo de ChatGPT, solo unas pocas empresas chinas disponían de más de 10.000 chips de alta gama de NVIDIA.

¿Qué restricciones aplica Estados Unidos a China en la "guerra fría de la IA"?
Estados Unidos ha impuesto estrictas restricciones a China en lo que se ha denominado la “guerra fría de la IA”, lo que ha dejado a China muy rezagada en términos de plazos y avances.
Estas restricciones han colocado a las empresas chinas por debajo de sus contrapartes estadounidenses en cuanto a equipamiento tecnológico.
La falta de acceso a la última tecnología disponible en EE.UU. significaba que China tardaría más en ponerse al nivel de gigantes de la IA como ChatGPT (OpenAI), Llama (Meta) o xAI de Elon Musk.
Desde el punto de vista de EE.UU., los chips avanzados de NVIDIA se consideran un recurso estratégico en el marco de la guerra fría con China, abarcando no solo áreas de tecnología, sino también comercio y armamento.
La falta de acceso a la última tecnología disponible en EE.UU. significaba que China tardaría más en ponerse al nivel de gigantes de la IA como ChatGPT (OpenAI), Llama (Meta) o xAI de Elon Musk.
Desde el punto de vista de EE.UU., los chips avanzados de NVIDIA se consideran un recurso estratégico en el marco de la guerra fría con China, abarcando no solo áreas de tecnología, sino también comercio y armamento.

Según Entrala, se espera que cuando la IA se aplique al armamento militar, será un factor decisivo, y hasta la aparición de DeepSeek, parecía que Estados Unidos tenía una ventaja de al menos 5 años en este campo.
Las restricciones impuestas por la administración de Joe Biden pusieron los chips de NVIDIA bajo control de exportación hacia China.
Como resultado, NVIDIA comenzó a fabricar chips exclusivos para el mercado chino, como los H800, que son el equivalente a los H100, los chips más utilizados en los data centers de IA de EE. UU.
Sin embargo, los chips H800 tienen limitaciones significativas en cuanto a la cantidad de datos que pueden manejar y su velocidad de transferencia. Son mucho menos potentes que los chips más avanzados de NVIDIA, pero también son bastante caros. Un solo chip H800 ha llegado a cotizarse en el mercado chino por más de $70,000.
Para dar una idea del esfuerzo de DeepSeek, en la documentación del modelo V3, la empresa china señala que utilizó un clúster de 2.048 chips H800 de NVIDIA interconectados.
Esto representa solo un 3% del costo que tuvo OpenAI para entrenar su modelo O1, y está muy lejos de los mil millones de dólares que Elon Musk gastó en su data center Colossus, o los 500 mil millones de dólares que se estima costará el proyecto Stargate anunciado por Trump.