DeepSeek, China y la IA: un desafío geopolítico
febrero 2025
El salto chino en el terreno de la inteligencia artificial produjo un fuerte terremoto en su competencia con Estados Unidos, pero también brinda claves para pensar en modelos de soberanía tecnológica, e incluso IA pública, en el resto del mundo.

600.000 millones de dólares (casi un PIB de Argentina o casi dos veces el de Chile): eso cayó la valoración en bolsa de la gigante Nvidia el 26 de enero pasado. Durante el fin de semana anterior, la aplicación de inteligencia artificial (IA) de la start-up china DeepSeek se convertía en la aplicación gratuita más descargada de Estados Unidos. La capitalización bursátil de Nvidia no fue la única que cayó en picada ese lunes como producto de la novedad china. Todas las gigantes de tecnología de Estados Unidos sufrieron desplomes impactantes, si bien significativamente menos estrepitosos, lo que arrojó un total de pérdida de un billón de dólares en un día.
Esta sobrerreacción bursátil -corregida parcialmente con el correr de los días- no se explica porque el modelo R1 de DeepSeek sea mejor que los existentes. De hecho, R1 no tiene diferencias significativas con otros modelos de IA generativa de frontera, en particular con ChatGPT. Pero que un modelo chino sea considerado tan bueno como ChatGPT y los demás modelos de firmas estadounidenses es, sin dudas, una novedad. Es también una razón geopolítica suficiente para sacudir el valor en bolsa de las empresas más grandes de Estados Unidos -que son también las más grandes del mundo-.
El hecho de que DeepSeek sea china es solo una parte de la explicación. El motivo central por el cual, además de la bolsa, temblaron Donald Trump y todo el modelo global de desarrollo de IA generativa liderado por Estados Unidos es que el DeepSeek-R1 fue mucho más barato de producir y, como si fuera poco, está parcialmente disponible en acceso abierto para que otros lo descarguen y usen para desarrollar sus propias aplicaciones. Se ofrece, además, a un costo menor que el que cobra Meta por su modelo Llama -también en acceso semiabierto- cuando es adquirido en las nubes de las otras gigantes de tecnología.
IA low-cost
DeepSeek-R1 es más barato por donde se lo mire. Es el primer modelo de frontera que requirió para su entrenamiento una fracción de la capacidad de cómputo -y por lo tanto del costo- utilizado por los demás modelos de punta. Ello es así porque la start-up china usó una técnica de aprendizaje para modelos de IA que se llama destilación. En este contexto, «destilar» significa extraer de forma automatizada el aprendizaje de modelos ya existentes. Partiendo de esa base, el entrenamiento que queda por hacer es más corto y cada ronda de entrenamiento requiere menos inversión porque no se parte de cero, sino de procesos de aprendizaje ya realizados por otras empresas.
La novedad no es el método en sí mismo, porque la técnica ya se usaba antes, pero los resultados, hasta ahora, eran modelos de menor escala que no resultaban tan buenos como los originales. DeepSeek es más pequeño en cantidad de parámetros (por eso también es más económico cuando se lo utiliza) y, al mismo tiempo, compite en primera división.
Si bien no podemos establecer una comparación directa con el costo de entrenar modelos como GPT de OpenAI o Llama de Meta, porque para ello deberíamos conocer el costo total de producción de DeepSeek-R1 y esa información se mantiene en secreto, es claro que DeepSeek produce AI low-cost, dado que la última ronda de entrenamiento requirió solo 5,6 millones de dólares. Es aquí donde la start-up china toca la fibra más íntima del paradigma de desarrollo de IA generativa que impusieron las gigantes de tecnología estadounidenses.
¿Quién pierde y quién -siempre- gana?
Descubrir que es posible desarrollar modelos de punta sin concentrar cantidades descomunales de chips de IA de última generación para su entrenamiento, con cantidades igualmente descomunales de datos, pone en jaque el negocio de Nvidia, una empresa casi totalmente dedicada a diseñar estos chips. De allí la caída de su capitalización bursátil.
La pérdida del valor en bolsa de Amazon, Microsoft y Google, en cambio, no marca el fin de su reinado. Muy por el contrario, su negocio no es principalmente vender modelos de IA -aunque también los desarrollen y vendan- sino controlar la nube, es decir, el supermercado donde estos modelos y otras tecnologías se desarrollan, usan y comercializan. Estas empresas se benefician con la sostenida expansión de la adopción de IA, que se vuelve a acelerar con la llegada de DeepSeek.
La nube es una suerte de espacio de coworking o fábrica virtual para producir y consumir servicios digitales que se usan subiendo datos propios. En un contexto de desconfianza hacia China, es poco probable que empresas y Estados del mundo adopten DeepSeek para analizar sus datos. El mercado de usuarios que lo usan de manera gratuita, incluidos miles de desarrolladores en busca de mejorar su código o crear aplicaciones, no es el mismo que el que usa IA en la nube como un servicio customizado para las necesidades de empresas y Estados.
En este escenario, se exacerba la dependencia de las start-ups de IA de Occidente, desde las estadounidenses OpenAI o Anthropic hasta la francesa Mistral. Si antes para estas empresas resultaba poco probable operar por fuera de la nube de Amazon, Microsoft o Google, hoy ya es imposible. Estas gigantes no solo son las principales inversoras de capital de riesgo de las start-ups de IA generativa de Occidente, sino que además en sus nubes se concentra cada vez más demanda de quienes pagan por la IA. Las empresas, gobiernos, universidades, etc. ven en la nube un único ámbito desde el cual satisfacer todas sus necesidades de servicios digitales.
Para OpenAI y las demás, no parece tener sentido salir de ese ecosistema de servicios. De hecho, es la integración perfecta con este ecosistema la principal diferencia con DeepSeek. Ser parte de la nube hace que los servicios que ofrece una start-up encastren a la perfección con todos los demás servicios que un usuario de la nube ya consume. Esa compatibilidad es resultado del control que ejercen Amazon, Microsoft y Google sobre todas las start-ups de sus ecosistemas, que las fuerza a pagar una suerte de impuesto privado para poder ofrecer servicios en sus nubes. Hoy más que nunca, desarrollar modelos sin el amparo de las gigantes tecnológicas -sobre todo si ello implica seguir usando las técnicas de desarrollo que parten de cero y por lo tanto son más costosas que DeepSeek- no es negocio.
El tablero geopolítico digital
En este marco, OpenAI acusa a la start-up china de haber usado sus modelos -protegidos por las normas de propiedad intelectual- para destilar aprendizajes para poner en marcha DeepSeek-R1. Aunque ladrón que roba a ladrón tiene 100 años de perdón -no olvidemos que OpenAI usó millones de documentos protegidos por copyright para entrenar a sus modelos de lenguaje-, lejos estará Trump de perdonarle la vida a DeepSeek. De hecho, una constante desde el gobierno de Barack Obama es que, a medida que la ventaja de Estados Unidos frente a China se reduce, se profundiza la presión estadounidense sobre el resto del mundo para bloquear al competidor asiático.
Estados Unidos buscó impedir el desarrollo tecnológico de China en IA con el pretexto de que podían utilizar sus avances en el terreno militar, prohibiendo a las empresas estadounidenses y a aquellas que quisieran hacer negocios con Estados Unidos que vendieran piezas claves de la cadena de valor de los semiconductores -incluidos los chips mismos- a China. Pero antes de que la política entrara en efecto y viendo el crecimiento de las tensiones geopolíticas entre ambos países, China acumuló un gran stock de semiconductores de IA. Y lo mismo hizo el fondo de inversión que financia a DeepSeek. Aunque la cantidad de chips no era suficiente para seguir el paradigma vigente y esos ya no son los semiconductores más avanzados del mercado, la start-up encontró una manera de alcanzar resultados con los semiconductores que tenía disponibles.
Una pregunta abierta es, entonces, cómo va a responder Estados Unidos. Un escenario probable es que endurezca las presiones frente a la adopción de tecnología china en el mundo y que DeepSeek corra la misma suerte que Huawei con el 5G. Esta firma fue la primera en desarrollar la tecnología, pero Washington bloqueó uno a uno sus negocios en Occidente, lo que dio tiempo a sus rivales para imitar la tecnología y limitar el crecimiento de mercado de la gigante de telefonía china.
Soberanía digital
Pase lo que pase en la disputa entre las dos potencias globales, la emergencia de DeepSeek-R1 abre una ventana de oportunidad para desarrollar IA pública en el resto del mundo no alineado con los modelos dominantes de control y concentración imperantes. La posibilidad de desarrollar modelos de punta más baratos es una oportunidad para trabajar internacionalmente por un proyecto de desarrollo tecnológico que ponga al frente las necesidades sociales y las limitaciones planetarias. La centralidad de estas tecnologías en todos los ámbitos de la vida clama por una solución pública, común y que sea la que utilicen, por ejemplo, las escuelas, hospitales y demás dependencias públicas.
Desarrollar modelos de IA públicos favorece también su auditoría democrática. La IA hoy dominante se desarrolla priorizando el rédito económico. Sin un redireccionamiento que permita crear modelos públicos, abiertos y auditables, se corre el riesgo de que siga primando un desarrollo tecnológico que favorece aplicaciones que van desde el uso militar o para control y vigilancia dentro y fuera del lugar de trabajo, hasta la IA que reemplaza tareas creativas en lugar de hacer más estimulante el espacio de trabajo.
Diariamente somos testigos de los efectos de haber perdido los espacios de deliberación pública en internet. Las redes sociales se manejan con algoritmos de IA que ordenan qué mensajes se muestran, dónde y cuándo, y cuáles no se muestran. Desde allí, un puñado de empresas influyen en la opinión pública (y el sentido común). Adoptando las técnicas usadas por DeepSeek, es económicamente posible desarrollar IA pública, abierta y auditable para el Estado, la salud y educación.