Qué es DeepSeek, la IA china que provocó sismos en los mercados

Sus innovaciones prometen cambiar las reglas del juego en un sector dominado por gigantes tecnológicos.

28 de Enero de 2025

Qué es DeepSeek, la IA china que provocó sismos en los mercados

Escuchar

DeepSeek, una startup con sede en Hangzhou, China, está redefiniendo el desarrollo y la accesibilidad de la inteligencia artificial (IA) con avances técnicos que desafían a empresas tradicionales como OpenAI y Anthropic. Sus modelos no solo han logrado igualar, e incluso superar, a sistemas existentes, sino que han revolucionado los costos y los métodos de entrenamiento en IA, generando un profundo impacto en mercados tecnológicos y financieros.

El modelo innovador que posiciona a Deepseek como líder emergente
La propuesta de Deepseek se basa en un enfoque innovador y disruptivo. Mientras que entrenar modelos de inteligencia artificial como GPT-4 implica costos superiores a los 100 millones de dólares y el uso de miles de GPU de alta gama, Deepseek logró reducir estos costos drásticamente. Según los propios desarrolladores de la empresa, entrenaron su modelo Deepseek-V3 con solo 6 millones de dólares, utilizando chips H800 de Nvidia. Este hardware, diseñado originalmente como una alternativa limitada por las sanciones estadounidenses contra China, demostró ser suficiente para alcanzar resultados competitivos.

Entre las características más destacadas del modelo de Deepseek se encuentra su capacidad de operar con un sistema de parámetros optimizados. En lugar de activar los 1,8 billones de parámetros tradicionales de un modelo de IA de gran escala, Deepseek utilizó solo 37 mil millones de parámetros activos simultáneamente, dentro de un sistema total de 671 mil millones. Esto equivale a una reducción significativa de los requisitos de memoria y hardware, permitiendo que sus sistemas funcionen con GPU convencionales, como las diseñadas para videojuegos, en lugar de depender exclusivamente de costosos centros de datos.

Además, los desarrolladores implementaron un sistema “multi-token”, que optimiza la forma en que el modelo procesa información. En vez de analizar palabra por palabra, como lo haría un modelo tradicional, el enfoque de Deepseek permite que el sistema procese frases completas. Esta técnica, aunque menos precisa en ciertos contextos, acelera significativamente el análisis de grandes volúmenes de datos y mejora la eficiencia operativa.

Impacto global en el mercado tecnológico y financiero
El lanzamiento del modelo Deepseek R1, que ocurrió el 10 de enero de 2025, generó un fuerte impacto en los mercados tecnológicos. La capacidad de Deepseek para ofrecer una solución de IA de bajo costo encendió alarmas en Silicon Valley y provocó caídas significativas en las acciones de grandes empresas del sector. Según datos recopilados el 27 de enero, los valores de empresas como Nvidia y Oracle sufrieron pérdidas del 10% y 8%, respectivamente, en la jornada bursátil. En Japón, el gigante inversor en startups SoftBank Group reportó una caída superior al 8% tras el anuncio.

El Nasdaq 100, un índice clave de las empresas tecnológicas en Estados Unidos, registró una baja del 4% en los futuros de la jornada, su mayor descenso desde septiembre de 2022, debido a las dudas generadas sobre el modelo de negocio de las grandes corporaciones de inteligencia artificial. Analistas de firmas como Pictet Asset Management señalaron que el costo reducido de los modelos de Deepseek podría forzar a las compañías occidentales a replantear sus niveles de gasto y su enfoque estratégico.

A nivel geopolítico, la aparición de Deepseek en el mercado refleja el avance tecnológico de China en un sector altamente competitivo. Los logros de esta startup han sido comparados con un “momento Sputnik” por figuras de peso en la industria, como Marc Andreessen, un influyente capitalista de riesgo en Silicon Valley. Andreessen señaló que el desarrollo de Deepseek podría marcar un punto de inflexión en el dominio global de la inteligencia artificial, tal como ocurrió con el lanzamiento del satélite soviético Sputnik en la carrera espacial.

Por qué Deepseek sorprende al mundo
El enfoque de Deepseek destaca por su combinación de innovación técnica y accesibilidad. A diferencia de los gigantes tecnológicos, que se apoyan en infraestructuras masivas y presupuestos multimillonarios, esta startup logró optimizar los procesos mediante el rediseño de las arquitecturas de sus modelos. Por ejemplo, su decisión de reducir la precisión numérica de los cálculos, pasando de 32 bits a 8 bits, disminuyó drásticamente el uso de memoria sin comprometer significativamente la calidad de los resultados. Este cambio, que parece simple, tuvo un impacto enorme en la eficiencia.

Otra característica que ha llamado la atención es su enfoque en sistemas especializados. En lugar de depender de un único modelo de inteligencia artificial que abarque todas las funciones, Deepseek diseñó un sistema de “expertos” que se activan solo cuando son necesarios. Esto evita el uso excesivo de recursos y mejora la velocidad de procesamiento. En términos económicos, estas innovaciones permiten que los costos de las API sean un 95% más bajos en comparación con otras soluciones de IA disponibles.

La empresa también ha optado por un modelo de código abierto, lo que significa que cualquier interesado puede acceder a su tecnología y verificar la validez de sus afirmaciones. Este nivel de transparencia, poco habitual en el sector, ha sido bien recibido por la comunidad tecnológica y ha generado un debate sobre el futuro de las grandes corporaciones que controlan los desarrollos de IA más avanzados.

Un desafío para los gigantes de Silicon Valley
El avance de Deepseek plantea un desafío directo a los grandes actores de la industria, especialmente en un momento en el que las expectativas de los inversores sobre los beneficios de la inteligencia artificial han alcanzado máximos históricos. Por ejemplo, Nvidia, que se ha consolidado como un proveedor clave de hardware para entrenamiento de modelos de IA, enfrenta un riesgo significativo si las soluciones de Deepseek reducen la demanda de sus GPU de alta gama.

Los analistas también han advertido que empresas como OpenAI y Anthropic, que dependen de grandes presupuestos y extensas infraestructuras, podrían enfrentar mayores presiones para adoptar métodos más eficientes. Aunque es probable que estas empresas integren rápidamente algunas de las innovaciones de Deepseek, la accesibilidad de las tecnologías abiertas podría dificultarles mantener su ventaja competitiva en el mediano plazo.

En paralelo, el acceso a grandes volúmenes de datos y un entorno regulatorio más permisivo en China han permitido a Deepseek acelerar sus desarrollos de manera más económica. Este contexto destaca las diferencias entre los ecosistemas tecnológicos de China y Estados Unidos, y cómo estas disparidades pueden influir en el liderazgo global en inteligencia artificial.

FUENTE: Infobae

Más de Mundo

Multitudinario adiós al Papa Francisco en la basílica de San Pedro

Las primeras imágenes del papa Francisco en su féretro

Murió el Papa Francisco

El médico del Papa reveló los momentos críticos en su salud

Tras cinco semanas de internación, el Papa Francisco vuelve a casa

Astronautas regresan a la Tierra tras nueve meses en el espacio