La irrupción de DeepSeek, una startup china enfocada en la inteligencia artificial (IA), ha causado un gran impacto en el sector tecnológico. Sus productos han sorprendido tanto que, en pocas horas, provocaron caídas significativas en las acciones de Nvidia, Microsoft y otras grandes empresas del sector.
¿Qué es DeepSeek y por qué es tan relevante?
DeepSeek es el nombre de la startup y también de su chatbot, posicionado como una alternativa directa a ChatGPT de OpenAI, Gemini de Google y Copilot de Microsoft. Su propuesta destaca por su rendimiento superior y acceso abierto, lo que ha generado un debate sobre el futuro de los modelos cerrados de IA.
Los modelos de DeepSeek: R1 y V3
DeepSeek ha lanzado dos modelos principales:
DeepSeek-R1: Un modelo de código abierto, accesible para investigadores y desarrolladores.
DeepSeek V3: Un modelo avanzado con capacidades comparables a ChatGPT-4, pero desarrollado con una inversión significativamente menor.
Según Wired, DeepSeek ha demostrado un 97 % de precisión en pruebas matemáticas y de programación, superando al 96 % de los humanos evaluados en los mismos tests.
El impacto de su enfoque de código abierto
Uno de los aspectos más llamativos de DeepSeek-R1 es su naturaleza open-weight. Aunque no se considera 100 % de código abierto, ya que sus datos de entrenamiento no están disponibles, su código puede descargarse y modificarse desde GitHub para diversos fines, incluyendo aplicaciones comerciales.
Éxito en descargas y uso
El chatbot de DeepSeek ha alcanzado el primer puesto en descargas gratuitas en la App Store en China y Estados Unidos, superando incluso a ChatGPT. Además, es completamente gratuito, sin necesidad de suscripciones para obtener mejores respuestas. Aunque puede tardar un poco más en procesar consultas, sus respuestas suelen ser más precisas y directas.
DeepSeek frente a OpenAI y Meta
Uno de los puntos que ha generado controversia es el costo de entrenamiento de DeepSeek V3. Utilizando chips Nvidia H800, la startup logró desarrollar su modelo con menos de 6 millones de dólares, en contraste con los 80 millones de dólares invertidos en ChatGPT-4 de OpenAI o los 60 millones de dólares gastados en Llama 3.1 de Meta. Este enfoque demuestra que es posible desarrollar modelos de IA eficientes con menos recursos, poniendo en jaque la estrategia de los gigantes tecnológicos.
Reacciones en Wall Street
El impacto de DeepSeek no se limitó al ámbito técnico. Las acciones de Nvidia, Microsoft y ASML sufrieron una caída significativa en Wall Street tras el lanzamiento de los modelos chinos, ya que su enfoque desafía la creencia de que se requieren grandes inversiones en hardware para obtener buenos resultados en IA.
Un cambio de paradigma en la inteligencia artificial
La llegada de DeepSeek plantea una pregunta clave: és necesario seguir apostando por modelos cerrados y costosos, o es mejor adoptar un enfoque más abierto y accesible? Esta startup ha demostrado que la innovación en IA no está necesariamente ligada a grandes presupuestos, sino a la optimización de recursos.
Preguntas frecuentes
¿DeepSeek es completamente de código abierto?
No del todo. Aunque su modelo DeepSeek-R1 es open-weight y su código puede descargarse y modificarse, los datos de entrenamiento no están disponibles públicamente.
És DeepSeek mejor que ChatGPT?
Depende del uso. DeepSeek es más directo y preciso en ciertas tareas, especialmente en matemáticas y programación, pero su velocidad de respuesta es menor que la de ChatGPT. Además, su acceso gratuito y abierto lo convierte en una opción atractiva para muchos usuarios.
Encuentra las mejores ofertas en productos tecnológicos en nuestro canal de Telegram: https://t.me/laitadigitalofertas.