Hogar > Noticias > La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse
El modelo de IA sorprendentemente rentable de Deepseek desafía a los gigantes de la industria. El autodenominado chatbot de la compañía cuenta con capacidades impresionantes, lo que contribuye a una caída significativa en el precio de las acciones de Nvidia. Su éxito proviene de una combinación única de tecnologías innovadoras y una inversión sustancial, que contradicen las afirmaciones iniciales de costos de capacitación mínimos.
Imagen: Ensigame.com
Deepseek V3 aprovecha varias técnicas de vanguardia: Predicción de token múltiple (MTP) para mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales para capacitación acelerada y rendimiento mejorado; y Atención latente de múltiples cabezas (MLA) para garantizar que los detalles cruciales no se pasen por alto.
Imagen: Ensigame.com
Si bien inicialmente reclamó solo un mero costo de capacitación de $ 6 millones, Semianalysis reveló el uso de Deepseek de aproximadamente 50,000 GPU NVIDIA, que representa una inversión de servidor de ~ $ 1.6 mil millones y ~ $ 944 millones en gastos operativos. Esta infraestructura sustancial, propiedad directa en lugar de arrendada, permite una rápida innovación y optimización. La estructura de autofinanciación y delgada de la compañía contribuye aún más a su agilidad.
Imagen: Ensigame.com
Los altos salarios de Deepseek (más de $ 1.3 millones anuales para algunos investigadores) atraen al máximo talento chino, aunque la compañía no emplea especialistas en el extranjero. La cifra de $ 6 millones solo refleja los costos de GPU previa al entrenamiento, omitiendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión general de desarrollo de IA supera los $ 500 millones.
Imagen: Ensigame.com
El éxito de Deepseek muestra el potencial de las compañías de IA independientes bien financiadas. Sin embargo, su narrativa "económica" es engañosa; Miles de millones en inversiones, avances tecnológicos y un equipo experto son los verdaderos impulsores de sus logros. Aun así, sus costos siguen siendo significativamente más bajos que los competidores, como los $ 100 millones gastados en ChatGPT4O en comparación con los $ 5 millones de Deepseek para R1.