Lar > Notícias > A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver
O modelo surpreendentemente econômico de Deepseek desafia os gigantes da indústria. O chatbot auto-descrito da empresa possui recursos impressionantes, contribuindo para uma queda significativa no preço das ações da NVIDIA. Seu sucesso decorre de uma combinação única de tecnologias inovadoras e investimentos substanciais, contradizendo reivindicações iniciais de custos mínimos de treinamento.
imagem: ensigame.com
Deepseek v3 Aproveita várias técnicas de ponta: Previsão com vários toques (MTP) Para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais para treinamento acelerado e desempenho aprimorado; e Atenção latente de várias cabeças (MLA) Para garantir que os detalhes cruciais não sejam esquecidos.
imagem: ensigame.com
Ao reivindicar inicialmente um mero custo de treinamento de US $ 6 milhões, a semiânica revelou o uso de aproximadamente 50.000 GPUs da NVIDIA, representando um investimento em servidor de ~ US $ 1,6 bilhão e ~ US $ 944 milhões em despesas operacionais. Essa infraestrutura substancial, possuía completamente, em vez de alugada, permite inovação e otimização rápidas. A autofinanciamento e a estrutura enxuta da empresa contribuem ainda mais para sua agilidade.
imagem: ensigame.com
Os altos salários da Deepseek (mais de US $ 1,3 milhão anualmente para alguns pesquisadores) atraem os melhores talentos chineses, embora a empresa não empregue especialistas estrangeiros. O número de US $ 6 milhões reflete apenas custos de GPU pré-treinamento, omitindo pesquisas, refinamento, processamento de dados e infraestrutura. No geral, o investimento em desenvolvimento de IA excede US $ 500 milhões.
imagem: ensigame.com
O sucesso da Deepseek mostra o potencial de empresas independentes de IA bem financiadas. No entanto, sua narrativa "orçamentária" é enganosa; Bilhões em investimento, avanços tecnológicos e uma equipe qualificada são os verdadeiros impulsionadores de suas realizações. Mesmo assim, seus custos permanecem significativamente menores que os concorrentes, como os US $ 100 milhões gastos no ChatGPT4O em comparação com os US $ 5 milhões da Deepseek em R1.