Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, podem ter sido treinados usando dados do OpenAI. Essa revelação, após a grande queda de ações da Nvidia, enviou ondas de choque pela indústria da IA.
Donald Trump chamou Deepseek de "chamada de despertar" para o setor de tecnologia dos EUA. A liberação da Deepseek desencadeou um declínio acentuado em ações relacionadas à IA, com a Nvidia experimentando sua maior perda de um dia (16,86%). Microsoft, Meta, Alphabet e Dell também sofreram quedas significativas.
A DeepSeek possui seu modelo R1 como uma alternativa econômica ao ChatGPT, treinada usando o Deepseek-V3 de código aberto por cerca de US $ 6 milhões. Embora essa reclamação seja debatida, levantou preocupações sobre os bilhões investidos pelas empresas de tecnologia americanas na IA, impactando a confiança dos investidores. O aplicativo da Deepseek também aumentou em popularidade nos EUA.
O OpenAI e a Microsoft estão investigando se o Deepseek violou os Termos de Serviço da OpenAI usando sua API para destilação do modelo - uma técnica para treinar modelos de IA usando dados de maiores. A Openai confirmou sua conscientização sobre tais tentativas de chineses e outras empresas e enfatizou seus esforços para proteger sua propriedade intelectual (PI) e colaborar com o governo dos EUA.
David Sacks, consultor de IA do presidente Trump, afirmou que há evidências substanciais do uso de modelos OpenAI pela Deepseek, prevendo contramedidas das principais empresas de IA.
A situação destaca a ironia das acusações do OpenAI, dadas as controvérsias anteriores em torno de seu próprio uso de dados da Internet protegidos por direitos autorais para o ChatGPT. Ed Zitron apontou adequadamente essa hipocrisia no Twitter. O Openai argumentou anteriormente que a criação de ferramentas de IA como o ChatGPT sem material protegido por direitos autorais é impossível, uma posição reiterada em uma submissão à Câmara dos Lordes do Reino Unido. Esse argumento é ainda mais complicado por processos em andamento, incluindo um do New York Times, alegando uso ilegal de seu trabalho, e outro de 17 autores reivindicando "roubo sistemático". O cenário legal em torno dos dados de treinamento da IA e direitos autorais permanece altamente contestado, particularmente à luz de um escritório de direitos autorais dos EUA em 2018, decidindo que a arte gerada pela IA não é de direitos autorais.