Trang chủ > Tin tức > Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển
Mô hình AI hiệu quả đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Chatbot tự mô tả của công ty tự hào có khả năng ấn tượng, góp phần làm giảm đáng kể giá cổ phiếu của NVIDIA. Thành công của nó bắt nguồn từ sự kết hợp độc đáo giữa các công nghệ sáng tạo và đầu tư đáng kể, mâu thuẫn với các tuyên bố ban đầu về chi phí đào tạo tối thiểu.
Hình ảnh: Obligame.com
DeepSeek V3 tận dụng một số kỹ thuật tiên tiến: Dự đoán đa điểm (MTP) để nâng cao độ chính xác và hiệu quả; Hỗn hợp các chuyên gia (MOE) , sử dụng 256 mạng lưới thần kinh để đào tạo tăng tốc và cải thiện hiệu suất; và sự chú ý tiềm ẩn đa đầu (MLA) để đảm bảo các chi tiết quan trọng không bị bỏ qua.
Hình ảnh: Obligame.com
Mặc dù ban đầu tuyên bố chỉ có chi phí đào tạo 6 triệu đô la, Semianysis cho thấy việc sử dụng khoảng 50.000 GPU NVIDIA của Deepseek, đại diện cho khoản đầu tư máy chủ ~ 1,6 tỷ đô la và ~ 944 triệu đô la chi phí hoạt động. Cơ sở hạ tầng đáng kể này, sở hữu hoàn toàn thay vì cho thuê, cho phép đổi mới và tối ưu hóa nhanh chóng. Cấu trúc tự tài trợ và tinh gọn của công ty đóng góp thêm vào sự nhanh nhẹn của nó.
Hình ảnh: Obligame.com
Mức lương cao của Deepseek (hơn 1,3 triệu đô la hàng năm cho một số nhà nghiên cứu) thu hút tài năng hàng đầu của Trung Quốc, mặc dù công ty không sử dụng các chuyên gia nước ngoài. Con số 6 triệu đô la chỉ phản ánh chi phí GPU trước khi đào tạo, bỏ qua nghiên cứu, sàng lọc, xử lý dữ liệu và cơ sở hạ tầng. Nhìn chung, đầu tư phát triển AI vượt quá 500 triệu đô la.
Hình ảnh: Obligame.com
Thành công của Deepseek thể hiện tiềm năng của các công ty AI độc lập được tài trợ tốt. Tuy nhiên, câu chuyện "thân thiện với ngân sách" của nó là sai lệch; Hàng tỷ người đầu tư, tiến bộ công nghệ và một đội ngũ lành nghề là những động lực thực sự của thành tích của nó. Mặc dù vậy, chi phí của nó vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh, chẳng hạn như 100 triệu đô la chi cho TATGPT4O so với 5 triệu đô la của Deepseek cho R1.