DeepSeek tiêu tốn 1,6 tỷ USD cho mô hình AI, không phải 6 triệu USD

DeepSeek, một công ty khởi nghiệp nổi bật từ Trung Quốc, đang thu hút sự chú ý lớn trong cộng đồng công nghệ với thông tin liên quan đến chi phí phát triển mô hình trí tuệ nhân tạo (AI) của họ. Trước đây, DeepSeek đã tuyên bố rằng việc đào tạo mô hình R1 của họ chỉ tiêu tốn 6 triệu USD, một con số thu hút và gây ngạc nhiên cho nhiều nhà đầu tư. Tuy nhiên, một báo cáo mới từ SemiAnalysis đã làm sáng tỏ vấn đề này, chỉ ra rằng trên thực tế, chi phí thực tế mà công ty đã bỏ ra lên đến 1,6 tỷ USD.

Điều này dấy lên nhiều câu hỏi về sự minh bạch trong hoạt động của DeepSeek. Theo báo cáo, công ty này không chỉ sử dụng 2.048 GPU cho việc đào tạo mà còn đầu tư hơn 50.000 GPU NVIDIA Hopper, để thực sự phát triển một mô hình AI mạnh mẽ. Phí vận hành lên tới 944 triệu USD cũng được thông báo trong bối cảnh mở rộng hoạt động.

Chính sự thay đổi lớn này trong thông tin đã đánh động toàn bộ ngành công nghiệp AI, đặt ra nhiều câu hỏi về cách mà các công ty khác trong lĩnh vực này sẽ định hướng tương lai. Thực tế là, sau khi thông tin này được công bố, cổ phiếu của NVIDIA đã giảm xuống 600 tỷ USD trong một ngày, cho thấy sức ảnh hưởng lớn của DeepSeek trong ngành.

Các nhà lãnh đạo trong ngành công nghệ như CEO Microsoft Satya Nadella đã chia sẻ rằng DeepSeek đang có những cải tiến đáng chú ý và kêu gọi các nhà đầu tư nên nghiêm túc xem xét những tiến bộ từ Trung Quốc trong bối cảnh cạnh tranh ngày càng tăng. Nadella nhấn mạnh rằng những đổi mới của DeepSeek có thể mang lại lợi ích cho thị trường và tạo nhiều cơ hội hơn cho các ứng dụng mới.

Thêm vào đó, Yann LeCun, nhà khoa học hàng đầu về AI tại Meta, đã chỉ ra rằng việc đầu tư hàng tỷ USD vào mô hình AI không phải chỉ là để phát triển mà còn để xử lý và chạy các ứng dụng. LeCun lo ngại rằng có một sự hiểu lầm nghiêm trọng trong việc nguồn lực được sử dụng trong ngành AI.

DeepSeek đã thực hiện chiến lược tự tài trợ và phát triển nhanh chóng mà không cần sự can thiệp từ bên ngoài. Công ty này tập trung vào việc tối ưu hóa quy trình và nâng cao hiệu suất mô hình thay vì chỉ đơn thuần mở rộng quy mô. “Chúng tôi lắng nghe các tài năng và vụn vặt, hiểu biết để đào tạo lại những bộ phận cần thiết,” một giám đốc của DeepSeek cho biết.

Một điều thú vị nữa là công ty đã tạo ra nhiều vị trí việc làm với mức đãi ngộ hấp dẫn, với một số nhà nghiên cứu AI tại đây nhận về tới 1,3 triệu USD mỗi năm. Công ty chỉ tuyển dụng nhân viên từ các cơ sở đại học danh tiếng ở Trung Quốc, cho thấy chiến lược tuyển dụng rất tỉ mỉ và có kế hoạch rõ ràng.

Tuy nhiên, không phải mọi thông tin đều tích cực cho DeepSeek. Họ cũng phải đối mặt với sự cạnh tranh khốc liệt từ các công ty hàng đầu khác như OpenAI, công ty này đang phải đối diện với áp lực gia tăng từ các nhà đầu tư để chuyển đổi thành một thực thể kiếm tiền hoặc đối mặt với những mối nguy không mong muốn từ những yêu cầu đền bù đối với các khoản đầu tư trước đây. Mặc dù nhiều công ty lớn đang đổ xô vào lĩnh vực AI, với những thay đổi nhanh chóng này, DeepSeek có thể sẽ tạo ra những cơn địa chấn tiếp theo trong tương lai không xa.