DeepSeek ra mắt mô hình AI mã nguồn mở thách thức các ông lớn công nghệ

Đăng bởi: Linh Nguyễn • Ngày: 25/01/2025

Ngày 20 tháng 1, DeepSeek, một phòng nghiên cứu AI ít được biết đến của Trung Quốc, đã cho ra mắt một mô hình mã nguồn mở mà ngay lập tức thu hút sự chú ý của giới công nghệ tại Silicon Valley. Theo báo cáo từ công ty, mô hình DeepSeek-R1 đã vượt qua nhiều mô hình hàng đầu trong ngành như OpenAI o1 về nhiều tiêu chí đo lường khả năng, chi phí và tính minh bạch. Thực tế, trên nhiều mặt quan trọng, DeepSeek đang tạo ra sức cạnh tranh mạnh mẽ với các gã khổng lồ AI phương Tây.

Thành công của DeepSeek cho thấy một hệ quả không mong muốn của cuộc chiến công nghệ lạnh giữa Mỹ và Trung Quốc. Các quy định xuất khẩu của Mỹ đã làm giảm nghiêm trọng khả năng cạnh tranh của các công ty công nghệ Trung Quốc về AI theo cách truyền thống. Thay vì mở rộng quy mô vô tận bằng cách mua thêm chip và đào tạo trong thời gian dài, hầu hết các doanh nghiệp Trung Quốc đã chuyển sang tập trung vào các ứng dụng hạ nguồn. Nhưng với sự phát hành mới nhất này, DeepSeek chứng minh rằng có cách để chiến thắng khác: bằng cách cải cách cấu trúc nền tảng của các mô hình AI và sử dụng nguồn lực hạn chế một cách hiệu quả hơn.

Marina Zhang, một trợ lý giáo sư tại Đại học Công nghệ Sydney, nhận định rằng: “Khác với nhiều hãng AI Trung Quốc phụ thuộc vào phần cứng tiên tiến, DeepSeek tập trung vào việc tối ưu hóa tài nguyên thông qua phần mềm.” Đề cập đến việc DeepSeek áp dụng phương pháp mã nguồn mở, Zhang cho biết điều này không chỉ giảm bớt rào cản tài nguyên mà còn thúc đẩy sự phát triển công nghệ hiện đại, khiến DeepSeek nổi bật hơn so với các đối thủ ít hòa nhập hơn.

DeepSeek được thành lập từ Fire-Flyer, một nhánh nghiên cứu học sâu của High-Flyer, quỹ đầu cơ định lượng hàng đầu ở Trung Quốc. Kể từ khi thành lập vào năm 2015, quỹ này đã nhanh chóng vươn lên trở thành một trong những quỹ đầu cơ định lượng đầu tiên huy động được hơn 100 tỷ RMB. Trước đó, High-Flyer đã tích trữ GPU và xây dựng các siêu máy tính Fire-Flyer để phân tích dữ liệu tài chính. Vào năm 2023, Liang Wenfeng, người sáng lập DeepSeek, đã quyết định đầu tư vào việc phát triển các mô hình AI tiên tiến.

Liang nhấn mạnh rằng quyết định thành lập DeepSeek được thúc đẩy bởi sự tò mò khoa học, không phải vì mục tiêu lợi nhuận. Ông chia sẻ rằng nghiên cứu khoa học cơ bản có tỷ lệ lợi tức đầu tư rất thấp, và các nhà đầu tư sớm của OpenAI cũng không mong đợi sự hoàn vốn cao. Họ thực sự muốn đóng góp cho sự phát triển chung của ngành.

Đặc biệt, DeepSeek là một trong số ít hãng AI hàng đầu tại Trung Quốc không phụ thuộc vào nguồn vốn từ các ông lớn công nghệ như Baidu, Alibaba hay ByteDance. Liang cho biết ông đã xây dựng được một đội nghiên cứu gồm những sinh viên tiến sĩ từ các trường đại học hàng đầu tại Trung Quốc, những người đầy động lực và khát khao thể hiện bản thân. Đội ngũ này chủ yếu là những người mới tốt nghiệp, tạo nên một văn hóa công ty cộng tác, nơi mọi người tự do sử dụng tài nguyên tính toán để theo đuổi các dự án nghiên cứu độc đáo.

Đội ngũ nghiên cứu trẻ tuổi này cũng thể hiện tinh thần yêu nước mạnh mẽ, đặc biệt trong bối cảnh các hạn chế từ Mỹ đối với nguồn công nghệ thiết yếu. Chính quyền Mỹ đã khởi động các kiểm soát xuất khẩu hạn chế khả năng tiếp cận chip tiên tiến cho các công ty AI Trung Quốc. DeepSeek hiện đang tìm kiếm các biện pháp innovatives hơn để huấn luyện mô hình của mình, tối ưu hóa kiến trúc mô hình và sử dụng các kỹ thuật kỹ thuật mới để tiết kiệm năng lượng tính toán cần thiết.

Mô hình DeepSeek hiện tại đã cho thấy sự hiệu quả vượt trội, yêu cầu chỉ một phần mười sức mạnh tính toán so với mô hình Llama 3.1 cạnh tranh của Meta. Sự sẵn sàng chia sẻ những đổi mới này với công cộng đã mang lại cho DeepSeek nhiều thiện cảm trong cộng đồng nghiên cứu AI toàn cầu. Đây có thể là một tin không tốt cho các quy định xuất khẩu hiện tại của Mỹ, khi mà các dự đoán về sức mạnh tính toán của Trung Quốc có thể bị đảo lộn. Với những kết quả này, DeepSeek không chỉ mở đường cho sự phát triển AI tại Trung Quốc, mà còn gây sức ép lên các công ty công nghệ hàng đầu của phương Tây.