DeepSeek công bố mô hình lý luận R1 với khả năng vượt trội hơn OpenAI o1

Đăng bởi: Linh Nguyễn • Ngày: 23/01/2025

Mới đây, phòng thí nghiệm AI của Trung Quốc mang tên DeepSeek đã chính thức cho ra mắt phiên bản mở của mô hình lý luận mang tên DeepSeek-R1, mà họ tuyên bố hoạt động ngang ngửa với OpenAI’s o1 trên một số tiêu chuẩn đánh giá AI. Hệ thống R1 được cung cấp trên nền tảng phát triển AI Hugging Face dưới giấy phép MIT, cho phép sử dụng thương mại mà không có bất kỳ hạn chế nào.

Theo thông tin từ DeepSeek, R1 vượt trội hơn o1 trong các tiêu chuẩn AIME, MATH-500 và SWE-bench Verified. AIME dùng các mô hình khác để đánh giá hiệu suất của một mô hình, MATH-500 là tập hợp các bài toán từ ngữ, còn SWE-bench Verified lại tập trung vào các nhiệm vụ lập trình. Với vai trò là một mô hình lý luận, R1 có khả năng tự kiểm tra và xác thực chính mình, điều này giúp nó tránh được một số cạm bẫy thường gặp mà nhiều mô hình khác phải đối mặt. Tuy nhiên, để đi đến kết quả, các mô hình lý luận thường mất nhiều thời gian hơn – thường là từ vài giây đến một vài phút – so với các mô hình thông thường không có lý luận. Lợi thế của phương pháp này là khả năng đáng tin cậy hơn trong các lĩnh vực như vật lý, khoa học, và toán học.

DeepSeek đã tiết lộ rằng R1 chứa đến 671 tỷ tham số, một con số rất lớn. Các tham số này tương ứng với kỹ năng giải quyết vấn đề của một mô hình, và thường thì những mô hình có số tham số nhiều hơn sẽ hoạt động hiệu quả hơn so với những mô hình có ít tham số hơn. Đúng vậy, 671 tỷ tham số là một con số khổng lồ, nhưng DeepSeek cũng đã phát hành các phiên bản “đã chắt lọc” của R1 với kích thước khác nhau, từ 1.5 tỷ đến 70 tỷ tham số. Phiên bản nhỏ nhất có thể hoạt động trên một chiếc laptop, trong khi phiên bản đầy đủ R1 đòi hỏi phần cứng mạnh mẽ hơn. Tuy nhiên, nó có sẵn thông qua API của DeepSeek với mức giá rẻ hơn từ 90% đến 95% so với OpenAI’s o1.

Dù vậy, R1 cũng có những hạn chế của riêng nó. Là một mô hình đến từ Trung Quốc, nó sẽ phải tuân theo quy định của cơ quan quản lý internet của Trung Quốc để đảm bảo rằng các phản hồi của nó “thể hiện các giá trị xã hội chủ nghĩa cốt lõi”. Chẳng hạn, R1 sẽ không trả lời các câu hỏi liên quan đến sự kiện Thiên An Môn hay tự do độc lập của Đài Loan.

Nhiều hệ thống AI Trung Quốc, bao gồm cả các mô hình lý luận khác, thường từ chối phản hồi về các chủ đề có thể khiến nhà quản lý trong nước không hài lòng, chẳng hạn như suy diễn về chế độ Xi Jinping. Sự ra mắt của R1 diễn ra ngay sau khi chính quyền Biden đề xuất quy định xuất khẩu nghiêm ngặt hơn cho công nghệ AI của các doanh nghiệp Trung Quốc. Các công ty ở Trung Quốc từ trước đến nay đã bị cấm mua các chip AI tiên tiến, nhưng nếu các quy định mới có hiệu lực như dự kiến, các công ty sẽ phải đối mặt với những giới hạn khó khăn hơn về cả công nghệ vi mạch và các mô hình cần thiết để phát triển các hệ thống AI tinh vi.

Trong một tài liệu chính sách được phát hành tuần trước, OpenAI đã kêu gọi chính phủ Hoa Kỳ hỗ trợ phát triển AI trong nước, tránh để các mô hình Trung Quốc vượt qua khả năng của họ. Trong một cuộc phỏng vấn với The Information, Chris Lehane – phó chủ tịch chính sách của OpenAI – đã chỉ ra rằng High Flyer Capital Management, tổ chức mẹ của DeepSeek, là một tổ chức cần theo dõi đặc biệt.

Cho đến nay, ít nhất ba phòng thí nghiệm Trung Quốc – DeepSeek, Alibaba và Kimi (thuộc về unicorn Trung Quốc Moonshot AI) đã công bố các mô hình mà họ khẳng định cạnh tranh với o1. Đáng chú ý, DeepSeek là phòng thí nghiệm đầu tiên thông báo về R1 vào cuối tháng 11. Dean Ball, một nhà nghiên cứu AI tại Đại học George Mason, cho biết xu hướng này chứng tỏ các phòng thí nghiệm AI của Trung Quốc sẽ tiếp tục là “những người theo đuổi nhanh chóng.” “Khả năng ấn tượng của các mô hình đã được chắt lọc từ DeepSeek […] có nghĩa là các mô hình lý luận có khả năng sẽ tiếp tục phát triển rộng rãi và có thể hoạt động trên phần cứng địa phương,” Ball viết, “khá xa khỏi con mắt của bất kỳ chế độ kiểm soát nào.”