OpenAI tiết lộ thêm về quy trình suy nghĩ của mô hình o3-mini

Đăng bởi: Linh Nguyễn • Ngày: 07/02/2025

Gần đây, OpenAI đã có động thái bổ sung thêm thông tin về quy trình suy nghĩ của mô hình AI mới nhất của mình mang tên o3-mini. Hãng đã công bố sự thay đổi này sau khi đối thủ cạnh tranh đáng gờm là DeepSeek, một công ty AI đến từ Trung Quốc, đã áp dụng phương pháp tương tự để đưa ra những giải pháp khác biệt trong lĩnh vực này. Giai đoạn cập nhật này sẽ được triển khai cho cả người dùng miễn phí và người dùng trả phí của ChatGPT, nền tảng chatbot được tích hợp AI của OpenAI. Theo đó, người dùng giờ đây sẽ được tiếp cận với một “chuỗi suy nghĩ” được cập nhật, cho phép họ thấy rõ hơn các bước “lý luận” của mô hình, đồng thời có thể hiểu rõ cách mà nó đã đến được các câu trả lời cho những câu hỏi đặt ra.

Một phát ngôn viên của OpenAI đã giải thích: “Chúng tôi đang giới thiệu một chuỗi suy nghĩ [Chain of Thought] được cập nhật cho o3-mini nhằm giúp người dùng dễ dàng theo dõi cách mà mô hình suy nghĩ. Với bản cập nhật này, bạn sẽ có thể theo dõi lý luận của mô hình, mang đến cho bạn nhiều sự rõ ràng và sự tự tin hơn trong các phản hồi của nó.

Điểm đặc biệt của các mô hình lý luận như o3-mini là khả năng tự kiểm tra thông tin một cách kỹ lưỡng trước khi đưa ra bất kỳ kết quả nào. Điều này không chỉ giúp mô hình tránh được một số cạm bẫy thường được gặp phải, mà còn mang lại trải nghiệm người dùng tốt hơn trong nhiều tình huống, khi mà mô hình có thể chỉ ra lúc nào nó đang đi đúng đường hoặc đang lệch hướng. Đương nhiên, có một cái giá phải trả, đó là những mô hình như vậy thường mất nhiều thời gian hơn để đưa ra giải pháp, thường kéo dài từ vài giây đến vài phút.

DeepSeek, với mô hình R1 tương tự như o3-mini, có khả năng tiết lộ toàn bộ quy trình suy nghĩ của mình. Điều này đã được nhiều nhà nghiên cứu AI cho rằng là một cách tiếp cận được ưu tiên hơn, không chỉ vì nó giúp mô hình dễ nghiên cứu hơn mà còn vì những bước lý luận được đưa ra sẽ cải thiện trải nghiệm người dùng trong vài trường hợp nhất định.

Trước đây, OpenAI đã không tiết lộ các bước lý luận đầy đủ cho o3-mini cùng với các phiên bản tiền nhiệm của nó, là o1 và o1-mini, chủ yếu vì lý do cạnh tranh. Người dùng trước đây chỉ thấy tóm tắt ngắn gọn các bước lý luận, đôi khi dẫn đến thông tin sai lệch. Giờ đây, trong việc giới thiệu phiên bản mới nhất này, OpenAI đã tìm ra được “cân bằng”: o3-mini có thể “suy nghĩ một cách tự do” và sau đó tổ chức lại “những suy nghĩ” của nó thành các tóm tắt chi tiết hơn.

Bên cạnh đó, hãng cũng bổ sung một bước xử lý sau, nơi mô hình sẽ kiểm tra lại chuỗi suy nghĩ thô ràng sau đó loại bỏ những nội dung không an toàn và đơn giản hóa những ý tưởng phức tạp. Điều này cũng giúp người dùng không phải nói tiếng Anh nhận được chuỗi suy nghĩ bằng ngôn ngữ mẹ đẻ của họ, mang lại trải nghiệm thân thiện và dễ tiếp cận hơn.

Bất chấp những cải tiến này, OpenAI vẫn chưa công khai toàn bộ bước suy luận của o3-mini, nhưng họ cam kết sẽ tìm kiếm cách thức để cung cấp thông tin nhiều hơn cho người dùng mà không làm mất đi lợi thế cạnh tranh của mình. Với những thay đổi này, OpenAI kỳ vọng sẽ cung cấp cho người dùng trải nghiệm tốt hơn, tăng cường sự tin cậy và tính minh bạch của mô hình AI trong tương lai, đồng thời gây sức ép lên các đối thủ trong ngành do những bước tiến vượt bậc mà họ có được.