Mô hình AI mới của OpenAI o3 đánh dấu bước tiến nhưng đắt đỏ

Tháng trước, một số nhà sáng lập và đầu tư vào AI đã chia sẻ với TechCrunch về “kỷ nguyên thứ hai của các quy tắc mở rộng,” khi những phương pháp cải tiến truyền thống của các mô hình AI đã bắt đầu mất đi hiệu quả. Một phương pháp mới đầy triển vọng được đề xuất là “mở rộng thời gian thử nghiệm,” điều này dường như đã thúc đẩy hiệu suất của mô hình OpenAI’s o3 – mặc dù nó cũng đi kèm những hạn chế nhất định.

Sự xuất hiện của mô hình o3 từ OpenAI đã chứng minh rằng tiến trình mở rộng của AI chưa bị “bảo hòa.” Mô hình o3 thể hiện tốt trên các tiêu chuẩn, vượt trội so với các mô hình khác trong bài kiểm tra khả năng tổng quát gọi là ARC-AGI, đạt 25% trong một bài kiểm tra toán khó mà không có mô hình nào trước đó vượt quá 2%.

Noam Brown, đồng sáng lập dòng mô hình o-series của OpenAI, cho biết rằng việc công bố những tiến bộ đáng kể của o3 chỉ trong vòng ba tháng sau khi ra mắt o1 là một bước nhảy vọt về hiệu suất trong thời gian ngắn. Jack Clark, đồng sáng lập Anthropic, trong một bài đăng trên blog, cho rằng o3 chứng minh rằng tiến bộ AI sẽ nhanh hơn trong năm 2025.

Khả năng mở rộng thời gian thử nghiệm rõ ràng có ý nghĩa là OpenAI đang sử dụng nhiều tài nguyên tính toán hơn trong giai đoạn suy luận của ChatGPT, thời điểm sau khi bạn nhấn enter trên một gợi ý. Dù không rõ cụ thể điều gì đang diễn ra phía sau, mô hình o3 đòi hỏi tính toán đáng kể, dẫn đến giá thành cao hơn cho mỗi câu trả lời.

François Chollet, người tạo ra tiêu chuẩn ARC-AGI, đã viết trên blog rằng OpenAI đã sử dụng khoảng 170 lần tài nguyên tính toán để đạt được điểm 88%, so với phiên bản hiệu quả cao của o3 chỉ đạt thấp hơn 12%. Chollet nhận định o3 là một đột phá cho các mô hình AI nhưng với chi phí lớn tương thích với hệ thống mà vẫn chưa đạt đến mức kinh tế.

Dù đã có nhiều cải tiến, o3 không thể thay thế những ứng dụng phổ biến như GPT-4 hoặc Google Search vì chi phí tính toán vẫn quá lớn. Những tổ chức với tiềm lực tài chính mạnh sẽ là khách hàng phù hợp nhất của o3. Tuy nhiên, xét về khả năng mở rộng trong tương lai, những cải tiến ở cấp độ chip tính toán có thể mở khóa thêm nhiều tiến bộ trong giai đoạn mở rộng thời gian thử nghiệm.