OpenAI đã công bố vào thứ Tư về việc ra mắt hai mô hình AI reasoning mới, o3 và o4-mini, được thiết kế để tạm dừng và suy nghĩ kỹ trước khi phản hồi. Mô hình o3 được cho là mô hình reasoning tiên tiến nhất của công ty, vượt trội so với các mô hình trước đó trên những bài kiểm tra đánh giá khả năng toán học, lập trình, suy luận, khoa học và hiểu biết trực quan. Trong khi đó, mô hình o4-mini cung cấp một sự cân bằng cạnh tranh giữa giá cả, tốc độ và hiệu suất – những yếu tố quan trọng mà các nhà phát triển thường xem xét khi chọn mô hình AI cho ứng dụng của họ.
Khác với các mô hình Reasoning trước đây, o3 và o4-mini có thể tạo ra phản hồi bằng cách sử dụng các công cụ trong ChatGPT như duyệt web, thực thi mã Python, xử lý hình ảnh và sinh hình ảnh. Ngày hôm nay, các mô hình này cùng với một phiên bản biến thể của o4-mini called “o4-mini-high” cũng đã được ra mắt, phiên bản này tốn nhiều thời gian hơn để tạo ra câu trả lời nhằm cải thiện độ tin cậy.
Hai mô hình mới này là một phần trong nỗ lực của OpenAI để cạnh tranh với Google, Meta, xAI, Anthropic và DeepSeek trong cuộc đua AI toàn cầu. Trong khi OpenAI là hãng đầu tiên phát hành mô hình reasoning AI, các đối thủ nhanh chóng cho ra mắt những phiên bản của riêng họ với hiệu suất tương đương hoặc vượt trội hơn. Thực tế, các mô hình reasoning đang ngày càng thống trị lĩnh vực khi các phòng thí nghiệm AI cố gắng tối ưu hóa hiệu suất.
Mô hình o3 gần như không được phát hành trong ChatGPT. CEO OpenAI Sam Altman đã tín hiệu vào tháng Hai rằng công ty có ý định tập trung nhiều hơn vào một lựa chọn tinh vi hơn, kết hợp công nghệ của o3. Tuy nhiên, áp lực cạnh tranh dường như đã thúc đẩy OpenAI thay đổi kế hoạch vào phút chót.
OpenAI cho biết rằng o3 đạt hiệu suất hàng đầu trong việc đo kiểm tra kỹ năng lập trình SWE-bench (không cần cơ sở hạ tầng tùy chỉnh), với điểm số 69.1%. Mô hình o4-mini cũng đạt được điểm số tương tự, 68.1%. Mô hình tốt tiếp theo của OpenAI, o3-mini, chỉ đạt điểm 49.3%, trong khi Claude 3.7 Sonnet đạt 62.3%.
OpenAI tuyên bố rằng o3 và o4-mini là các mô hình đầu tiên có khả năng “suy nghĩ với hình ảnh”. Trên thực tế, người dùng có thể tải lên các hình ảnh vào ChatGPT, chẳng hạn như bản phác thảo trên bảng trắng hoặc sơ đồ từ các tệp PDF, và các mô hình sẽ phân tích hình ảnh trong quá trình “chuỗi suy nghĩ” trước khi trả lời. Nhờ vào khả năng mới này, o3 và o4-mini có thể hiểu các hình ảnh mờ hoặc chất lượng thấp và thực hiện các tác vụ như phóng to hoặc xoay hình ảnh trong quá trình suy luận.
Ngoài khả năng xử lý hình ảnh, o3 và o4-mini có thể chạy và thực thi mã Python trực tiếp trong trình duyệt qua tính năng Canvas của ChatGPT, và tìm kiếm thông tin trên web khi được hỏi về các sự kiện hiện tại. Tất cả ba mô hình – o3, o4-mini và o4-mini-high – cũng sẽ được cung cấp qua các điểm cuối của OpenAI, API Hoàn thành Chat và API Phản hồi, cho phép các kỹ sư xây dựng các ứng dụng bằng cách sử dụng các mô hình của công ty.
OpenAI đang tính phí tương đối thấp cho các nhà phát triển sử dụng o3, với giá 10 USD cho mỗi triệu token đầu vào (khoảng 750.000 từ) và 40 USD cho mỗi triệu token đầu ra. Đối với o4-mini, giá giữ nguyên như o3-mini, 1.10 USD cho mỗi triệu token đầu vào và 4.40 USD cho mỗi triệu token đầu ra.
Trong những tuần tới, OpenAI cho biết họ dự kiến sẽ phát hành phiên bản o3-pro, một phiên bản của o3 có khả năng sử dụng nhiều tài nguyên máy tính hơn để cung cấp câu trả lời, độc quyền cho người dùng ChatGPT Pro. CEO Sam Altman cho biết o3 và o4-mini có thể là những mô hình reasoning AI độc lập cuối cùng của OpenAI trong ChatGPT trước khi ra mắt GPT-5, một mô hình mà công ty đã cho biết sẽ hợp nhất các mô hình truyền thống như GPT-4.1 với các mô hình reasoning của nó.