Ai benchmark tổ chức bị chỉ trích vì chậm công bố tài trợ từ OpenAI

Đăng bởi: Linh Nguyễn • Ngày: 21/01/2025

Trong thời gian gần đây, tổ chức Epoch AI, một tổ chức phi lợi nhuận chuyên phát triển các tiêu chuẩn đo lường toán học cho trí tuệ nhân tạo (AI), đã bị cáo buộc về tính minh bạch trong việc công bố nguồn tài trợ từ OpenAI. Mặc dù OpenAI đã hỗ trợ tổ chức này trong việc phát triển FrontierMath, một bài kiểm tra được thiết kế để đánh giá kỹ năng toán học của AI, nhưng thông tin này chỉ được tiết lộ gần đây vào ngày 20 tháng 12. Thông tin này đã gây ra làn sóng phản ứng từ cộng đồng AI, khi nhiều nhà nghiên cứu và nhà phát triển cảm thấy bị lừa dối vì chưa từng được thông báo đầy đủ về việc tài trợ này.

FrontierMath hướng đến việc tạo ra những bài toán ở trình độ chuyên gia và được sử dụng để thử nghiệm khả năng của các mẫu AI, bao gồm cả dự án AI chủ lực sắp ra mắt của OpenAI mang tên o3. Trong một bài đăng trên diễn đàn LessWrong, một nhân viên hợp đồng với tên gọi “Meemi” đã chỉ trích sự thiếu minh bạch từ Epoch AI khi không thông báo về sự tham gia của OpenAI trong quá trình phát triển tiêu chuẩn này. “Sự giao tiếp về điều này đã không rõ ràng,” Meemi bày tỏ. Theo người này, Epoch AI cần phải công bố thông tin về tài trợ từ OpenAI để các nhà phát triển có thể hiểu rõ hơn về việc công sức của họ có thể được sử dụng ra sao.

Sự việc này đã thu hút nhiều phản ứng trên mạng xã hội, tất cả đều bày tỏ lo ngại rằng sự bí mật xung quanh tài trợ có thể làm suy giảm tính khách quan của FrontierMath. Ngoài việc tài trợ cho dự án, OpenAI còn có cái nhìn sâu sắc về nhiều bài toán và giải pháp của tiêu chuẩn, một điều mà Epoch AI không tiết lộ trước ngày 20 tháng 12.

Stanford PhD Carina Hong cũng lên tiếng khi cho biết có sáu nhà toán học đã có những đóng góp quan trọng cho FrontierMath mà chưa một ai trong số họ biết rằng OpenAI sẽ có quyền truy cập độc quyền vào tiêu chuẩn này. “Họ bày tỏ rằng họ không chắc họ có tham gia đóng góp nếu biết thông tin này trong quá khứ,” Hong cho hay.

Tamay Besiroglu, phó giám đốc của Epoch AI, trong một phản hồi đã cố gắng bảo vệ sự chính xác của FrontierMath, tuy nhiên cũng thừa nhận rằng tổ chức đã mắc phải sai lầm trong việc không rõ ràng về thông tin tài trợ từ OpenAI. “Chúng tôi bị hạn chế trong việc công bố đối tác cho đến thời điểm ra mắt o3, và xét theo cách nhìn của mình, chúng tôi đáng lẽ phải thương lượng mạnh mẽ hơn để có thể công bố cho các nhà phát triển từ sớm hơn,” Besiroglu viết.

Ông cũng khẳng định rằng OpenAI có một “thỏa thuận bằng miệng” với Epoch AI để không sử dụng bộ bài toán của FrontierMath nhằm đào tạo AI, và Epoch AI đã có một bộ kiểm tra riêng biệt để bảo vệ thêm cho việc xác minh độc lập về kết quả tiêu chuẩn FrontierMath.

Tuy nhiên, Ellot Glazer, nhà toán học chính tại Epoch AI, lại cho rằng việc Epoch AI chưa thể tự độc lập xác minh thành tích của OpenAI trong tiêu chuẩn FrontierMath đã làm cho câu chuyện càng thêm phần phức tạp. Glazer chia sẻ quan điểm cá nhân rằng các kết quả của OpenAI là chính xác, nhưng thừa nhận rằng họ không thể đảm bảo cho đến khi việc đánh giá độc lập hoàn tất.

Chuyện này cho thấy một thách thức lớn trong việc phát triển các tiêu chuẩn thực nghiệm nhằm đánh giá hiệu quả của AI, đồng thời cần có những nguồn lực đầy đủ cho sự phát triển mà không tạo ra cảm giác xung đột lợi ích. Sự việc này cũng tạo ra nhiều câu hỏi về cách thức làm thế nào để đảm bảo tính minh bạch và công bằng trong các tổ chức liên quan đến AI trong bối cảnh đang ngày càng phát triển nhanh chóng.