in

DeepMind công bố AI vượt trội hơn các thí sinh đoạt huy chương vàng Olympic Toán học quốc tế

DeepMind, phòng thí nghiệm nghiên cứu AI hàng đầu của Google, gần đây đã công bố một hệ thống AI mới có tên AlphaGeometry2, nổi bật với khả năng giải quyết các bài toán hình học với độ chính xác ấn tượng. Theo một nghiên cứu được công bố, AlphaGeometry2 có khả năng giải quyết 84% các bài toán hình học trong 25 năm qua của kỳ thi Olympic Toán học quốc tế (IMO), một trong những sân chơi lớn cho các học sinh trung học tài năng về toán học. Đặc biệt, hệ thống này được xem là phiên bản cải tiến của AlphaGeometry, đã được giới thiệu vào tháng trước.

DeepMind công bố AI vượt trội hơn các thí sinh đoạt huy chương vàng Olympic Toán học quốc tế

Tại sao DeepMind lại quan tâm đến một cuộc thi toán cho học sinh cấp 3? Theo các nhà nghiên cứu, họ tin rằng cách giải quyết các bài toán hình học phức tạp, đặc biệt là trong hình học Euclid, có thể mở ra những tiến bộ quan trọng cho AI trong tương lai. Để chứng minh điều này, DeepMind đã tổ chức một buổi trình diễn hệ thống kết hợp giữa AlphaGeometry2 và AlphaProof, một mô hình AI cho lý luận toán học, cho thấy khả năng giải quyết bốn trong số sáu bài toán từ IMO 2024.

AlphaGeometry2 được xây dựng dựa trên nền tảng của mô hình ngôn ngữ từ dòng sản phẩm Gemini của Google và một “công cụ ký hiệu”. Mô hình Gemini hỗ trợ công cụ ký hiệu này, giúp suy diễn các giải pháp cho các bài toán hình học và đưa ra các bằng chứng có thể cho các định lý hình học cụ thể. Thao tác này diễn ra qua việc thêm các “hằng số” như điểm, đường thẳng, hoặc hình tròn vào một sơ đồ để giải quyết bài toán.

Cách thức hoạt động của AlphaGeometry2 rất đặc biệt: mô hình Gemini gợi ý các bước và cấu trúc trong một ngôn ngữ toán học chính thức cho công cụ ký hiệu, sau đó, công cụ này tuân theo các quy tắc để kiểm tra tính nhất quán logic của các bước này. Một thuật toán tìm kiếm cho phép AlphaGeometry2 thực hiện nhiều tìm kiếm giải pháp song song và lưu trữ những phát hiện có khả năng hữu ích trong một cơ sở tri thức chung. AlphaGeometry2 xem một bài toán là “đã được giải quyết” khi nó đạt được một bằng chứng kết hợp các gợi ý từ mô hình Gemini cùng với các nguyên lý đã biết trong công cụ ký hiệu.

Đáng chú ý, DeepMind đã tạo ra dữ liệu tổng hợp để huấn luyện mô hình ngôn ngữ của AlphaGeometry2, với hơn 300 triệu định lý và bằng chứng khác nhau về độ phức tạp. Nhóm nghiên cứu đã chọn 45 bài toán hình học từ các kỳ thi IMO trong 25 năm qua và “dịch” chúng thành một bộ lớn hơn với 50 bài toán khác nhau. Theo công bố, AlphaGeometry2 đã giải quyết được 42 trên tổng số 50 bài, vượt khỏi điểm số trung bình của thí sinh đoạt huy chương vàng là 40.9.

Dù vậy, AlphaGeometry2 vẫn còn một số hạn chế. Hệ thống này gặp khó khăn với các bài toán có số lượng điểm biến đổi, phương trình phi tuyến và bất đẳng thức. Đáng lưu ý, dù AlphaGeometry2 không phải là hệ thống AI đầu tiên đạt được hiệu suất tương đương với huy chương vàng trong hình học, nhưng đây là lần đầu tiên hệ thống này thực hiện thành công trên một bộ bài toán lớn như vậy.

Kết quả nghiên cứu này có thể góp phần khơi dậy cuộc tranh luận về việc liệu các hệ thống AI nên được xây dựng dựa trên việc thao tác biểu tượng hay không — cụ thể là việc thao tác các ký hiệu đại diện cho tri thức bằng cách sử dụng các quy tắc — hay là những mạng nơ-ron “giống như não bộ hơn”. AlphaGeometry2 kết hợp cả hai cách tiếp cận này, với mô hình Gemini có kiến trúc mạng nơ-ron và công cụ ký hiệu theo quy tắc.

Tuy nhiên, vẫn còn nhiều điều cần tìm hiểu về cách giải quyết AI trong tương lai, nhất là khi những hệ thống này có thể có ảnh hưởng lớn. AlphaGeometry2 có thể trở thành một ví dụ điển hình cho thấy rằng cách tiếp cận kết hợp giữa thao tác biểu tượng và mạng nơ-ron có thể là một con đường tiềm năng cho việc phát triển AI có thể tổng quát hơn.

Những kết quả ban đầu cũng chỉ ra rằng mô hình ngôn ngữ của AlphaGeometry2 có thể tạo ra các giải pháp một phần cho các vấn đề mà không cần phụ thuộc vào công cụ ký hiệu. Điều này cho thấy một tương lai sáng về khả năng tự cung cấp trong lĩnh vực AI, khi mà những công cụ này vẫn cần thiết cho các ứng dụng toán học cho đến khi tốc độ giải quyết và khả năng sản sinh thông tin của các mô hình được cải thiện hoàn toàn.

Written by Linh Nguyễn

0 0 votes
Article Rating
Subscribe
Notify of
guest

0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments