Anthropic vừa công bố mô hình AI mới Claude 3.5 Sonnet, thu hút sự chú ý của giới công nghệ với tính năng mới đang trong giai đoạn thử nghiệm công khai cho phép điều khiển máy tính. Với tính năng có tên “sử dụng máy tính,” Claude 3.5 Sonnet có thể nhìn vào màn hình, di chuyển con trỏ, nhấp nút và gõ văn bản, mô phỏng cách con người làm việc với máy tính. Tính năng này hiện đã có sẵn qua API, cho phép nhà phát triển hướng dẫn Claude làm việc trên máy tính tương tự như con người, như được trình diễn trên một chiếc Mac trong video của công ty.
Microsoft trước đó từng triển khai tính năng Copilot Vision, và ứng dụng desktop ChatGPT của OpenAI cũng đã cho thấy AI có thể làm gì khi quan sát màn hình người dùng. Ngoài ra, Google cũng cung cấp các khả năng tương tự trong ứng dụng Gemini trên điện thoại Android. Tuy nhiên, họ chưa đưa ra các công cụ sẵn sàng để thực hiện các tác vụ tự động như Anthropic. Công ty Rabbit cũng hứa hẹn tích hợp các tính năng tương tự trên R1, nhưng hiện vẫn chưa ra mắt.
Anthropic cũng cảnh báo rằng việc sử dụng máy tính vẫn đang ở giai đoạn thử nghiệm và có thể gặp khó khăn và sai sót. Công ty cho biết đang phát hành sớm để nhận phản hồi từ các nhà phát triển và hy vọng chức năng sẽ được cải thiện nhanh chóng trong thời gian tới. Chủ yếu, Claude 3.5 Sonnet hiện vẫn chưa đủ tiên tiến để thực hiện nhiều thao tác thông thường như kéo, phóng to, và chỉ có thể nắm bắt các luồng hoạt động thông qua việc chụp ảnh màn hình liên tục, thay vì quan sát qua một luồng video cụ thể.
Phiên bản mới của Claude 3.5 Sonnet này còn được hướng dẫn để tránh xa các tương tác trên mạng xã hội và các hoạt động liên quan đến bầu cử, nhằm đảm bảo an toàn và bảo mật thông tin. Anthropic cũng ghi nhận rằng Claude 3.5 Sonnet có các cải tiến đáng kể trên nhiều thước đo của ngành, với hiệu năng vượt trội trong các nhiệm vụ lập trình và sử dụng công cụ. Đặc biệt, nó đã cải thiện hiệu suất trên SWE-bench Verified từ 33.4% lên 49.0%, cao hơn tất cả các mô hình công khai khác, và cải thiện trên TAU-bench trong lĩnh vực bán lẻ và hàng không, từ 62.6% lên 69.2% và từ 36.0% lên 46.0%, tương ứng.
Với những tiến bộ này, Claude 3.5 Sonnet đang trở thành tâm điểm của sự chú ý, không chỉ vì những cải tiến kỹ thuật mà còn vì cách tiếp cận mới đối với việc sử dụng AI trong môi trường máy tính thực tế, điều đang được kỳ vọng sẽ mở ra các khả năng mới cho tương tác giữa con người và máy tính trong tương lai không xa.