Elon Musk, ông chủ của xAI, vừa thông báo một bước tiến mới cho mô hình Grok AI khi tích hợp khả năng hiểu hình ảnh. Điều này cho phép các người dùng trả phí trên nền tảng xã hội X có thể tải lên một hình ảnh và đặt câu hỏi cho AI về hình ảnh đó. Một nhân viên của xAI và tài khoản chính thức @grok đã đăng tải thông tin về bản cập nhật này vào đầu tuần.
Elon Musk còn cho biết rằng Grok có thể giải thích ý nghĩa của một câu đùa thông qua tính năng mới này, nhưng tính năng vẫn đang trong giai đoạn phát triển ban đầu và sẽ “cải thiện nhanh chóng”. Trước đó, vào tháng 8, công ty AI của Musk đã phát hành Grok-2, phiên bản nâng cấp của chatbot có khả năng sinh hình ảnh sử dụng mô hình FLUX.1 do Black Forest Labs phát triển. Tương tự như những bản phát hành trước, Grok-2 được cung cấp cho các nhà phát triển hoặc người dùng trả phí trên X.
Thời điểm đó, xAI đã cho biết rằng trong lần phát hành tới, họ sẽ bổ sung khả năng hiểu đa phương tiện cho Grok trên X và mô hình này cũng sẽ có sẵn qua API dành cho các nhà phát triển. Đáng chú ý, Grok có thể sớm hiểu các định dạng tài liệu, theo phản hồi của Musk tới một người dùng đã chỉ trích mô hình này vì chưa thể xử lý các định dạng tệp như PDF. Musk đã trả lời: “Không lâu nữa đâu”, khẳng định rằng “chúng tôi đang hoàn thiện trong vòng vài tháng những gì mất nhiều năm của người khác”.
Mạng xã hội X đang nỗ lực thêm nhiều tính năng mới cho cả chatbot AI và các tiers người dùng trả phí, nhằm làm cho dịch vụ trở nên hấp dẫn hơn. Vào đầu tháng, X đã ra mắt một công cụ mới gọi là Radar dành cho những người đăng ký Premium+, giúp quan sát các xu hướng theo thời gian thực và cung cấp thông tin chi tiết về các cuộc trò chuyện. Đây chỉ là một phần của chuỗi cải tiến mạnh mẽ mà nền tảng này đang triển khai để thu hút người dùng.