Google ra mắt Gemma 3: trí tuệ nhân tạo mã nguồn mở, single-GPU với 128K context window

Đăng bởi: Linh Nguyễn • Ngày: 13/03/2025

Google vừa công bố mô hình trí tuệ nhân tạo mới nhất của mình mang tên Gemma 3, một sản phẩm mã nguồn mở có khả năng chạy trên một GPU duy nhất. Mô hình này được tối ưu hóa cho việc sử dụng trên nhiều nền tảng khác nhau, từ các máy chủ tính toán mạnh mẽ cho đến điện thoại thông minh. Theo Google, Gemma 3 là mô hình AI tốt nhất thế giới chạy trên một GPU hoặc các bộ tăng tốc AI, nhắm đến các nhà phát triển cần xây dựng AI cho nhiều môi trường khác nhau.

Điều đặc biệt của Gemma 3 là khả năng xử lý dữ liệu với context window lên đến 128.000 ký tự, gấp nhiều lần so với các mô hình trước đây như Gemma 2, chỉ có 8.192 ký tự. Với tính năng này, Gemma 3 sẽ cho phép thực hiện các tác vụ phức tạp hơn và tương tác hiệu quả hơn với người dùng.

Ngoài ra, Gemma 3 còn được thiết kế như một mô hình đa phương thức, có khả năng xử lý văn bản, hình ảnh độ phân giải cao và video. Google cũng đã cung cấp một giải pháp mới mang tên ShieldGemma 2 để đảm bảo an toàn cho hình ảnh, có thể được tích hợp vào Gemma nhằm chặn các hình ảnh không mong muốn thuộc ba thể loại: nguy hiểm, tình dục hoặc bạo lực.

Các mô hình AI phổ biến hiện nay thường yêu cầu tài nguyên tính toán lớn và thường chạy sản phẩm trên các cụm máy chủ. Gemma 3 là một bước tiến để cung cấp cho các nhà phát triển và những người đam mê một tùy chọn có thể hoạt động trên phần cứng ít mạnh mẽ hơn, như Meta Llama3 và những tên tuổi khác. Việc tăng cường hiệu suất mà không cần tài nguyên phần cứng lớn đang ngày càng trở thành xu hướng trong giới công nghệ

Gemma 3 có nhiều phiên bản khác nhau, từ phiên bản nhỏ gọn nhất với 1 tỷ tham số có thể chạy trên hầu hết các thiết bị, đến phiên bản lớn nhất với 27 tỷ tham số, yêu cầu khối lượng RAM đáng kể. Mô hình này cung cấp nhiều lựa chọn cho người dùng, phù hợp với mức độ tính toán của từng hệ thống hiện có.

Google đã giới thiệu Gemma 3 như mô hình “tốt nhất thế giới cho bộ tăng tốc đơn”. Dù không phải tất cả các phiên bản của nó đều có tính khả dụng lý tưởng cho xử lý tại chỗ, nhưng bạn có thể tùy chỉnh và điều chỉnh mô hình sử dụng với các công cụ như Google Colab và Vertex AI, hoặc chỉ đơn giản là sử dụng GPU riêng của bạn.

Bên cạnh đó, Google cho phép tải xuống toàn bộ mô hình miễn phí từ các kho như Kaggle hay Hugging Face, mặc dù thỏa thuận cấp phép của Google đã hạn chế một số hành động mà người dùng có thể thực hiện với mô hình này. Đây là một lợi thế khi bạn có thể sử dụng các mô hình như Gemma 3 để khám phá mà không bị nhà phát triển giám sát.

Dù bạn dự định làm gì, có một mô hình Gemma phù hợp với phần cứng của bạn. Google còn tạo một cộng đồng mang tên “Gemmaverse” để giới thiệu các ứng dụng được xây dựng từ các mô hình Gemma.