Gemini app ra mắt tính năng tổng hợp âm thanh trên Android, iOS

Đăng bởi: Ngày: 21/03/2025

Gemini app của Google vừa công bố tính năng mới mang tên “Tổng hợp Âm thanh” dành cho người dùng Android và iOS. Người dùng hiện có thể truy cập tính năng này để tạo ra các podcast tổng hợp âm thanh từ tài liệu hoặc slideshow của mình. Ngay từ khi tải lên tài liệu, một gợi ý “Tạo Tổng hợp Âm thanh” sẽ xuất hiện bên cạnh tùy chọn “Nói Trực tiếp về điều này”. Điều này cho phép người dùng dễ dàng tạo nội dung âm thanh từ các nguồn tài liệu đã có.

Tính năng này đã được triển khai rộng rãi cho người dùng Gemini miễn phí và các thuê bao cao cấp tại thị trường nói tiếng Anh, với kế hoạch mở rộng sang các ngôn ngữ khác trong tương lai gần. Sau khi người dùng yêu cầu tạo tổng hợp âm thanh, sẽ mất một vài phút để các cuộc đối thoại giữa hai AI được tạo ra. Google sẽ gửi thông báo khi podcast đã sẵn sàng.

Một điểm thú vị là ứng dụng Gemini không tích hợp trình phát âm thanh bên trong, việc truy cập vào tổng hợp âm thanh sẽ mở tệp (.m4a) trong tab của trình duyệt. Điều này cho phép người dùng phát tệp từ trình phát mặc định như Chrome, trong khi gemini.google.com lại có trình phát inline cho tổng hợp âm thanh.

Các podcast này có thể kéo dài vài phút nhằm mục đích tóm tắt nội dung, tạo cầu nối giữa các chủ đề và mang đến những quan điểm độc đáo. Tuy nhiên, người dùng cần lưu ý rằng các cuộc đối thoại trong các tổng hợp âm thanh này dựa trên nguồn tài liệu được cung cấp chứ không phải kiến thức thực tế ngoài đời. Điều này khác biệt hoàn toàn với các podcast được tạo ra từ các báo cáo Nghiên cứu Sâu.

Với tính năng mới này, Gemini đã khẳng định được vị thế cạnh tranh trong lĩnh vực tạo nội dung âm thanh, cung cấp cho người dùng cách thức mới để tương tác với tài liệu của mình.

Tính năng này chắc chắn sẽ tạo ra nhiều cơ hội mới cho người dùng trong việc sản xuất và tiêu thụ nội dung, mở ra hướng đi mới cho ứng dụng trong thời gian tới. Với những đổi mới này, Gemini đang nỗ lực không ngừng để mang đến cho người dùng những trải nghiệm tốt nhất trong việc tạo và tiêu thụ nội dung âm thanh.