ElevenLabs, một startup hàng đầu trong lĩnh vực trí tuệ nhân tạo giọng nói, vừa ra mắt một tính năng mới hấp dẫn, cho phép người dùng tải lên các nội dung khác nhau để tạo podcast với nhiều giọng nói. Tính năng này, mang tên GenFM, được xem là cạnh tranh trực tiếp với Google’s NotebookLM, hiện đã có mặt trên ứng dụng ElevenLabs Reader dành cho iOS.
GenFM hiện hỗ trợ 32 ngôn ngữ, bao gồm tiếng Anh, Hindi, Bồ Đào Nha, Trung Quốc, Tây Ban Nha, Pháp, Đức, Nhật Bản và nhiều ngôn ngữ khác. Để sử dụng GenFM, người dùng chỉ cần tải lên một video YouTube, văn bản hoặc tài liệu. Ứng dụng sẽ tự động chọn ra hai giọng nói từ hơn chục giọng có sẵn để tạo thành một podcast.
Một điểm thú vị của GenFM là khả năng tạo cảm giác tự nhiên như cuộc hội thoại thật, khi ứng dụng có thể thêm những tiếng “ừm”, “ừ-hừ” và các khoảng lặng suy nghĩ. Trong khi nhiều công cụ khác tìm cách loại bỏ các đoạn ngắt quãng này, ElevenLabs đã khéo léo lồng ghép chúng vào podcast tạo ra, để mang lại trải nghiệm tự nhiên và sâu sắc hơn.
Jack McDermott, người phụ trách phát triển di động của ElevenLabs, cho biết mục tiêu của họ là đạt được sự cân bằng giữa cuộc trò chuyện chân thực và việc mang lại tiện ích từ nội dung. “Chúng tôi nhận thấy trong những podcast dài tập xuất sắc, thường có ít sự gián đoạn và dòng chảy hội thoại tự nhiên hơn. Đó chính là loại trải nghiệm mà chúng tôi hướng tới, nhằm làm cho những câu chuyện âm thanh trở nên dễ tiếp cận hơn với nhiều giọng nói và ngôn ngữ khác nhau,” anh chia sẻ với TechCrunch qua email.
ElevenLabs đang lên kế hoạch cho phép tùy chỉnh nhiều hơn và cho phép người dùng thêm nhiều nguồn khác nhau để tạo podcast AI đa dạng hơn. Trước đó, vào tháng 9, Google đã giới thiệu khả năng tạo hội thoại AI với NotebookLM từ các nguồn mà người dùng cung cấp và sau đó cho phép tùy chỉnh đầu ra podcast.
Mới chỉ tháng này, ElevenLabs công bố đầu tư 11 triệu USD vào hệ sinh thái startup ở Ba Lan và mở một văn phòng nghiên cứu và phát triển tại Warsaw để thu hút tài năng AI địa phương. Công ty cũng đang mở rộng hoạt động tại Ấn Độ, nơi họ đã tuyển dụng một giám đốc kinh doanh đầu tiên và đang xây dựng đội ngũ ở đây. Đáng chú ý, ElevenLabs cũng đã ra mắt các “agent” AI đối thoại cho các khách hàng của mình, hứa hẹn một tương lai phát triển mạnh mẽ trong lĩnh vực giọng nói AI.