Podcastle ra mắt mô hình chuyển văn bản thành giọng nói với hơn 450 giọng AI

Đăng bởi: Linh Nguyễn • Ngày: 04/03/2025

Podcastle, nền tảng ghi âm và biên tập podcast, đã chính thức gia nhập cuộc đua chuyển văn bản thành giọng nói với mô hình AI mới mang tên Asyncflow v1.0. Nền tảng này sẽ cung cấp hơn 450 giọng nói AI có thể đọc lời từ văn bản. Điều này giúp Podcastle nâng cao khả năng phục vụ nhu cầu của người dùng trong việc tạo ra nội dung âm thanh phong phú.

Ông Arto Yeritsyan, người sáng lập Podcastle, cho biết công ty đã luôn muốn phát triển một mô hình chuyển văn bản thành giọng nói. Tuy nhiên, chi phí đào tạo và yêu cầu về dữ liệu cho công nghệ này rất cao. Nhờ vào những đổi mới trong công nghệ mô hình ngôn ngữ lớn, Podcastle đã tìm thấy giải pháp cho vấn đề này, cho phép họ tạo ra một mô hình giọng nói chất lượng mà không cần quá nhiều dữ liệu.

Mô hình Asyncflow v1.0 không chỉ tụ tập sức mạnh từ các mô hình AI hiện có mà còn cung cấp một API cho các nhà phát triển, enabling họ tích hợp công nghệ này vào ứng dụng của riêng họ. Với tính năng chuyển đổi văn bản thành giọng nói, Podcastle có thể phục vụ cho nhiều lĩnh vực khác nhau như tiếp thị, giáo dục và đào tạo doanh nghiệp.

Chi phí dịch vụ chuyển biến văn bản thành giọng nói của Podcastle rẻ hơn so với các đối thủ cạnh tranh, chỉ khoảng 40 USD cho 500 phút chuyển đổi. Trong khi đó, ElevenLabs, một trong những đối thủ lớn, tính phí tới 99 USD cho cùng một số phút.

Đặc biệt, Podcastle còn áp dụng một quy trình nâng cấp cho tính năng sao chép giọng nói, rút ngắn thời gian đào tạo. Trước đây, người dùng cần đọc khoảng 70 câu khác nhau để tạo ra một bản sao giọng nói. Nay chỉ cần vài giây ghi âm để tạo một phiên bản sao giọng của chính bạn.

Công nghệ Magic Dust AI của Podcastle, được ra mắt năm ngoái, cũng được sử dụng để cải thiện chất lượng ghi âm. Mặc dù một số thử nghiệm cho thấy giọng nói tạo ra từ quy trình mới có phần giống như giọng máy móc, Podcastle cam kết sẽ cải thiện tính năng này theo thời gian và khuyến khích người dùng đào tạo nhiều mẫu giọng để có những kết quả tốt hơn.

Trong một thế giới mà nhu cầu về nội dung âm thanh ngày một tăng, Podcastle đang nỗ lực không ngừng để có thể đưa ra các giải pháp toàn diện cho người dùng với công cụ âm thanh, video và nội dung podcast dưới một nền tảng duy nhất. Điều này sẽ tạo ra lợi thế cạnh tranh lớn cho họ trong thị trường đang ngày càng phát triển mạnh mẽ này.