5 dịch vụ tự tạo video từ text dựa trên AI

Đăng bởi: Linh Nguyễn • Ngày: 28/03/2023

Trong một vài tháng ngắn ngủi, thế giới AI tạo ra đã phát triển từ các chatbot như ChatGPT sang hình ảnh quang học do Midjourney tạo ra. Trong trường hợp bạn nghĩ rằng mọi thứ sẽ chậm lại bất cứ lúc nào, các video do AI tạo ra có thể sắp có khoảnh khắc quan trọng của chúng trong ánh đèn sân khấu.

Hiện tại có năm trình tạo video AI mới được tung ra chỉ trong bảy ngày qua. Chất lượng khác nhau, nhưng rõ ràng là công nghệ đang di chuyển với tốc độ không ngừng. Vì vậy, hãy chia nhỏ năm trình tạo video AI, từ janky đến nghiêm túc ấn tượng.

Runway

Runway là một công cụ chỉnh sửa video AI mạnh mẽ đang tạo nên làn sóng trong ngành công nghiệp sáng tạo, cung cấp một loạt tính năng được hưởng lợi từ sự hỗ trợ của AI. Từ tạo mặt nạ và theo dõi chuyển động đến chuyển động siêu chậm và phân loại màu, Runway là một dịch vụ dựa trên đăng ký cung cấp thêm động lực để vượt qua các giới hạn.

Một trong những cập nhật thú vị nhất từ Runway là bản cập nhật Gen-1, cho phép người dùng định kiểu lại video bằng từ ngữ. Với Gen-1, một video quay cảnh đi bộ trên phố có thể được chuyển đổi thành một đoạn phim hoạt hình ngắn dường như được thực hiện với các nhân vật Claymation được điêu khắc và tạo dáng bằng tay. Và bây giờ, Runway đã phát hành Gen-2, loại bỏ nhu cầu về video tham khảo.

The wait is over.

Gen-1 is now available at https://t.co/ekldoIshdw pic.twitter.com/Wm2YVOvm26

— Runway (@runwayml) March 27, 2023

Với Gen-2, Runway cho phép bạn tạo video bằng lời nhắc văn bản đơn giản. Điều này có nghĩa là bạn có thể dễ dàng tạo video với nỗ lực tối thiểu mà không cần bất kỳ video hoặc cảnh quay tham chiếu nào. Tất cả những gì bạn cần là một lời nhắc văn bản đơn giản và công nghệ AI của Runway sẽ làm phần còn lại.

Khả năng thể hiện sáng tạo với công nghệ AI của Runway là vô tận. Cho dù bạn là người chỉnh sửa video chuyên nghiệp hay người mới bắt đầu, Runway giúp bạn dễ dàng tạo những video tuyệt đẹp thu hút khán giả của mình. Với Gen-2, Runway đã đưa việc chỉnh sửa AI lên một tầm cao mới, khiến nó trở nên dễ tiếp cận và dễ dàng hơn bao giờ hết.

Text2Video-Zero của Picsart

Picsart là một ứng dụng phổ biến cho phép người dùng chỉnh sửa ảnh, nhưng bạn có biết rằng nó cũng cung cấp khả năng chỉnh sửa video không? Một trong những tính năng mới nhất của nó, Text2Video-Zero, là một công cụ nghiên cứu khai thác sức mạnh của AI để tạo ra nhiều khung hình kết hợp liền mạch với nhau.

Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators

abs: https://t.co/5xCsj4PNRj
github: https://t.co/BdSzlepGQG pic.twitter.com/XY4piH6j4v

— AK (@_akhaliq) March 24, 2023

Trước đây, những nỗ lực sử dụng AI để lắp ráp hình ảnh dưới dạng khung hình video thường dẫn đến những cảnh hỗn loạn thú vị về mặt hình ảnh nhưng lại thiếu sự mạch lạc. Tuy nhiên, với Text2Video-Zero, Picsart đã có những bước tiến đáng kể trong việc tạo ra một công cụ có thể tạo ra các video liền mạch một cách dễ dàng.

Cho dù bạn là một nhà quay phim chuyên nghiệp hay chỉ đơn giản là muốn thêm nét sáng tạo vào các bài đăng trên mạng xã hội của mình, Text2Video-Zero là một công cụ mạnh mẽ có thể giúp bạn đưa video của mình lên một tầm cao mới. Với cam kết của Picsart trong việc vượt qua ranh giới của những gì có thể với chỉnh sửa ảnh và video do AI cung cấp, khả năng là vô tận.

Video-P2P

Video-P2P là một dự án nguồn mở thay đổi trò chơi đang đưa phong cách video lên một tầm cao mới. Được phát triển theo cách tương tự như Runway Gen-1, Video-P2P sử dụng AI khuếch tán ổn định để tạo hiệu ứng video tuyệt đẹp thông qua lời nhắc văn bản. Với Video-P2P, giờ đây bạn có thể tạo các video được cách điệu liền mạch bằng văn bản và các yếu tố khác để làm cho chúng hấp dẫn hơn.

Video-P2P: Video Editing with Cross-attention Control@Gradio demo is out on @huggingface

demo: https://t.co/dHHoiLh18v
github: https://t.co/vbq1MqwjXO pic.twitter.com/EYBCr9TkbK

— AK (@_akhaliq) March 20, 2023

Video-P2P đã và đang tạo nên làn sóng trong cộng đồng công nghệ vì những kết quả ấn tượng của nó. Công cụ này lấy video đầu vào và tạo ra nhiều khung hình gắn kết và hấp dẫn về mặt hình ảnh. Không giống như những thử nghiệm ban đầu với video do AI tạo ra, các hiệu ứng do Video-P2P tạo ra rất ổn định, nhất quán và bắt mắt. Với Video-P2P, bạn có thể tạo kiểu cho video của mình một cách dễ dàng và tạo nội dung chuyên nghiệp ngay lập tức.

Điểm hay nhất của Video-P2P là nó là một dự án mã nguồn mở, nghĩa là bất kỳ ai cũng có thể sử dụng và đóng góp vào sự phát triển của nó. Điều này làm cho nó trở thành một công cụ lý tưởng cho các chuyên gia sáng tạo, nhà phát triển và bất kỳ ai muốn thử nghiệm các hiệu ứng video do AI tạo ra.

TemporalNet

TemporalNet là một dự án mới đầy hứa hẹn dựa trên ControlNet, một trình tạo hình ảnh AI tiên tiến cho phép kiểm soát nhiều hơn tư thế của các nhân vật xuất hiện trong ảnh. TemporalNet tiến thêm một bước này, cung cấp một phương pháp tạo video thay thế hứa hẹn vừa có thể dự đoán vừa có thể kiểm soát được.

#TemporalNet has been published!
You can access the model to give it a try yourself here:https://t.co/0tdfmGxsVH
Curious to see how far people can push it ^^#ControlNet #AIart #stablediffusion pic.twitter.com/hd0e3MEFhG

— CiaraRowles (@CiaraRowles1) March 24, 2023

Mặc dù các video do TemporalNet sản xuất vẫn còn một số hiện tượng nhấp nháy, nhưng kết quả rất hứa hẹn. Với TemporalNet, người sáng tạo có thể có nhiều quyền kiểm soát hơn đối với các cảnh mà họ đang sản xuất, dẫn đến các video có giao diện chuyên nghiệp và bóng bẩy hơn.

TemporalNet là một dự án nguồn mở, vì vậy bất kỳ ai muốn dùng thử đều có thể truy cập được. Như với bất kỳ công nghệ mới nào, vẫn còn nhiều điều cần tìm hiểu về các khả năng và hạn chế của TemporalNet, nhưng những kết quả ban đầu rất đáng khích lệ.

Text-to-Video của Alibaba

Mô hình AI chuyển văn bản thành video của Alibaba là một sự đổi mới đầy hứa hẹn trong lĩnh vực tạo video. Mô hình AI này tạo video từ lời nhắc văn bản, khiến nó trở thành công cụ có khả năng thay đổi cuộc chơi dành cho người tạo nội dung.

fast & longer text-to-video with 🧨 diffusers

you maybe saw fun junky text-to-video from the ModelScope's research model lately

with diffusers you can control how long the video is – and fit it on smol VRAM GPUs, including free colab. Try out here:https://t.co/uPVd9hEOtr pic.twitter.com/mIFkGnGT5V

— apolinario 🌐 (@multimodalart) March 22, 2023

Mặc dù công nghệ này vẫn đang trong quá trình phát triển và cần được tinh chỉnh nhiều hơn, nhưng nó đã cho thấy những kết quả ấn tượng. Các video do Text-to-Video tạo ra có chuyển tiếp mượt mà và hình ảnh rõ ràng, đồng thời khả năng tùy chỉnh là vô hạn.

Mô hình AI này có thể cách mạng hóa cách chúng ta nghĩ về sản xuất video, khiến nó trở nên dễ tiếp cận và hiệu quả hơn cho cả chuyên gia và người nghiệp dư. Với sự phát triển và cải tiến nhiều hơn, Chuyển văn bản thành video có thể mở đường cho một kỷ nguyên mới của việc tạo nội dung video.