Runway, công ty nổi tiếng đứng sau mô hình chuyển văn bản thành hình ảnh vừa ra mắt Gen-1, một hệ thống AI tạo video tiên tiến giúp chuyển đổi video bằng cách sử dụng đầu vào văn bản và hình ảnh. Hệ thống hỗ trợ nhiều chế độ khác nhau như Claymation, Storyboard, Mask, Render và Customization, cung cấp cho người dùng tính linh hoạt vô song trong chỉnh sửa video.
Với chế độ Claymation, Gen-1 có thể biến bất kỳ video clip nào thành hoạt hình kiểu đất sét chỉ bằng một lệnh văn bản đơn giản. Chế độ Bảng phân cảnh biến các mô hình mô phỏng thành hình ảnh động, trong khi chế độ Mask cho phép người dùng tách biệt và sửa đổi các đối tượng trong video. Chế độ Render có thể biến render không có kết cấu thành kết quả đầu ra thực tế và chế độ Customization mang lại kết quả có độ trung thực cao hơn nữa.
Xem video demo trên kênh YouTube chính thức của Runway để xem Gen-1 hoạt động.
Năm ngoái, một số công ty đã phát hành các mô hình chuyển văn bản thành video, bao gồm Make-a-Video của Meta, Google Phenaki và Muse và Dreamix của Google. Mặc dù các giải pháp này cung cấp khả năng tạo các video clip ngắn bằng cách sử dụng kiểu nhập văn bản, nhưng chúng không thể so sánh với các khả năng của Gen-1. Theo Runway, mô hình của họ được ưa thích hơn các phương pháp chuyển đổi hình ảnh sang hình ảnh và video sang video hiện có hơn 73% (Stable Diffusion 1.5) và 88% (text2Live).
Video trình diễn do Runway tung ra cho thấy sức mạnh đáng kinh ngạc của Gen-1. Từ việc biến các video clip thành những con rối nặn bằng đất sét bằng một lệnh đơn giản đến biến các mô hình mô phỏng thành video render hoạt hình bằng tính năng Storyboard, Gen-1 đang mở ra những khả năng mới không chỉ trong môi trường thương mại mà còn cho sở thích và mục đích sử dụng tại nhà.
Thật không may, tại thời điểm này, chỉ một số ít người dùng được mời dùng thử Gen-1 và có một danh sách chờ để truy cập. Tuy nhiên, Runway hứa hẹn sẽ tiết lộ chi tiết kỹ thuật trên trang web của mình trong những ngày tới. Chỉ còn là vấn đề thời gian trước khi công nghệ đáng kinh ngạc này trở nên phổ biến rộng rãi hơn và thay đổi cách chúng ta tạo và chuyển đổi nội dung video.