Startup World Labs tiên phong AI tạo cảnh 3D tương tác từ một ảnh

Đăng bởi: Ngày: 03/12/2024

Hãng khởi nghiệp World Labs do nhà tiên phong AI Fei-Fei Li sáng lập gần đây đã công bố dự án đầu tiên của mình: một hệ thống AI có khả năng tạo ra các cảnh 3D tương tác từ chỉ một bức ảnh. Trong khi nhiều hệ thống AI có thể chuyển đổi ảnh thành mô hình và môi trường 3D, những cảnh do World Labs tạo ra nổi bật hơn nhờ tính tương tác và khả năng tùy biến.

Trên blog của mình, World Labs viết: “[Công nghệ của chúng tôi] cho phép bạn bước vào bất kỳ hình ảnh nào và khám phá nó trong không gian 3D. Từ ảnh gốc, mọi thứ đều được hệ thống tạo ra.” Những cảnh 3D này có thể được khám phá trực tiếp trên trang web của World Labs với bàn phím và chuột. Dù có phần hơi hoạt hình, các cảnh được hệ thống render trực tiếp trong trình duyệt này mang lại cảm giác ấn tượng, với camera có thể điều chỉnh và hiệu ứng độ sâu trường ảnh (DoF) có thể thay đổi, tạo ra hiệu ứng mờ nhòe cho các đối tượng nền.

Hệ thống của World Labs nằm trong trào lưu mới nổi của AI, gọi là “mô hình thế giới”. Nhiều mô hình như thế này cho phép giả lập trò chơi và môi trường 3D, nhưng thường gặp vấn đề liên quan tới khả năng đồng bộ và chất lượng hình ảnh. Điều này khác hoàn toàn với cách tiếp cận của World Labs khi đảm bảo rằng các cảnh sau khi được tạo ra sẽ giữ nguyên và tuân theo các quy luật cơ bản của vật lý, mang lại cảm giác về một thế giới vững chắc và có chiều sâu.

Bên cạnh đó, hệ thống của World Labs còn có thể áp dụng các hiệu ứng tương tác và hoạt hình cho cảnh như thay đổi màu sắc đối tượng hoặc điều chỉnh ánh sáng phông nền một cách linh hoạt. “Hầu hết các công cụ AI tạo dữ liệu trên đều tạo nội dung 2D như hình ảnh hoặc video,” World Labs chia sẻ. “Việc tạo ra nội dung 3D không chỉ cải thiện khả năng kiểm soát và tính đồng nhất mà còn thay đổi cách chúng ta tạo ra phim ảnh, trò chơi, mô phỏng và mọi biểu hiện kỹ thuật số khác của thế giới thực.”

Tuy nhiên, vẫn còn không gian để cải tiến. Các cảnh của World Labs hiện tại chỉ cho phép người dùng khám phá trong một khu vực giới hạn. Nếu cố gắng di chuyển ra ngoài khu vực này, người dùng sẽ gặp phải cảnh báo ranh giới. Cũng có thể xuất hiện lỗi render nhẹ, khi các đối tượng giao nhau một cách không tự nhiên. World Labs khẳng định đây chỉ là một bản “xem trước sớm” và họ đang nỗ lực cải thiện kích cỡ và độ chân thực của các thế giới mà hệ thống tạo ra, đồng thời thử nghiệm các cách thức tương tác mới cho người dùng.

World Labs, ra mắt vào đầu năm nay, đã huy động được 230 triệu USD từ các quỹ đầu tư mạo hiểm đáng chú ý như Andreessen Horowitz (a16z), Ashton Kutcher, Intel Capital, AMD Ventures, và Eric Schmidt. Được định giá trên 1 tỷ USD, công ty kỳ vọng sẽ có sản phẩm đầu tiên vào năm 2025. Bên cạnh những cảnh tương tác, World Labs còn có kế hoạch phát triển các công cụ hữu ích cho các chuyên gia như nghệ sĩ, nhà thiết kế, nhà phát triển, nhà làm phim và kỹ sư, phục vụ từ nhà phát triển trò chơi điện tử tới các hãng phim. “Chúng ta đã có khả năng tạo ra thế giới ảo tương tác, nhưng chi phí hàng trăm triệu USD và tốn nhiều thời gian phát triển,” Justin Johnson, đồng sáng lập World Labs, chia sẻ trên podcast của a16z gần đây. “[Các mô hình thế giới] sẽ cho phép bạn không chỉ tạo ra một hình ảnh hay một đoạn clip, mà là một thế giới 3D sống động và tương tác đầy đủ.”