Hình ảnh từ video tạo bởi AI của Meta. Ảnh: Meta |
Meta vừa cho ra mắt một loạt video dài 10 giây được tạo ra bằng Movie Gen, phiên bản AI có thể dùng để sản xuất video và âm thanh chân thực. Video mô phỏng chú hà mã Moo-Deng đang gây sốt mạng xã hội, bơi lội tung tăng dưới mặt nước.
Mặc dù chưa có ngày ra mắt chính thức, Movie Gen được giới thiệu ngay sau sự kiện Meta Connect, nơi trưng bày những công nghệ mới và tân tiến nhất của Meta như chiếc headset Meta Quest 3S hay ngôn ngữ trợ lý AI Llama 3.2, cho thấy những nỗ lực của Meta muốn dẫn đầu đường đua AI tạo sinh.
Ảnh từ video với câu lệnh "chú hà mã con đang bơi trong dòng sông". Ảnh: Meta |
Hình ảnh trên được cắt từ video, tạo bởi câu lệnh “Một chú hà mã con đang bơi trong dòng sông. Những bông hoa rực rỡ nổi trên mặt nước với cá bơi xung quanh. Làn da của chú hà mã trơn mịn và bóng loáng, phản chiếu ánh sáng mặt trời xuyên qua làn nước”.
Tự tin vượt trội mô hình đối thủ
Ngoài tạo video từ văn bản được nhập, Movie Gen có thể thêm thắt chi tiết cho những đoạn video có sẵn, như thêm vật thể vào tay một người nào đó hay thay đổi cấu trúc của một bề mặt.
Song song với video, công nghệ này còn tạo ra những đoạn âm thanh trùng khớp với hình. Trong một video ví dụ của Meta về một người đàn ông đứng gần thác nước, chúng ta có thể nghe rõ tiếng bắn nước rào rào với nhạc nền là bản giao hưởng tràn đầy hy vọng.
Một video được tạo với câu lệnh “Nữ DJ chơi nhạc". Ảnh: Meta |
Một số ví dụ âm thanh khác đó là tiếng động cơ xe và tiếng bánh xe rít lên dưới mặt đường, hay âm thanh một con rắn trườn giữa khu rừng, với tiếng kèn gây cấn.
Trong một nghiên cứu của mình, Meta chia sẻ thêm rằng tham số Movie Gen được đào tạo từ 30 tỷ tham số, riêng phần âm thanh là 13 tỷ. Movie Gen có thể sản xuất video chất lượng cao lên đến 16 giây. Meta cho rằng mô hình này thể hiện vượt trội hơn so với các đối thủ về mặt chất lượng video nói chung.
Cuộc chạy đua mô hình AI tạo sinh video
Giữa năm nay, CEO Mark Zuckerberg giới thiệu tính năng của mô hình AI Imagine Me, nơi người dùng có thể sử dụng những tấm ảnh gương mặt bản thân để nhập vai vào nhiều bối cảnh, bằng một bài post trên Threads. Với cùng nguyên liệu ấy thì mô hình Movie Gen có thể khiến cho nhân vật cử động dưới dạng video.
Tuy nhiên, Meta vẫn chưa giải thích rõ ràng về nguồn dữ liệu cung cấp cho Movie Gen, khi đây vẫn đang là vấn đề gây tranh cãi với các công cụ AI tạo sinh vì rất ít khi công chúng được biết những văn bản, video nào được sử dụng cho các mô hình này. Công bố của Meta chỉ nhận định rằng Movie Gen được đào tạo dựa trên sự kết hợp giữa các tập dữ liệu được cấp phép và có sẵn công khai chứ chưa có gì xác thực điều đó.
Hình ảnh từ video với câu lệnh: Bé gái chạy trên bãi biển và cầm cái diều, mặc quần jeans ngắn và áo vàng, ánh nắng Mặt Trời chiếu xuống. Ảnh: Meta. |
Công chúng đang nóng lòng chờ đợi ngày Movie Gen có mặt rộng rãi, bởi trong bài đăng không nói rõ thời điểm ra mắt của mô hình trong tương lai. OpenAI công bố mô hình mô hình AI tạo sinh video Sora từ vài tháng trước, nhưng vẫn chưa có ngày ra mắt chính thức.
Xét về sự lớn mạnh của Meta với cương vị là nền tảng mạng xã hội, những công cụ được hỗ trợ bởi Movie Gen cũng sẽ dần xuất hiện trong Facebook, Instagram, và WhatsApp. Trong khi đó tháng 9 vừa qua, đối thủ Google chia sẻ dự định đưa mô hình AI của mình - Veo cho các nhà sáng tạo nội dung YouTube Shorts sử dụng trong năm 2025.