Ngày 19/3 vừa qua tại sự kiện Nvidia GTC 2019, hãng này giới thiệu một công cụ sản xuất hình ảnh mới đầy hứng thú. Nhờ công nghệ mạng đối nghịch, phần mềm mang tên GauGAN này cho phép người dùng phác họa hình ảnh một cách đầy nghệ thuật chỉ với vài cú nhấp chuột.
Một vài đường vẽ nguệch ngoạc ngay lập tức lại trở thành cảnh hoàng hôn trên đỉnh núi. Đây chính là MS Paint của thời đại trí tuệ nhân tạo.
Phần mềm này là minh chứng cho những gì mà mạng lưới thần kinh nền tảng của Nvidia có thể làm được. Nó được thiết kế để diễn dịch hình ảnh một người vẽ nên và từ bản phác thảo thành một bức ảnh trong vài giây.
Có 3 công cụ trong phần mềm này: thùng sơn, bút và bút chì. Các đối tượng vật thể được đặt ở dưới cùng màn hình. Chọn đối tượng đám mây và vẽ vài đường bằng bút chì, GauGAN sẽ tạo ra hình chụp đám mây dựa theo đó.
Nhưng chúng không phải như những hình ảnh đóng dấu có sẵn. GauGAN sẽ tạo ra kết quả độc nhất cho từng thành phần đầu vào.
Nguời dùng sử dụng các công cụ đầu vào để vẽ ra khung sườn của cái cây, phần mềm sẽ tạo nên một cái cây thật sống động. Vẽ một đường thẳng thì nó sẽ trả ra thân cây nhẵn nhụi. Vẽ một bóng đèn ở trên và phần mềm sẽ phủ đầy thân cây bằng những tán lá.
Khả năng tạo ảnh đáng kinh ngạc của AI từ những nét vẽ nguệch ngoạc. |
Ngay cả khi 2 người dùng cùng tạo ra một bản phác thảo giống nhau với cùng một cài đặt, cơ số ngẫu nhiên được tích hợp sẽ đảm bảo tạo ra 2 kết quả khác nhau.
Theo ông Brytan Catanzaro - Phó Giám đốc bộ phận Học sâu Ứng dụng - chỉ cần thêm vài tùy chỉnh, GauGAN có thể vận hành trên hầu hết nền tảng kể cả CPU, tất nhiên sẽ mất nhiều giây hơn để hiển thị.
Trong bản thử nghiệm, phần viền giáp giữa các vật thể vẫn chưa hoàn hảo. Có một đường nhỏ giữa 2 đối tượng. Nvidia gọi các kết quả từ GauGAU là ảnh chụp, nhưng nếu xem xét kỹ lưỡng thì dường như không đúng lắm.
Có một vấn đề về khoảng cách của mạng lưới thần kinh giữa những vật thể mà nó được lập trình và những gì mạng lưới này được lập trình để làm. Nhóm thực hiện dự án hy vọng sẽ cải thiện được điều này trong tương lai.
Nvidia đã sử dụng hơn 1 triệu hình ảnh trên Flickr để “dạy” cho mạng lưới thần kinh này, hầu hết chúng đều đến từ cộng đồng Creative Commons của Flickr. Catanzara cho biết công ty chỉ sử dụng những hình ảnh được cho phép.
Cũng theo công ty này, dự án có thể tổng hợp hàng trăm nghìn vật thể và mối quan hệ của chúng với những vật thể ngoài đời thật.
GauGAN được thiết kế để thu hút những nhà thiết kế game, kiến trúc sư hoặc thậm chí những game thủ. Công ty chưa có kế hoạch phát hành thương mại nào nhưng có lẽ sẽ sớm giới thiệu một bản thử nghiệm rộng rãi.