Midjourney đang thu hút nhiều sự chú ý trên Internet. Đây là phần mềm vẽ ảnh dựa trên trí tuệ nhân tạo (AI), được phát triển bởi một nhóm kỹ sư do David Holz dẫn đầu. Người dùng chỉ cần nhập mô tả bức ảnh cần tạo để phần mềm trả kết quả trong vài chục giây.
Thay vì phát hành trên kho ứng dụng, Midjourney sử dụng nền tảng Discord để tương tác. Phần mềm đang được thử nghiệm với 25 lần sử dụng miễn phí. Nếu muốn tạo nhiều ảnh hơn, người dùng cần trả 10 USD/tháng để có 200 lần tạo ảnh, hoặc 30 USD/tháng để sử dụng không giới hạn.
Midjourney sử dụng Discord để tương tác và trả ảnh. |
Sau khi tham gia Midjourney trong Discord, chọn các kênh chat bắt đầu bằng chữ "newbie" rồi nhập cú pháp "/Imagine [mô tả]" vào khung nhắn tin để yêu cầu ứng dụng tạo ảnh.
Thử nghiệm với mô tả "A cat drifting on back in a lake with a galaxy of planets as background" (Một con mèo trôi trên hồ với nền thiên hà chứa các hành tinh). Sau gần một phút, công cụ trả lại 4 bức ảnh trong khung chat với chủ thể, chi tiết tương tự các từ khóa trong câu lệnh.
Người dùng cần kéo chuột để tìm tin nhắn bị trôi nếu có nhiều người sử dụng cùng lúc, hoặc nhấn nút Inbox ở góc trên bên phải Discord để theo dõi kết quả trả về từ Midjourney.
Nếu nhập từ khóa đơn giản, Midjourney thường trả về kết quả giống ảnh minh họa trong văn bản. Tuy nhiên khi thêm từ khóa về màu sắc, địa điểm, phong cách và hoạt động, hình ảnh được công cụ tạo ra sẽ độc đáo hơn.
Midjourney tạo ra 4 bức ảnh dựa trên mô tả, có thể nâng độ phân giải cho một ảnh bất kỳ. |
Ví dụ, một người nhập câu lệnh "Naruto universe futuristic" (Vũ trụ Naruto tương lai), phần mềm sẽ tạo ra ảnh nhân vật với trang phục, mái tóc giống Naruto với phông nền, màu sắc thiên về vũ trụ tương lai.
Với yêu cầu như "Dinosaurs in New York, cinematic, high detailed, realistic" (Những con khủng long ở New York, điện ảnh, chi tiết cao, chân thực), công cụ trả về loạt ảnh với màu sắc giống trong phim, hiệu ứng mờ phông.
Người dùng có thể nâng độ phân giải (upscale) một trong 4 ảnh bằng cách nhấn các nút "U1" đến "U4", hoặc tạo ra biến thể của một ảnh với nút "V1" đến V4".
Ảnh đơn sau khi nâng cấp có độ phân giải 1.024 x 1.024 pixel, có thể nhấn Upscale to Max để tiếp tục nâng lên độ phân giải cao nhất (1.664 x 1.664 pixel). Kết quả được gửi về trong khung chat. Cần lưu ý rằng chỉnh sửa ảnh cũng được tính vào 25 lần sử dụng miễn phí.
Midjourney có thể tạo ảnh dựa trên chủ thể, màu sắc, phong cách được mô tả. |
Midjourney không phải công cụ AI duy nhất có thể tạo ảnh dựa trên từ khóa. Một công cụ phổ biến khác mang tên Dall-E mini cũng có tác dụng tương tự. Tuy nhiên theo Digital Camera World, Dall-E mini cho ảnh khá giả tạo, giống như Photoshop. Trong khi đó, thuật toán của Midjourney tạo ra hình ảnh giống những bức tranh nghệ thuật hoặc siêu thực.
Tương tự các công cụ AI khác, Midjourney sử dụng hàng triệu hình ảnh để "học hỏi" nhằm đưa ra kết quả phù hợp. Tất nhiên, người dùng cần chú trọng từ ngữ. Trong một số trường hợp, hình ảnh cho ra bị mất chi tiết, không có vật thể hoặc cảnh vật không đúng mô tả.
Dù chưa hoàn hảo, Midjourney vẫn thu hút nhiều sự chú ý trên Internet nhờ tính cởi mở, độ sáng tạo không giới hạn.