Bạn có thể chuyển sang phiên bản mobile rút gọn của Tri thức trực tuyến nếu mạng chậm. Đóng

Google giải được bài toán khó nhất của AI tạo ảnh

Mô hình Nano Banana Pro của Google hỗ trợ tạo infographic, slide thuyết trình và chỉnh sửa ảnh thông minh hơn, đặc biệt là không còn lỗi với chữ, văn bản.

Màn hình giới thiệu Nano Banana Pro.

Google vừa ra mắt Nano Banana Pro, mô hình tạo và chỉnh sửa ảnh mới nhất. Đây là mô hình AI tiếp theo được công ty giới thiệu trong tuần này sau Gemini 3.

Nano Banana Pro được phát triển dựa trên Gemini 3 Pro. Google nhấn mạnh đây là “mô hình chỉnh sửa ảnh tân tiến nhất” mà công ty từng ra mắt. Các cải tiến của mô hình xoay quanh khả năng chỉnh sửa ảnh, tạo chữ cái dễ đọc và duy trì nhất quán trong thiết kế.

Tạo ảnh thông minh và đẹp hơn

Người dùng có thể trải nghiệm Nano Banana Pro trong ứng dụng Gemini (chọn chức năng Tạo hình ảnh > Tư duy). Tài khoản miễn phí được sử dụng mô hình với số lượt giới hạn, sau đó chuyển về phiên bản cũ.

Ứng dụng ghi chú NotebookLM cũng sẽ tích hợp Nano Banana Pro, bên cạnh các sản phẩm cho nhà phát triển, doanh nghiệp và nhà sáng tạo nội dung của Google.

Tại Mỹ, người dùng gói AI Pro và AI Ultra có thể trải nghiệm Nano Banana Pro trong chế độ AI của Google Search. Ngoài ra, mô hình mới cũng được tích hợp vào một số ứng dụng thiết kế phổ biến như Canva, Figma và Photoshop.

Google Gemini 3,  Google Nano Banana Pro,  Gemini 3 la gi,  Nano Banana la gi anh 1

Khả năng tạo biểu đồ trực quan từ dữ liệu có sẵn của Nano Banana Pro. Ảnh: Google.

Google cho biết với khả năng lập luận nâng cao của Gemini 3, Nano Banana Pro hỗ trợ tạo ảnh minh họa với nội dung trực quan, font chữ dễ đọc hơn.

Ví dụ, công nghệ này có thể chuyển văn bản công thức nấu ăn sang biểu đồ minh họa, hoặc trực quan hóa các thông tin thời gian thực như thời tiết hoặc thể thao.

Tạo văn bản là một trong những cải tiến được Google nhấn mạnh trên Nano Banana Pro. So với phiên bản trước, mô hình này có thể tạo văn bản chính xác, dễ đọc, hỗ trợ dịch sang nhiều ngôn ngữ.

Người dùng thậm chí có thể tạo văn bản kèm hiệu ứng và bố cục đặc biệt, phù hợp dùng trong thiết kế bài viết, poster quảng cáo.

Google Gemini 3,  Google Nano Banana Pro,  Gemini 3 la gi,  Nano Banana la gi anh 2

Nano Banana Pro hỗ trợ tạo văn bản với font dễ đọc, kèm hiệu ứng đặc biệt. Ảnh: Google.

Nano Banana Pro cũng cải thiện tính nhất quán trong thiết kế. Theo Google, người dùng có thể cung cấp tối đa 14 hình ảnh khác nhau rồi yêu cầu mô hình sắp xếp theo yêu cầu, đồng thời giữ nguyên các đặc điểm của tối đa 5 ảnh. Công cụ vẫn giữ lại diện mạo, thần thái của bạn bè, gia đình và thú cưng bất kể thay đổi kiểu tóc hay trang phục.

Người dùng có thể yêu cầu sửa các chi tiết trong ảnh có sẵn, thay đổi góc chụp, tỷ lệ, chỉnh màu, vị trí lấy nét và kể cả ánh sáng, như thể đang chụp trực tiếp bằng máy ảnh.

Google nhấn mạnh hình ảnh tạo bởi Nano Banana được gắn nhãn SynthID ẩn để nhận diện nội dung AI. Trên phiên bản mới, Gemini cho phép tải ảnh và hỏi xem hình ảnh có được tạo bởi Google AI không. Hãng có kế hoạch mở rộng tính năng sang âm thanh và video trong tương lai.

Bên cạnh SynthID, ảnh tạo bởi mô hình của Google vẫn có dấu mờ (watermark) khi dùng gói miễn phí hoặc Google AI Pro. Watermark sẽ được xóa cho thuê bao AI Ultra.

Giành lợi thế cạnh tranh

Từ khi ra mắt lần đầu vào tháng 8, Nano Banana thu hút sự quan tâm nhờ khả năng tạo ảnh thú cưng, con người và phong cảnh với độ chân thực cao.

Hồi tháng 9, Josh Woodward, Phó chủ tịch Google Labs và Gemini, cho biết Nano Banana giúp ứng dụng Gemini thu hút thêm 13 triệu người dùng trong 4 ngày.

Google Gemini 3,  Google Nano Banana Pro,  Gemini 3 la gi,  Nano Banana la gi anh 3

Nano Banana Pro hỗ trợ kết hợp nhiều yếu tố thành một ảnh hoàn chỉnh. Ảnh: Google.

Trả lời phỏng vấn CNBC, Woodward cho biết Nano Banana Pro có khả năng hoạt động tốt hơn phiên bản gốc. Ông nhấn mạnh những đặc điểm như tạo infographic, slide thuyết trình và đảm bảo sự nhất quán giữa các hình ảnh.

Google đang tìm cách giành lợi thế trước OpenAI trong cuộc đua AI tạo sinh, vốn đã bùng nổ từ khi ChatGPT ra mắt năm 2022.

Tuần trước, OpenAI công bố phiên bản GPT-5.1, tập trung cải thiện khả năng tương tác với người dùng. Trên App Store Mỹ, ChatGPT đang đứng đầu danh sách ứng dụng miễn phí, trong khi Gemini xếp thứ 2.

Khi ra mắt Gemini 3, Google công bố ứng dụng Gemini có hơn 650 triệu người dùng/tháng, và AI Overviews có 2 tỷ người dùng/tháng. Hồi tháng 10, CEO Sam Altman của OpenAI cho biết ChatGPT đạt 800 triệu người dùng/tuần.

Google Gemini 3,  Google Nano Banana Pro,  Gemini 3 la gi,  Nano Banana la gi anh 4

Tính năng nhận diện ảnh tạo bởi AI trên Gemini. Ảnh: Google.

Trả lời CNBC, Woodward cho biết nhu cầu sử dụng sản phẩm AI của Google ngày càng tăng. Nhiều người đăng ký các gói Gemini để tăng giới hạn sử dụng mô hình tiên tiến.

“Chúng tôi ghi nhận lượng lớn người dùng đăng ký các sản phẩm này. Đây là vấn đề nan giải bởi nhu cầu rất lớn, và chúng tôi đang tìm cách đáp ứng nó”, Woodward nhấn mạnh.

Đại diện Google tiết lộ công ty đang tiếp tục mở rộng các dịch vụ AI. Một số ứng dụng đang thử nghiệm gồm công cụ làm phim Flow và mô hình tạo thế giới ảo Genie.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Ngôi vương AI đổi chủ

Mô hình Gemini 3 Pro mới nhất từ Google cải thiện khả năng lập luận, viết mã và ít "tâng bốc" hơn. Một số bình luận thậm chí so sánh đây là "vua AI" mới.

Nghich ly khi Apple mat nguoi hinh anh

Nghịch lý khi Apple mất người

0

Phó Chủ tịch UI của Apple từ năm 2015 chuẩn bị rời vị trí. Tuy nhiên, nội bộ công ty tỏ ra phấn khích trước sự rời đi này, cũng như người kế nhiệm ông.

iPhone gia re ro ri nang cap moi hinh anh

iPhone giá rẻ rò rỉ nâng cấp mới

0

Màn hình của iPhone 17e được cho là gần như tương đồng với iPhone 16e, với nâng cấp là tấm nền OLED sẽ có viền mỏng hơn.

Bao tang Vu tru don 10.000 khach tham quan hinh anh

Bảo tàng Vũ trụ đón 10.000 khách tham quan

0

Công nghệ trình chiếu hiện đại góp phần quan trọng trong việc biểu diễn trực quan khoa học vũ trụ, giúp Bảo tàng Vũ trụ Việt Nam hút khách trong 2 tháng thử nghiệm.

Phúc Thịnh

Bạn có thể quan tâm