Bạn có thể chuyển sang phiên bản mobile rút gọn của Tri thức trực tuyến nếu mạng chậm. Đóng

AI của Google lại được nâng cấp

Mô hình Gemini 3 Flash có tốc độ cao và chi phí sử dụng thấp, hiệu quả không thua kém Gemini 3 Pro hay GPT-5.2.

Mô hình Gemini 3 Flash tập trung vào chi phí và hiệu quả xử lý. Ảnh: Bloomberg.

Google vừa ra mắt Gemini 3 Flash. Dựa trên Gemini 3, đây là mô hình AI với tốc độ cao và chi phí thấp, cạnh tranh các phiên bản GPT mới của OpenAI.

Gemini 3 Flash ra mắt 6 tháng sau khi Google giới thiệu Gemini 2.5 Flash. Các bài đánh giá điểm chuẩn (benchmark) cho thấy mô hình mới vượt trội bản tiền nhiệm, ngang ngửa các mô hình tiên tiến như Gemini 3 Pro và GPT-5.2 trên một số hạng mục.

Ví dụ, Google tuyên bố Gemini 3 Flash đạt 33,7% điểm trên bài kiểm tra Humanity’s Last Exam. Để so sánh, Gemini 3 Pro đạt 37,5%, Gemini 2.5 Flash đạt 11%, trong khi GPT-5.2 mới ra mắt đạt 34,5%.

Mô hình mới cũng đạt 81,2% trên thang đo suy luận MMMU-Pro, dành cho khả năng lập luận đa phương thức. Con số này cao hơn hầu hết mô hình của đối thủ.

Phát hành sớm cho người dùng

Google cho biết Gemini 3 Flash sẽ là mô hình mặc định trong ứng dụng Gemini, thay thế phiên bản 2.5 Flash. Người dùng vẫn có thể chuyển sang Gemini 3 Pro cho những tác vụ phức tạp hơn, chẳng hạn như hỏi về toán học hay lập trình.

Gemini 3 Flash cũng được đánh giá cao về khả năng xử lý nội dung đa phương thức. Ví dụ, người dùng có thể cung cấp video chơi pickleball rồi yêu cầu phân tích kỹ thuật, vẽ phác thảo để đoán hình, hoặc tải file ghi âm để công cụ phân tích, tạo bảng câu hỏi.

Google Gemini 3 Flash,  Google Gemini 3 Pro,  Gemini 3 la gi,  ra mat Gemini 3,  mo hinh AI anh 1

Khả năng phân tích nội dung video của Gemini 3 Flash. Ảnh: Google.

"Nhờ khả năng lập luận đa phương thức mạnh mẽ của Gemini 3 Flash, bạn có thể sử dụng công cụ để tiếp nhận, phân tích và xử lý nhiều loại thông tin với tốc độ nhanh chóng.

Chẳng hạn, bạn có thể yêu cầu Gemini phân tích video/hình ảnh và chuyển nội dung thành một kế hoạch chi tiết, có thể áp dụng ngay trong vài giây", thông báo của Google nhấn mạnh.

Khi sử dụng AI Mode, Gemini 3 Flash cũng có khả năng hiểu rõ hơn ý đồ trong câu lệnh, từ đó đưa ra phản hồi trực quan kèm ảnh minh họa hay bảng biểu. Người dùng có thể lập trình theo cảm hứng (vibe-coding) để tạo ứng dụng trong Gemini nhờ công cụ Opal.

Phục vụ lập trình hiệu quả hơn

Với nhà phát triển, Google đang cung cấp Gemini 3 Flash dưới dạng thử nghiệm thông qua Gemini AI trong AI Studio và Antigravity, công cụ lập trình tích hợp tác nhân (agent).

Google nhấn mạnh khả năng phục vụ lập trình của Gemini 3 Flash. Mô hình này đạt 78% trên SWE-bench Verified, thang đo dùng để đánh giá các agent lập trình, cao hơn Gemini 3 Pro và chỉ xếp sau GPT-5.2.

"Khả năng mạnh mẽ của Gemini 3 Flash trong suy luận, sử dụng công cụ và xử lý đa phương thức là lựa chọn lý tưởng cho các nhà phát triển muốn thực hiện tác vụ phức tạp như phân tích video, trích xuất dữ liệu và hỏi đáp bằng hình ảnh", Google cho biết.

Chi phí của Gemini 3 Flash được thiết kế tối ưu với 0,5 USD/1 triệu token đầu vào, và 3 USD/1 triệu token đầu ra. Nếu dữ liệu đầu vào sử dụng âm thanh, chi phí giữ nguyên ở 1 USD/1 triệu token.

Mức giá này cao hơn đôi chút so với Gemini 2.5 Flash (lần lượt 0,3 USD2,5 USD). Tuy nhiên, Google tuyên bố mô hình này hoạt động tốt hơn Gemini 2.5 Pro, tốc độ nhanh gấp 3 lần.

Google Gemini 3 Flash,  Google Gemini 3 Pro,  Gemini 3 la gi,  ra mat Gemini 3,  mo hinh AI anh 2

Hiệu quả của Gemini 3 Flash trên một số thang đo. Ảnh: Google.

Với những tác vụ suy luận, Gemini 3 Flash dùng ít hơn 30% token so với 2.5 Pro, về lý thuyết giúp người dùng tiết kiệm chi phí với một số yêu cầu nhất định.

Từ khi ra mắt Gemini 3, Google cho biết đã xử lý hơn 1.000 tỷ token mỗi ngày trên nền tảng API do công ty cung cấp. Người dùng thường sử dụng Gemini 3 cho những tác vụ vibe-coding, thiết kế trò chơi tương tác và phân tích nội dung đa phương thức.

Giới công nghệ đánh giá Gemini 3 là đối trọng lớn với GPT-5. Đầu tháng 12, CEO OpenAI Sam Altman được cho đã gửi "báo động đỏ" đến các nhân viên khi lưu lượng truy cập ChatGPT giảm sút. OpenAI nhanh chóng ra mắt GPT-5.2 và mô hình tạo ảnh mới.

Tuy không trực tiếp đề cập đến OpenAI, Google cho biết việc ra mắt mô hình mới khiến tất cả công ty trên thị trường phải hoạt động tích cực.

"Điều đang xảy ra trên toàn ngành là tất cả mô hình vẫn tốt, cạnh tranh và thúc đẩy lẫn nhau. Các công ty đang tích cực phát hành những mô hình này", Tulsee Doshi, Giám đốc Sản phẩm Gemini Models, trả lời trang tin TechCrunch.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Phúc Thịnh

Bạn có thể quan tâm