Gemini vượt khỏi ranh giới chatbot

Thứ sáu, 22/5/2026 09:20 (GMT+7)
4 giờ trước

Các cải tiến xoay quanh Gemini cho thấy hướng đi mới của Google khi dồn trọng tâm từ giao diện chatbot sang tác nhân (agent) hoạt động liên tục.

CEO Sundar Pichai phát biểu tại Google I/O 2026. Ảnh: Android Central.

Tại hội nghị I/O 2026 diễn ra rạng sáng 20/5 (giờ Việt Nam), Google công bố phiên bản mới nhất của Gemini cùng mô hình AI mô phỏng thế giới vật lý mang tên Omni.

Theo CNET, sự kiện diễn ra trong bối cảnh Google chạy đua để bắt kịp tốc độ phát triển các mô hình AI, đồng thời cung cấp nhiều dịch vụ cho lượng người dùng khổng lồ.

I/O 2026 cũng là điểm nhấn khi thị trường tập trung vào mức định giá tăng vọt của OpenAI và Anthropic, cả 2 dự kiến phát hành cổ phiếu lần đầu ra công chúng (IPO) trong năm nay.

Gemini 3.5 Flash với tốc độ nhanh, tiết kiệm chi phí

Trọng tâm của Google vẫn xoay quanh hệ sinh thái Gemini. Tại sự kiện, công ty giới thiệu vào Gemini 3.5 Flash, phiên bản rút gọn nhưng vẫn đảm bảo hiệu quả với chi phí còn một nửa, thậm chí 1/3 so với các mô hình tiên tiến tương đương.

Trả lời phóng viên trước sự kiện, CEO Sundar Pichai chia sẻ Gemini 3.5 Flash "nhanh đến kinh ngạc". Google cho biết đây sẽ là mô hình mặc định trong Gemini và chế độ AI của Google Search trên toàn cầu.

"Bạn không còn phải đánh đổi chất lượng cho tốc độ nữa", thông báo của Google nhấn mạnh. Công ty cho biết khả năng bảo vệ tấn công mạng của Gemini 3.5 Flash được cải thiện, giảm tỷ lệ tạo nội dung độc hại và từ chối nhầm các câu lệnh bình thường.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 1

Gemini 3.5 Flash được tuyên bố cho hiệu quả cao với tốc độ đầu ra nhanh. Ảnh: Google.

Gemini 3.5 Flash được tối ưu cho các quy trình làm việc phức tạp mang tính tác nhân (agent). Theo Google, mô hình vượt trội hơn Gemini 3.1 Pro trên nhiều thang điểm, chẳng hạn như Terminal-Bench 2.1 (76,2% so với 70,3%) hay MCP Atlas (83,6% so với 78,2%).

Khi xem xét số lượng token đầu ra mỗi giây, Gemini 3.5 Flash nhanh gấp 4 lần so với một số mô hình mới khác. Theo Google, mô hình có thể rút ngắn thời gian hoàn tất một số tác vụ vốn trước đây mất nhiều ngày hoặc nhiều tuần với chi phí thấp hơn, tối ưu cho cả lập trình viên, doanh nghiệp, nhà khoa học và người dùng phổ thông.

"Để dễ hình dung, các công ty lớn đang xử lý khoảng 1.000 tỷ token mỗi ngày. Nếu chuyển dịch 80% khối lượng công việc đó sang 3.5 Flash, họ sẽ tiết kiệm được hơn 1 tỷ USD/năm, một nguồn vốn thực tế có thể tái đầu tư trực tiếp vào doanh nghiệp", Pichai nhấn mạnh.

Sau Gemini 3.5 Flash, Google tiết lộ Gemini 3.5 Pro đang được phát triển và sử dụng nội bộ, dự kiến ra mắt rộng rãi trong tháng 6.

Mở rộng Gemini

Ứng dụng Gemini cũng được thiết kế lại với ngôn ngữ Neural Expressive. Điểm mới đến từ Gemini Spark, tác nhân AI cá nhân hoạt động liên tục. Tính năng này vận hành dựa trên nền tảng Gemini 3.5, có thể kết nối trực tiếp với Gmail, Google Docs hay Slides.

Khác biệt của Gemini Spark đến từ khả năng chạy ngầm, có thể vận hành kể cả khi người dùng khóa điện thoại hay máy tính.

Một số công dụng của Spark như phân tích sao kê thẻ tín dụng hàng tháng để cảnh báo phí thuê bao hoặc chi phí ẩn, kiểm tra email để trích xuất và tổng hợp thông tin quan trọng, tóm tắt cuộc họp rồi viết lên Google Docs...

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 2

Những tính năng mới sắp có mặt trên ứng dụng Gemini. Ảnh: Google.

Trên Android, người dùng có thể theo dõi cập nhật trực tiếp và tiến độ thực hiện tác vụ của các tác nhân như Spark thông qua giao diện mới mang tên Android Halo, dự kiến ra mắt vào cuối năm nay.

Đến cuối mùa hè này, Spark cũng sẽ vận hành trực tiếp trong Chrome, biến trình duyệt trở thành agent hỗ trợ người dùng trên Internet.

Để đảm bảo quyền riêng tư, người dùng có thể không kích hoạt Gemini Spark, cũng như chọn các ứng dụng được kết nối. Tính năng này dự kiến được triển khai thử nghiệm từ cuối tháng 5 cho thuê bao Google AI Ultra tại Mỹ.

Daily Brief cũng là tính năng mới trên Gemini, có thể cung cấp bản tóm tắt cá nhân hóa vào mỗi buổi sáng. Các thông tin được tổng hợp từ email và lịch để tạo ra báo cáo ngắn gọn.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 3

Tính năng tóm tắt Daily Brief trong ứng dụng Gemini. Ảnh: Google.

Người dùng có thể yêu cầu loại thông tin cần ưu tiên, thậm chí hướng dẫn bước xử lý tiếp theo để AI vận hành. Hiện tại, Daily Brief mới hỗ trợ thuê bao AI Plus, Pro và Ultra tại thị trường Mỹ.

Google cũng tiết lộ một số cập nhật cho ứng dụng Gemini trên macOS, bao gồm tích hợp Gemini Spark để xử lý và tự động hóa các quy trình làm việc.

Hệ thống nhận diện giọng nói Rambler cũng được hỗ trợ trên phiên bản macOS, có thể loại bỏ các từ thừa để chuyển đổi giọng nói thành văn bản mượt mà hơn.

Sáng tạo video với Gemini Omni

Gemini Omni là mô hình mô phỏng thế giới vật lý. Trước đây, DeepMind đã phát triển một số mô hình tương tự, nhưng chỉ dùng trong lĩnh vực robot và game.

Với Omni, người dùng có thể kết hợp hình ảnh, âm thanh và văn bản để tạo ra video chất lượng cao, dựa trên nền tảng kiến thức về thế giới thực của Gemini.

Theo Google, Omni có thể áp dụng các định luật vật lý vào bối cảnh một cách chính xác, chẳng hạn như lực hấp dẫn, động năng và động lực học chất lưu. Nhờ kiến thức sẵn có từ Gemini, mô hình có khả năng dự đoán diễn biến tiếp theo.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 4

Một video tạo bởi Gemini Omni. Ảnh: Google.

Mô hình hỗ trợ chỉnh sửa bằng ngôn ngữ tự nhiên, bối cảnh luôn duy trì nhất quán qua mỗi lần chỉnh. Thông qua câu lệnh, người dùng có thể dễ dàng thêm nhân vật, chèn vật thể hoặc thay đổi khung cảnh.

Omni cũng hỗ trợ tạo avatar ảo với ngoại hình, giọng nói giống ngoài đời. Các video đều có ảnh chìm (watermark) SynthID để nhận biết nội dung tạo bởi AI.

Google cho biết phiên bản đầu tiên mang tên Gemini Omni Flash sẽ được triển khai trong ứng dụng Gemini, Flow và YouTube Shorts. Trong thời gian tới, mô hình này sẽ hỗ trợ đầu ra hình ảnh và âm thanh.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 5

Google nhấn mạnh khả năng mô phỏng chính xác thế giới vật lý của Gemini Omni. Ảnh: Google.

Về Google, chi phí đầu tư ngày càng lớn khiến Phố Wall đặt ra nhiều kỳ vọng. Theo CNET, giới đầu tư muốn thấy công ty tích hợp sâu AI vào các sản phẩm cốt lõi nhằm tạo ra lợi nhuận bền vững. Các công cụ tác nhân (agent) có thể đóng vai trò quan trọng.

Các agent thông minh như Spark hay Daily Brief là câu trả lời của Google. Thông qua sự kết hợp của Gemini 3.5 Flash tối ưu chi phí và Omni, hãng đang nỗ lực giữ vững vị thế trước các đối thủ cạnh tranh.

Không chỉ riêng Google, kỳ vọng dành cho các công ty AI tiếp tục tăng cao, đặc biệt sau khi Anthropic công bố Mythos. Mô hình này được tuyên bố mạnh đến mức có thể phát hiện hàng nghìn lỗ hổng bảo mật chưa từng thấy trong cơ sở hạ tầng phần mềm toàn cầu.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Không nhận ra Google

Tại Google I/O 2026, gã khổng lồ tìm kiếm cho thấy tham vọng rõ ràng khi đưa Gemini AI vào mọi công cụ, từ hộp tìm kiếm quen thuộc đến kính đeo mắt sắp ra mắt.

08:53 20/5/2026

Android sắp đổi mới

Google có kế hoạch biến Android thành "hệ thống AI" khi tích hợp sâu rộng Gemini vào nền tảng.

07:58 14/5/2026

Lý do ổ nhanh đầy khi dùng Google Chrome

Sau một bản cập nhật gần đây, Google Chrome âm thầm tải xuống 4 GB dữ liệu mô hình AI trực tiếp về máy tính mà không hề đưa ra bất kỳ cảnh báo nào.

11:56 7/5/2026

Phúc Thịnh

Google Gemini 3.5 Flash Google Gemini Spark Google Gemini Omni sự kiện I/O 2026 Gemini Omni là gì YouTube Google I/O 2026 Gemini 3.5 Gemini Spark Gemini Omni AI ChatGPT Claude trí tuệ nhân tạo tác nhân agent mô hình ra mắt tạo video