Dẫn đầu trong các bản xếp hạng quan trọng, Gemini 2.5 Pro có nhiều cải tiến vượt trội so với phiên bản cũ, cũng như các chatbot AI khác trên thị trường hiện nay.

Cuối tuần qua, Google bất ngờ cung cấp bản thử nghiệm của Gemini 2.5 Pro, mô hình mới và thông minh nhất của công ty, cho tất cả người dùng Gemini. Trước đó, mô hình này chỉ dành cho người dùng gói Gemini Advanced, với giá 20 USD /tháng.

Gemini 2.5 Pro tích hợp các khả năng tư duy thay vì cung cấp riêng biệt. Mặc dù là phiên bản thử nghiệm, mô hình này đã hỗ trợ một số tính năng như ứng dụng/tiện ích mở rộng, tải tệp lên và cả Canvas.

Trong bảng xếp hạng uy tín AI là LMArena, Gemini 2.5 Pro đang dẫn đầu. Mô hình này cũng đạt thành tích tốt nhất trong các bài kiểm tra toán học (AIME 2025) và khoa học (GPQA diamond) mà không cần đến các kỹ thuật kiểm tra tốn kém.

Bản dùng thử của Gemini 2.5 Pro được cung cấp cho toàn bộ người dùng miễn phí. Ảnh: Google.

Đột phá trong lập trình

Google nhận định rằng so với phiên bản 2.0, Gemini 2.5 Pro là một “bước nhảy vọt”. Mô hình này đạt điểm số 18,8%, cao nhất trong số các mô hình không sử dụng công cụ bên ngoài trong bài kiểm tra Humanity’s Last Exam, bộ dữ liệu do hàng trăm chuyên gia thiết kế nhằm đánh giá giới hạn tri thức và tư duy của con người.

Phiên bản này cũng vượt trội hơn trong việc tạo ra các ứng dụng web trực quan và mã hoá tự động, đạt 63,8% trong bài kiểm tra lập trình tự động SWE-Bench, cao hơn rất nhiều so với Gemini 2.0 và các mô hình cạnh tranh nổi bật như OpenAI o3-mini, Grok 3 Beta.

Thông số đánh giá của Gemini 2.5 Pro so với các chatbot thông minh nhất hiện nay. Ảnh: Google.

Ngoài ra, cửa sổ ngữ cảnh của Gemini 2.5 Pro hiện tại đã rất lớn với 1 triệu token, tương đương 700 trang tài liệu, nay sắp được mở rộng lên gấp đôi. Xếp hạng thứ hai là Claude với 200.000 token.

Điều này nghĩa là mô hình có thể hiểu được các tập dữ liệu khổng lồ và xử lý các vấn đề phức tạp từ nhiều nguồn thông tin khác nhau, bao gồm văn bản, âm thanh, hình ảnh, video và thậm chí cả kho mã nguồn.

Theo ông Theo Browne, YouTuber và CEO của Ping Labs, với cửa sổ ngữ cảnh lớn như vậy, bộ xử lý của mô hình có thể chứa gần như toàn bộ mã nguồn của một dự án phần mềm nhỏ.

Các nhà sáng tạo nội dung đã thử thách Gemini 2.5 Pro bằng nhiều nhiệm vụ hóc búa như tạo web, trò chơi chỉ bằng một câu lệnh.

Tích hợp đa ứng dụng

Không chỉ hỗ trợ dân lập trình, Gemini 2.5 Pro sẽ trở thành công cụ đắc lực cho người làm sáng tạo nội dung và thiết kế. Mô hình làm tốt hơn với tác vụ tạo video, âm thanh, hình ảnh, và còn tích hợp Canvas, tính năng giúp AI vẽ sơ đồ, thiết kế UI và đề xuất ý tưởng concept.

Ứng dụng nhiều nhất của mô hình có lẽ là trong lĩnh vực giáo dục với khả năng lưu trữ lớn, xử lý nhiều tài liệu một cách không gián đoạn. Học sinh, sinh viên có thể cá nhân hoá lộ trình học tập của bản thân, cũng như tạo hình ảnh, video sinh động cho phần thuyết trình.

Hiện tại, Gemini 2.5 Pro đã được hỗ trợ ngay trên trình duyệt gemini.google.com và Google AI Studio. Trong thời gian tới, mô hình sẽ được tích hợp vào Vertex AI, nền tảng cao cấp của Google Cloud, giúp doanh nghiệp triển khai và quản lý mô hình AI trên quy mô lớn.

Tại Việt Nam, người dùng đang tranh cãi về khả năng lập trình của Gemini. Ông Doãn Kiên, Nhà sáng lập công ty truyền thông Seodo, cho rằng Gemini 2.5 Pro hiện tại đang ở vị trí dẫn đầu. Tuy nhiên, bài viết của ông đã nhận nhiều bình luận phản đối, cho rằng Claude mới xứng đáng ở vị trí đó.

So sánh khả năng của các chatbot AI. Ảnh: Peter Yang/X

Trong thời gian tới, Google sẽ tập trung vào cải thiện khả năng lập trình của Gemini 2.5 Pro. Mặc dù chưa có thời điểm kết thúc bản dùng thử cũng như công bố chính sách giá, nhiều người dùng dự đoán rằng tới giai đoạn chính thức, Gemini 2.5 Pro sẽ có chi phí sử dụng đắt hơn các mô hình khác, nhưng sẽ đi kèm với nhiều lựa chọn linh hoạt.