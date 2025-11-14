Trong bối cảnh cạnh tranh AI tăng cao, Baidu vừa ra mắt mô hình mới, được cho là ngang bằng hoặc vượt trội hơn các đối thủ nền tảng từ Mỹ.

Baidu nói AI của họ tốt hơn ChatGPT, Gemini. Ảnh: Baidu.

Tại sự kiện Baidu World 2025, gã khổng lồ Trung Quốc Baidu đã công bố mô hình nền tảng thế hệ tiếp theo của mình, cùng loạt nâng cấp sản phẩm AI và kế hoạch mở rộng quốc tế. Theo đó, ERNIE 5.0 là mô hình độc quyền, có khả năng xử lý và tạo nội dung trên nhiều định dạng như văn bản, hình ảnh, âm thanh và video.

Mục tiêu của tập đoàn là trở thành một đối thủ toàn cầu trong thị trường AI ngày càng cạnh tranh. ERNIE 5.0 chỉ ra mắt vài giờ sau khi OpenAI nâng cấp mô hình nền tảng chủ lực từ GPT-5 lên GPT-5.1, hứa hẹn giảm lượng token tiêu thụ và cải thiện trải nghiệm tương tác với nhiều tùy chọn con người hơn.

ERNIE-4.5-VL-28B-A3B-Thinking, mô hình mã nguồn mở gần đây phát hành theo giấy phép Apache 2.0 thân thiện với doanh nghiệp, người dùng chỉ có thể truy cập chatbot mới thông qua trang web ERNIE Bot của Baidu và API nền tảng đám mây Qianfan dành cho khách hàng tổ chức.

Biến thể của mô hình là ERNIE 5.0 Preview 1022, được tối ưu cho các tác vụ nặng về văn bản, bên cạnh phiên bản xem trước tổng quát có khả năng cân bằng giữa nhiều dạng dữ liệu. Ngoài ra, Baidu cũng giới thiệu hàng loạt nâng cấp quan trọng cho nền tảng “digital human”, các công cụ no-code và tác nhân AI đa năng.

ERNIE 5.0 đánh dấu sự chuyển dịch trong cách triển khai trí tuệ nhân tạo ở quy mô lớn, hướng đến mục tiêu mở rộng dấu ấn AI ra ngoài thị trường Trung Quốc. “Việc nội hóa AI sẽ trở thành một năng lực tự thân và biến trí tuệ nhân tạo từ một khoản chi phí thành thành một nguồn năng suất”, CEO Robin Li phát biểu.

ERNIE 5.0 cho thấy sự vượt trội về khả năng hiểu đồ thị, tài liệu. Ảnh: Baidu.

Các kết quả kiểm tra cho thấy ERNIE 5.0 đã đạt mức gần hoặc ngang bằng các mô hình nền tảng hàng đầu của phương Tây trên một loạt tác vụ đa dạng. ERNIE 5.0 Preview vượt trội hoặc ngang ngửa với GPT-5-High của OpenAI và Gemini 2.5 Pro của Google ở các bài kiểm tra về lập luận đa phương thức, hiểu tài liệu và hỏi đáp dựa trên hình ảnh.

Đồng thời, mô hình thể hiện năng lực mạnh mẽ trong ngôn ngữ và thực thi mã. Công ty nhấn mạnh khả năng xử lý kết hợp đầu vào-ra đa phương thức trong cùng một mô hình, thay vì ghép nối các chế độ dữ liệu sau xử lý, được đội ngũ xem là yếu tố khác biệt về mặt kỹ thuật.

Về tác vụ hình ảnh, ERNIE 5.0 đạt điểm số dẫn đầu trên OCRBench, DocVQA và ChartQA, 3 bộ benchmark đánh giá khả năng nhận diện tài liệu, hiểu nội dung và lập luận với dữ liệu có cấu trúc. Baidu cho biết mô hình đã vượt qua cả GPT-5-High và Gemini 2.5 Pro ở những bài kiểm tra liên quan đến tài liệu và biểu đồ.

Trong mảng tạo ảnh, ERNIE 5.0 đạt kết quả ngang bằng hoặc vượt Google Veo3 ở các hạng mục như độ khớp ngữ nghĩa và chất lượng hình ảnh, theo đánh giá nội bộ của Baidu. Khả năng tích hợp đa phương thức của mô hình giúp tạo và diễn giải nội dung thị giác với mức độ thấu hiểu ngữ cảnh cao.

ERNIE 5.0 được định vị với mức chi phí và phân khúc tương đương các mô hình cao cấp khác từ những đối thủ Trung Quốc như Alibaba. Nó cao hơn sản phẩm trước đó như ERNIE 4.5 Turbo. Tuy nhiên, so với các mô hình từ Mỹ, mức giá của chatbot vẫn nằm ở nhóm tầm trung.

Theo Venturebeat, điều này cho thấy chiến lược của Baidu muốn tách biệt rõ giữa các mô hình giá rẻ, phục vụ lưu lượng lớn, và các mô hình năng lực cao dành cho tác vụ phức tạp và lập luận đa phương thức.