Google DeepMind và OpenAI đã giành huy chương vàng tại Olympic toán học, nhưng những thiếu niên người Mỹ trong đội tuyển vẫn đạt điểm cao hơn hai cỗ máy này.

IMO 2025 được tổ chức từ ngày 10-20/7, tại thành phố Sunshine Coast, bang Queensland, Australia, với 630 thí sinh tham dự. Trong số đó, 67 thí sinh (khoảng 11%) đã đạt được huy chương vàng. Việc AI cũng đạt được thành tích tương tự là một cột mốc lịch sử.

Đây là năm đầu tiên cuộc thi IMO chính thức phối hợp với một số nhà phát triển AI. Các giám khảo IMO đã xác nhận kết quả của các công ty hợp tác, bao gồm Google, và yêu cầu họ công bố kết quả vào ngày 28/7.

Tuy nhiên, kết quả chung cuộc cho thấy những cỗ máy tiên tiến và hiện đại nhất vẫn bị đánh bại bởi những thiếu niên sáng giá nhất thế giới.

Bức tường cuối của nhân loại?

Kỳ thi IMO nổi tiếng khắc nghiệt được tổ chức trong hai ngày. Mỗi ngày trôi qua, học sinh phải giải 3 bài toán ngày càng tăng trong vòng hơn 4 giờ. Các câu hỏi bao gồm đại số, hình học, lý thuyết số và tổ hợp.

Vì những vấn đề vừa phức tạp vừa phi truyền thống, bài kiểm tra toán học hàng năm đã trở thành một công cụ hữu ích để đo lường tiến bộ của AI từ năm này sang năm khác. Trong thời đại phát triển nhanh chóng, các phòng thí nghiệm nghiên cứu hàng đầu mơ ước một ngày các hệ thống của họ đủ mạnh để đạt tiêu chuẩn huy chương vàng IMO.

Dù tham vọng này đã thành hiện thực khi AI của Google và OpenAI đã đạt huy chương vàng, điều đáng chú ý là có tới 26 học sinh đạt điểm cao hơn.

Trong số này, có 4 ngôi sao của đội tuyển Mỹ, bao gồm Qiao Zhang, người từng hai lần giành huy chương vàng và Alexander Wang, thí sinh đã mang huy chương vàng thứ 3 liên tiếp về New Jersey. Với thành tích này, Wang trở thành một trong những nhân vật toán học trẻ xuất sắc mọi thời đại, và vẫn có thể giành thêm một huy chương vàng nữa tại IMO vào năm tới.

Đội tuyển Mỹ tại Olympic Toán quốc tế 2025. Ảnh: WSJ.

Trả lời tờ WSJ, Zhang cho biết dành thời gian dài nhất trong kỳ thi cho bài toán số 6. Đây là một bài toán trong lĩnh vực tổ hợp nổi tiếng với độ khó không tưởng, bao gồm nhánh toán học liên quan đến việc đếm, sắp xếp và kết hợp các đối tượng rời rạc.

Lời giải cho bài toán này đòi hỏi sự khéo léo, sáng tạo và trực giác mà con người có thể phát huy nhưng máy móc thì không thể, hoặc ít nhất là chưa. "Tôi thực sự sẽ hơi sợ nếu các mô hình AI có thể giải Bài toán số 6", Zhang nói.

Bài toán số 6 đã làm khó các mô hình của DeepMind và OpenAI, nhưng nó không chỉ gây khó khăn cho AI. Trong số 630 thí sinh, 569 người cũng nhận được điểm 0. Chỉ 6 người nhận được điểm tuyệt đối là 7 điểm. Zhang tự hào về giải pháp một phần của mình đã giành được 4 điểm, nhiều hơn so với hầu hết thí sinh khác.

Với sự tiến bộ không ngừng, đã có nhiều ý kiến cho rằng AI có thể đang "hủy diệt" con người trong toán học. Tuy nhiên, Junehyuk Jung không nghĩ vậy.

Từng giành huy chương vàng IMO, Jung hiện là phó giáo sư tại Đại học Brown và nhà nghiên cứu thỉnh giảng tại DeepMind. Tuy nhiên, ông không tin đây là trận chiến cuối cùng của nhân loại. Theo Jung, những vấn đề như Bài toán số 6 sẽ làm khó AI ít nhất một thập kỷ nữa.

"Có những điều AI sẽ làm rất tốt. Tuy nhiên, vẫn sẽ có những thứ mà con người có thể làm tốt hơn", Jung nhận xét.

Cuộc đua vàng của làng toán học

Năm 2021, sinh viên có tên Alexander Wei là một phần của nghiên cứu yêu cầu anh dự đoán khả năng về toán học của AI vào tháng 7/2025. Khi xem xét các dự báo khác, Wei nghĩ điều này là quá lạc quan.

Tuy nhiên, cựu sinh viên này giờ đây lại là bằng chứng sống về việc bản thân đã sai lầm đến mức nào. Wei chính là nhà khoa học nghiên cứu đã dẫn dắt dự án IMO cho OpenAI. Điều ấn tượng hơn là cách chúng làm điều đó.

Không chỉ OpenAI, Google cũng gọi kết quả tại IMO 2025 là một tiến bộ lớn. Năm 2024, mô hình AI cần các bài toán phải được dịch sang ngôn ngữ lập trình máy tính để chứng minh toán học.

Chỉ sau một năm, các hệ thống này đã hoạt động hoàn toàn bằng "ngôn ngữ tự nhiên" mà không cần bất kỳ sự can thiệp nào của con người. DeepMind cũng hoàn thành kỳ thi trong giới hạn thời gian 4 tiếng rưỡi của IMO. Để so sánh, năm 2024, hệ thống này phải mất đến vài ngày tính toán để tìm ra lời giải.

Nhiều người có thể nghĩ về AI như một đối thủ cạnh tranh. Mặc dù vậy, người đứng sau các mô hình lại xem chúng là những công cụ bổ sung.

Kết quả chung cuộc tại Olympic Toán quốc tế 2025. Ảnh: WSJ.

"Đây có lẽ có thể là một máy tính mới, thứ sẽ thúc đẩy thế hệ các nhà toán học tiếp theo", TS Lương Minh Thắng, nhà nghiên cứu cao cấp tại Google (Mỹ) nói.

Ba tuần trước, nhóm của TS Minh Thắng phát triển thành công phiên bản AlphaGeometry 2. Điểm nổi bật nhất của phiên bản lần này là trình độ giải Toán vượt qua các thí sinh đạt huy chương vàng Olympic Toán quốc tế (IMO) về giải Toán hình học.

“Các bạn trình độ huy chương vàng IMO giải được 40/50 bài toán thì AlphaGeometry 2 sẽ giải được 42/50 bài”, TS Thắng vui mừng chia sẻ.

Năm ngoái, mô hình này chỉ đạt được huy chương bạc. Năm nay, Google sử dụng mô hình đa năng Gemini Deep Think (một phiên bản từng được giới thiệu tại hội nghị nhà phát triển vào tháng 5).

Đáng chú ý, theo WSJ, trước khi cuộc thi bắt đầu, nhóm của TS Thắng vẫn đang thực hiện các điều chỉnh. Ban đầu, TS Thắng chỉ kỳ vọng mô hình của DeepMind giải quyết được cả 3 bài toán trong ngày đầu tiên

Sự đơn giản, thanh lịch và khả năng đọc hiểu tuyệt vời của những giải pháp đó đã làm kinh ngạc các nhà toán học. Ngày hôm sau, ngay khi Thắng và các đồng nghiệp phát hiện hệ thống AI đã giải được thêm 2 bài nữa, đó cũng là lúc họ nhận ra rằng hoàn toàn có thể giành huy chương vàng.

Kết quả, AI DeepMind giải thành công 5/6 bài toán. Đáng chú ý, chúng đều sử dụng các mô hình lý luận thực nghiệm, xử lý các khái niệm toán học bằng ngôn ngữ tự nhiên, khác hẳn với những cách tiếp cận phức tạp mà các công ty AI từng dùng trước đây.