Bạn có thể chuyển sang phiên bản mobile rút gọn của Tri thức trực tuyến nếu mạng chậm. Đóng

'Vua YouTube' một thời tuyên bố tạo AI vượt ChatGPT, DeepSeek

PewDiePie thu hút sự chú ý khi tuyên bố mô hình AI tự huấn luyện của mình có khả năng đánh bại cả GPT-4 và DeepSeek 2.5 trong các bài kiểm tra hiệu năng.

PewDiePie đã dành nhiều tháng để huấn luyện AI. Ảnh: PewDiePie/YouTube.

YouTuber gaming nổi tiếng nhất thế giới PewDiePie mới đây đã khiến người hâm mộ và giới chuyên gia ngạc nhiên khi lấn sân sang lĩnh vực phát triển phần mềm. Nam YouTuber đã dành nhiều tuần để nghiên cứu và tinh chỉnh (fine-tune) một mô hình ngôn ngữ lớn (LLM) dựa trên mã nguồn mở.

Thay vì xây dựng từ con số 0, PewDiePie đã sử dụng mô hình mã nguồn mở "Qwen 2.5" để tinh chỉnh. Mục tiêu của anh là tự học cách huấn luyện AI và thử thách giới hạn của bản thân so với các sản phẩm thương mại hàng đầu.

Trong một video được tải lên mới đây, PewDiePie khẳng định mô hình AI của anh đã có thời điểm đạt được số điểm cao hơn đáng kể so với ChatGPT (GPT-4) của OpenAI hay Deepseek 2.5 trong các bài kiểm tra tiêu chuẩn (benchmarks).

Để đánh giá năng lực, anh sử dụng bài kiểm tra có tên “Aider Polyglot”. Tại đây, các AI danh tiếng như DeepSeek 2.5 hay Llama 4 Maverick của Meta chỉ đạt điểm số hơn 18%. Ban đầu, mô hình của PewDiePie chỉ đạt 8%, nhưng sau khi thay đổi định dạng dữ liệu, con số này đã tăng lên 16%.

Quyết không dừng lại, nam YouTuber đã thu thập khoảng 100.000 mẫu dữ liệu (bao gồm bài toán và lời giải) từ GitHub và các nguồn công khai. Anh còn áp dụng kỹ thuật "suy luận" (reasoning) với 15.000 mẫu bổ sung để ép AI phải tư duy từng bước trước khi trả lời.

Kết quả ban đầu gây ngạc nhiên, khi mô hình đạt tới 19,6%, chính thức vượt qua GPT-4 vào thời điểm tháng 11. Tuy nhiên, PewDiePie sớm phát hiện ra sai sót khi dữ liệu huấn luyện bị trùng với câu hỏi kiểm tra, dẫn đến kết quả "ảo". Anh quyết định hủy bỏ kết quả và làm lại từ đầu.

Sau khi sửa lỗi và chuyển sang phiên bản AI chuyên dụng cho lập trình, điểm số của mô hình đã có sự bứt phá ngoạn mục qua từng giai đoạn tinh chỉnh. Từ mức khởi điểm thấp kỷ lục chỉ 4,4%, con số này đã vọt lên 25% ngay sau khi anh thực hiện các điều chỉnh cần thiết.

Hiệu suất tiếp tục chạm mốc 36% khi hệ thống được chạy đầy đủ các bài kiểm tra trên những ngôn ngữ lập trình phổ biến. Cuối cùng, hành trình huấn luyện khép lại ở con số ấn tượng 39,1% sau khi PewDiePie bổ sung thêm 1.500 mẫu dữ liệu chuyên sâu vào giai đoạn hậu huấn luyện.

Dù kết quả 39,1% là rất cao, ngay khi anh hoàn thành, phiên bản Qwen 3 mới ra mắt đã đạt mốc 40%, khiến thành quả của anh lại một lần nữa bị bám đuổi sát sao.

Để đạt được những con số ấn tượng trên, PewDiePie cũng đã phải trả giá không nhỏ. Nam YouTuber tiết lộ tổng số tiền đầu tư cho hệ thống máy tính tự lắp ghép phục vụ dự án này lên tới 20.000 USD (khoảng 500 triệu đồng).

Do hệ thống tiêu thụ hơn 2.000W điện để duy trì, anh đã liên tục gặp sự cố cháy dây nguồn và suýt cháy nhà. Thậm chí, một chiếc card đồ họa đắt tiền đã bị hỏng hoàn toàn, trong khi máy tính thường xuyên rơi vào tình trạng đình trệ do quá tải nhiệt.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Ưu tiên dùng camera AI, drone ‘made in Vietnam’

Năm 2026 được xác định là năm tăng tốc chuyển đổi số quốc gia, với mục tiêu thương mại hóa thành công tối thiểu 5 sản phẩm thuộc danh mục công nghệ chiến lược.

Nghiên cứu gây chấn động giới công nghệ

Một báo cáo lan truyền từ công ty nghiên cứu đầu tư làm dấy lên những lo ngại mới về tác động của AI đến lực lượng lao động và cả nền kinh tế nói chung.

AI tạo ra khủng hoảng mới

Làn sóng đầu tư hàng trăm tỷ USD vào AI đang tạo hiệu ứng domino, khiến nhiều lĩnh vực khác thiếu chip, nhân lực tay nghề cao và dòng tiền, làm gia tăng áp lực lên kinh tế toàn cầu.

Việt Anh

Bạn có thể quan tâm