Những cái tên lớn trong lĩnh vực trí tuệ nhân tạo gặp khó khi các mô hình AI tiên tiến ngày càng đắt đỏ.

OpenAI đã gần chạm đến cột mốc mới. Hồi tháng 9, startup này hoàn thành vòng đào tạo đầu tiên cho Orion, mô hình trí tuệ nhân tạo được kỳ vọng vượt qua nhiều phiên bản trước đây và kể cả con người.

Tuy nhiên, nguồn tin của Bloomberg cho biết Orion hoạt động chưa hiệu quả. Trong đợt thử nghiệm cuối mùa hè, mô hình này không trả lời tốt yêu cầu viết mã chưa được đào tạo. Nhìn chung, Orion chưa quá vượt trội so với GPT-4 hay GPT-3.5.

Sau nhiều năm trình làng các sản phẩm AI tiên tiến với tốc độ chóng mặt, nhiều công ty lớn trong ngành đang ghi nhận lợi nhuận giảm, còn chi phí phát triển mô hình tăng vọt.

Không chỉ OpenAI, phiên bản Gemini sắp ra mắt của Google chưa đáp ứng kỳ vọng nội bộ, trong khi Anthropic cũng lùi ngày phát hành mô hình Claude 3.5 Opus.

"Bong bóng AGI đang vỡ một chút"

Các công ty AI đang đối mặt một số thách thức. Ngày càng khó để tìm dữ liệu đào tạo chất lượng cao do con người tạo ra, chưa được khai thác nhằm xây dựng hệ thống AI tiên tiến. Trong khi đó, các nâng cấp nhỏ lẻ chưa đủ biện minh chi phí khổng lồ nhằm xây dựng và vận hành mô hình.

Theo nguồn tin nội bộ, OpenAI đã đưa Orion vào quy trình hậu đào tạo. Đây là giai đoạn nhận phản hồi và tinh chỉnh trước khi phát hành công khai. Tuy nhiên, OpenAI vẫn chưa hài lòng để phát hành rộng rãi mô hình, ít nhất đến đầu năm sau.

Đây là vấn đề mới tại Thung lũng Silicon những năm gần đây, đặc biệt sau khi ChatGPT ra mắt. Các công ty AI chật vật chạy theo "luật tỷ lệ" (scaling laws), trong đó sức mạnh tính toán, dữ liệu và mô hình lớn được kỳ vọng mở đường để AI ngày càng mạnh mẽ.

CEO Sam Altman của OpenAI. Ảnh: Bloomberg.

Tình trạng khó khăn cũng đặt dấu hỏi về mục tiêu tạo ra AI tổng quát (Artificial General Intelligence) mà các công ty theo đuổi.

Thuật ngữ này đề cập hệ thống AI giả định, có thể sánh ngang hoặc vượt trội con người trong những tác vụ vận dụng trí óc. Trước đây, lãnh đạo OpenAI và Anthropic cho rằng AGI có thể chỉ cách chúng ta vài năm nữa.

"Bong bóng AGI đang vỡ một chút", Margaret Mitchell, nhà khoa học đạo đức tại startup Hugging Face, cho biết. Bà nhấn mạnh cần có "các phương pháp đào tạo khác nhau" để mô hình AI hoạt động tốt với nhiều nhiệm vụ.

Trả lời Bloomberg, phát ngôn viên Google DeepMind cho biết công ty "hài lòng với quá trình xây dựng Gemini" và sẽ "chia sẻ thêm khi chúng tôi sẵn sàng". Trong khi đó, OpenAI và Anthropic đều từ chối bình luận.

Xây dựng AI ngày càng phức tạp

Công nghệ sau ChatGPT và nhiều chatbot AI xoay quanh dữ liệu đào tạo gồm các bài đăng trên mạng xã hội, bình luận online, sách và các thông tin khác trên Internet.

Theo Bloomberg, bộ dữ liệu trên vừa đủ để tạo ra sản phẩm biết làm thơ hay viết văn. Tuy nhiên, việc xây dựng hệ thống AI với trình độ cao hơn có thể cần nhiều nguồn dữ liệu, không chỉ Wikipedia hay YouTube.

Thời gian ra mắt một số mô hình AI lớn. Ảnh: Bloomberg.

OpenAI đã hợp tác các nhà xuất bản để sử dụng nguồn dữ liệu chất lượng cao, đồng thời giải quyết một số áp lực pháp lý ngày càng tăng từ giới xuất bản và nghệ sĩ về bản quyền dữ liệu.

Một số công ty còn tuyển dụng người có bằng sau đại học để dán nhãn dữ liệu liên quan đến ngành học, giúp cải thiện phản hồi từ chatbot khi truy vấn một số chủ đề nhất định.

So với dữ liệu từ web, các công việc trên đòi hỏi thời gian và chi phí cao hơn. Các công ty công nghệ còn dùng dữ liệu tổng hợp (synthetic), gồm văn bản/hình ảnh tạo bởi máy tính nhằm mô phỏng nội dung của người thật, song vẫn còn một số giới hạn.

"Điều này nhằm nhấn mạnh chất lượng và tính đa dạng của dữ liệu thay vì số lượng.

Chúng tôi có thể tạo ra lượng lớn dữ liệu tổng hợp, nhưng lại gặp khó trong việc tạo bộ dữ liệu độc đáo, chất lượng cao mà không có sự hướng dẫn của con người, đặc biệt trong vấn đề ngôn ngữ", Lila Tretikov, Giám đốc Chiến lược AI tại New Enterprise Associates, cho biết.

CEO Dario Amodei của Anthropic. Ảnh: Bloomberg.

Dù vậy, các công ty AI vẫn theo đuổi chiến lược "càng nhiều càng tốt". Để xây dựng sản phẩm AI trình độ ngang con người, họ tìm cách tăng sức mạnh tính toán, lượng dữ liệu và thời gian đào tạo, khiến chi phí đội lên.

Theo Amodei, các công ty có thể mất 100 triệu USD để đào tạo mô hình tiên tiến nhất trong năm nay, nhưng vài năm tới số tiền có thể lên đến 100 tỷ USD .

Cách tiếp cận khác

Một dấu hỏi khác đang trở thành tâm điểm tại Thung lũng Silicon. Vào tháng 3, Anthropic ra mắt 3 mô hình mới, khẳng định tùy chọn mạnh mẽ nhất (Claude Opus) vượt trội GPT-4 và Gemini trên một số thang chấm điểm (benchmark), chẳng hạn như lý luận cấp bậc sau đại học.

Trong vài tháng tiếp theo, Anthropic cập nhật 2 mô hình Claude nhưng không phải Opus. Đến tháng 10, một số nhà phân tích nhận thấy thông tin về 3.5 Opus, gồm thời điểm ra mắt đã bị xóa khỏi website Anthropic.

Tương tự đối thủ, Anthropic đang gặp khó trong việc phát triển Claude 3.5 Opus. Sau khi đào tạo, công ty đánh giá mô hình hoạt động tốt hơn phiên bản cũ, nhưng không nhiều như mong đợi khi xét quy mô và chi phí phát triển.

Đại diện Anthropic cho biết lý do xóa một số thông tin về 3.5 Opus đến từ thay đổi trong khâu marketing, chỉ hiển thị các mô hình đã phát hành và được benchmark.

Khi được hỏi liệu Opus 3.5 có ra mắt trong năm nay hay không, phát ngôn viên Anthropic dẫn lại lời của CEO Dario Amodei trong một podcast ngày 11/11, nói rằng công ty vẫn có kế hoạch phát hành mô hình nhưng từ chối tiết lộ thời gian cụ thể.

Đại diện Google giới thiệu một số cải tiến cho mô hình Gemini. Ảnh: Google.

Các công ty cũng tranh cãi về khả năng tiếp tục vận hành hoặc nâng cấp mô hình AI cũ, trong bối cảnh mô hình mới quá tốn kém nhưng hiệu quả có thể không vượt trội.

Hồi tháng 8, Google cập nhật mô hình Gemini với khả năng tạo ảnh con người. OpenAI cũng tập trung một số bản cập nhật, chẳng hạn như nâng cấp tính năng trợ lý giọng nói, giúp người dùng tương tác trôi chảy hơn với ChatGPT.

Gần đây hơn, OpenAI ra mắt bản thử nghiệm của mô hình tập trung lý luận o1. Google cũng đang nghiên cứu cách tiếp cận tương tự cho Gemini, tập trung nâng cấp cách xử lý truy vấn và phản hồi theo thời gian.

"Tất cả mô hình đã trở nên khá phức tạp, và chúng tôi không thể song song phát hành nhiều thứ như mong muốn", CEO Sam Altman chia sẻ trong chuyên mục Ask Me Anything trên Reddit. Ông thừa nhận OpenAI đối mặt "rất nhiều hạn chế và quyết định khó khăn" để sử dụng nguồn lực tính toán hiện có.

Altman tiết lộ OpenAI dự kiến ra mắt "một số sản phẩm rất tốt" vào cuối năm nay, nhưng sẽ không có GPT-5. Tương tự Google và Anthropic, OpenAI hướng người dùng đến công cụ AI hỗ trợ các nhu cầu sử dụng cụ thể, chẳng hạn như đặt vé máy bay, gửi email thay mặt người dùng.