Đạt 100 triệu người dùng sau 2 tháng phát hành, ChatGPT là một trong những ứng dụng tăng trưởng nhanh nhất lịch sử. Các công dụng của ChatGPT như viết đoạn văn, giải toán, tóm tắt văn bản, dịch thuật… dựa trên yêu cầu từ người dùng.
“Bộ não” của ChatGPT là mô hình ngôn ngữ lớn (LLM) GPT do OpenAI phát triển. Về cơ bản, đây là các mô hình học sâu phức tạp, có lượng dữ liệu và chi phí đào tạo lớn.
Quá trình phát triển LLM diễn ra trong hàng chục năm. Không chỉ tiên đoán từ hay văn bản cụ thể, các mô hình ngôn ngữ dần phát triển để áp dụng vào nhiều tác vụ thông qua bộ dữ liệu tiền huấn luyện (pre-trained), sau đó đến bước tinh chỉnh (fine-tuning) cho mục đích sử dụng cụ thể.
Từ năm 2020, một số LLM như GPT-3 hay GPT-4 không cần tinh chỉnh nhưng vẫn có khả năng tương tác một cách tự nhiên. Các chuyên gia nhận định nếu được doanh nghiệp, tổ chức đầu tư và lên kế hoạch kỹ càng, LLM sẽ có nhiều ứng dụng thực tiễn, thậm chí trở thành trọng tâm của trí tuệ nhân tạo (AI) trong tương lai.
LLM có thể thay đổi cách giáo dục
PGS.TS Trần Thanh Long, Phó trưởng khoa, Giám đốc Nghiên cứu khoa Khoa học Máy tính, Đại học Warwick (Vương quốc Anh) là chủ nhân nhiều bài báo tại các hội nghị và tạp chí AI, đồng thời nhận được một số giải thưởng quốc tế cho những công trình nghiên cứu khoa học xuất sắc.
Tại Zalo AI Summit 2023, ông Long điểm qua một số ứng dụng của LLM trong giáo dục, phát triển trợ lý ảo và giải bài toán tối ưu hóa. Trong đó, lĩnh vực giáo dục được nhấn mạnh bởi nhiều yếu tố cần chú trọng.
PGS.TS Trần Thanh Long từ Đại học Warwick (Vương quốc Anh) chia sẻ tại Zalo AI Summit 2023. Ảnh: Phúc Thịnh. |
Đầu tiên, ông Long đặt vấn đề về cách áp dụng LLM trong trường học. Hiện tại, các LLM có thể viết văn bản hoặc mã phần mềm rất nhanh, bị nhiều sinh viên lợi dụng để gian lận thi cử.
“Sau khi dùng ChatGPT, một đồng nghiệp của tôi tại khoa Vật lý khẳng định công cụ có thể giải 95% câu hỏi thi cuối kỳ của các khóa với độ chính xác ít nhất 90%. Điều đó đặt ra câu hỏi về thay đổi hoàn toàn cách giáo dục”, ông Long nhấn mạnh.
Nói với Tri thức - Znews, ông Long cho rằng bên cạnh mặt tiêu cực, LLM có thể giúp việc giáo dục hiệu quả hơn nếu áp dụng hợp lý.
“Ví dụ, các trường phổ thông tại Việt Nam có thể áp dụng LLM cho phương pháp dạy học mới, giúp các em tập trung thu nhận kiến thức theo cách khám phá thay vì ghi nhớ đơn thuần. Với các bậc học cao hơn, LLM cũng có thể mở ra những phương pháp mới, hỗ trợ học kỹ năng mềm hiệu quả.
Với kinh nghiệm của giáo sư đại học, tôi cho rằng về lâu dài, điều quan trọng nhất không phải kiến thức cụ thể dạy cho sinh viên, mà là các kỹ năng mềm như cách học nhiều thứ trong thời gian ngắn, làm việc nhóm, thuyết trình công việc và bày tỏ ý kiến một cách rõ ràng...”, ông Long chia sẻ thêm.
Yêu cầu ChatGPT viết mã cho một đơn khảo sát mua hàng. Ảnh: Phương Lâm. |
Theo chuyên gia, thay vì cấm hoàn toàn, các trường có thể nghiên cứu ứng dụng LLM để hỗ trợ sinh viên học tốt hơn, bên cạnh các bài giảng và thực hành truyền thống. Ngoài ra, đây cũng là một hướng nghiên cứu mới trong lĩnh vực AI.
Bên cạnh giáo dục, LLM có thể hỗ trợ doanh nghiệp giải các bài toán về tối ưu hóa, giúp xâu chuỗi kết quả và đưa ra giải pháp tốt hơn. Trợ lý ảo cũng là ứng dụng nổi bật của LLM để hỗ trợ tác vụ đời sống, đọc CV, giao tiếp với khách hàng...
Tương lai của LLM tác tử
PGS.TS Trần Thanh Long chỉ ra một số hướng đi để phát triển LLM. Thay vì sử dụng thụ động như đặt yêu cầu cho ChatGPT và đợi xử lý, các LLM trong tương lai có thể chủ động tương tác với cơ sở dữ liệu, người dùng, thậm chí là LLM khác để xử lý và phân tích dữ liệu.
Ý tưởng đó dẫn đến việc xây dựng các LLM tác tử (LLM agent). Tồn tại trong lĩnh vực AI, tác tử là hệ thống tự động tạo kế hoạch, giải quyết và thực thi tác vụ.
Trong mô hình thông thường, tác tử tương tác với môi trường xung quanh, thu thập và xử lý dữ liệu để đưa ra quyết định. Thay vì dùng nhiều mô hình cho từng giai đoạn, LLM tác tử sẽ sử dụng mô hình ngôn ngữ lớn cho quá trình xử lý và đưa ra hành động.
“Đây là một hướng đi mới, nhưng nhiều sân chơi đã được xây dựng để các nhà khoa học đào sâu nghiên cứu”, ông Long khẳng định.
Mô hình LLM của Zalo được trình diễn tại AI Summit 2023. Ảnh: Quỳnh Danh. |
Nói về tương lai của LLM tác tử, ông Long cho rằng có thể ứng dụng các mô hình vào nhà thông minh. Cụ thể, LLM tác tử sẽ học theo sở thích, thói quen chủ nhà để nâng cao chất lượng đời sống. Quan trọng hơn, các quốc gia có thể sử dụng LLM tác tử để xây dựng thành phố thông minh như điều khiển đèn giao thông, điều tiết lưu lượng xe để giảm ùn tắc...
Dù vậy, để có thể áp dụng rộng rãi và hoạt động hiệu quả, LLM tác tử cũng đối mặt nhiều thách thức cần giải quyết.
Đầu tiên, LLM có thể bị nhóm người xấu lợi dụng. Đơn cử như chatbot Tay.ai của Microsoft vào năm 2016 bị thao túng trở thành cỗ máy phân biệt chủng tộc, xúc phạm người dùng. Điều này đặt ra thách thức nhằm xây dựng các LLM an toàn với con người.
“Bài toán thứ 2 là làm sao để LLM học cách tương tác với hệ thống khác và với cả con người”, PGS.TS chia sẻ.
Khi nhiều AI hợp tác, một thách thức mới là đảm bảo độ ổn định cho hệ thống, tránh lặp lại sự cố “Flash Crash” từng xảy ra trên thị trường tiền tệ vào năm 2010 do quá nhiều AI tham gia giao dịch tự động (audo-trading).
Thách thức khi xây dựng LLM tiếng Việt
Việt Nam hiện chưa có nhiều LLM tối ưu cho tiếng Việt. Chia sẻ với Tri thức - Znews, PGS.TS Trần Thanh Long cho biết thách thức lớn nhất là quá trình thu thập dữ liệu cụ thể, chất lượng cao liên quan đến tiếng Việt nhằm đào tạo mô hình.
“Như các chuyên gia phân tích, quan trọng là phải có dữ liệu nhằm cải thiện hiệu suất của LLM tiếng Việt. Tuy nhiên, quy trình thu thập dữ liệu cần được thiết kế tốt, nếu không sẽ chưa có nguồn dữ liệu chất lượng - yếu tố rất cần thiết cho các LLM này”, giảng viên từ Đại học Warwick nhấn mạnh.
Bộ công cụ VMLU được tạo ra để đánh giá khả năng tiếng Việt của các LLM. Ảnh: Phúc Thịnh. |
Theo ông Long, các tổ chức như Zalo, FPT hay Viettel có lợi thế trong việc phát triển LLM khi sở hữu nhiều nền tảng truyền thông phổ biến, giúp tiếp cận lượng lớn văn bản tiếng Việt thuộc nhiều chủ đề, bối cảnh thảo luận khác nhau. Dù vậy, vẫn cần quy trình và kỹ thuật tốt nhằm chọn lọc dữ liệu chất lượng cao.
“Các công ty thường không chia sẻ dữ liệu cho đối thủ hay cộng đồng. Do đó, họ có thể không đủ thông tin cần thiết để xây dựng bộ dữ liệu và LLM hiệu quả. Trong khi đó, cộng đồng nguồn mở không thể truy cập bộ dữ liệu lớn, nhưng có thể đại diện bởi những người có chuyên môn tốt.
Trong điều kiện lý tưởng, 2 cộng có thể hợp tác cùng nhau về một số khía cạnh”, ông Long nói thêm.
PGS.TS đánh giá cao các nỗ lực xây dựng LLM cho tiếng Việt. Tuy nhiên, cần nhiều thời gian, nguồn lực và công sức đầu tư. Nếu không có sự hỗ trợ tài chính đầy đủ từ các tập đoàn và chính phủ, điều này hoàn toàn không thể thực hiện.
“Chính phủ có thể hỗ trợ quá trình thu thập dữ liệu bằng cách hỗ trợ tài chính hoặc công khai dữ liệu cho cộng đồng nghiên cứu.
Ngoài ra, cần có chính sách rõ ràng về thu thập, lưu trữ và chia sẻ dữ liệu. Điều đó giúp duy trì cộng đồng nghiên cứu nhiệt tình cống hiến, có thể cùng nhau đóng góp vào sự phát triển của LLM và AI dành cho Việt Nam trong tương lai”, ông Long nhấn mạnh.
Những câu hỏi chúng ta phải đối mặt trong thế giới AI
Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.
Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.