LLM của Zalo được thử thách kiến thức cùng các mô hình ngôn ngữ lớn

Chủ nhật, 17/12/2023 19:04 (GMT+7)
19:04 17/12/2023

Phiên bản đang phát triển của mô hình ngôn ngữ lớn, do Zalo xây dựng, thể hiện khả năng trả lời chính xác nhiều câu hỏi trong trò chơi trắc nghiệm kiến thức.

Màn đấu trí kahoot giữa các mô hình ngôn ngữ lớn và con người. Ảnh: Quỳnh Danh.

Sáng 16/12, tại AI Summit 2023, Zalo bật mí đến công chúng về mô hình ngôn ngữ lớn (Large Language Model – LLM) tiếng Việt mà đơn vị này đang phát triển. Giải pháp hướng tới việc xây dựng ứng dụng AI tạo sinh văn bản tương thích và phục vụ tốt hơn cho người Việt Nam.

Ông Nguyễn Minh Tú, Giám đốc Công nghệ Zalo, cho biết tổ chức này bắt đầu xây dựng LLM cho tiếng Việt từ đầu năm. Một số ứng dụng nhỏ của công nghệ AI tạo sinh như viết thơ, dựng avatar đã được đưa vào app và có hàng triệu người dùng đón nhận.

Tại Zalo AI Summit 2023, đơn vị Việt Nam lần đầu trình diễn mô hình ngôn ngữ lớn, là phiên bản đang trong giai đoạn phát triển. LLM của Zalo có khả năng trò chuyện, trả lời các câu hỏi người dùng về nhiều lĩnh vực khác nhau bằng tiếng Việt.

Các LLM được thử thách với các câu hỏi ở nhiều lĩnh vực, bằng hình thức trắc nghiệm. Ảnh: Quỳnh Danh.

Để thử thách khả năng của mô hình ngôn ngữ mới, mô hình được tích hợp vào Kiki để thi đấu kiến thức qua game Kahoot. Cùng tham gia trò chơi là các giải pháp ra mắt trước đó như GPT-3.5, GPT-4, Llama22, QWen, cùng một LLM Việt Nam ra mắt gần đây và cả người thật. Bộ đề thi gồm 20 câu hỏi ở nhiều lĩnh vực, được đặt ra bởi anh Trần Mạnh Hiệp, Quản trị viên diễn đàn Tinh Tế và không chia sẻ trước với Zalo.

Quá trình trả lời câu hỏi của các mô hình ngôn ngữ lớn được thể hiện qua màn hình để người xem theo dõi trực tiếp, đảm bảo công bằng.

Trong quá trình thử thách, mô hình ngôn ngữ của Zalo AI thể hiện khá tốt ở các câu hỏi thường thức, kiến thức chung. Kiki cùng GPT-4 là hai công cụ trả lời đúng câu hỏi liên quan đến ca khúc Wish you were here của ban nhạc Pink Floyd.

“Mình không nghĩ chatbot AI sẽ trả lời đúng câu này. Đây là một chủ đề ngẫu nhiên liên quan đến sở thích của mình, phải tìm hiểu mới biết được”, anh Mạnh Hiệp bình luận.

Một số câu hỏi khác liên quan đến chủ đề trong nước như nguồn gốc của rượu Bầu Đá, Kiki và GPT-4 cũng trả lời chính xác. Trong khi đó, các LLM khác lại gặp khó khăn. Đồng thời, cả 6 AI tham gia thử thách đều không vượt qua các câu hỏi về tốc độ tối đa trong đô thị hay con giáp của năm 2024. Đây là những phần giúp con người vượt lên trong game Kahoot.

Kết thúc thử thách, các mô hình ngôn ngữ lớn đều không thể vượt qua người chơi thật với bộ câu hỏi bằng tiếng Việt. Tuy nhiên, GPT-4 và Kiki là hai công cụ có sự thể hiện tốt. Mô hình ngôn ngữ lớn của Zalo AI tỏ ra không thua kém những LLM đến từ Meta hay Alibaba.

Kết quả màn so tài giữa Kiki, các LLM và người chơi Huyền Vân. Ảnh: Quỳnh Danh.

“Các bot rất tuyệt vời. Nhưng vẫn còn khoảng cách lớn để chúng phát triển về cả ngôn ngữ và nội dung”, anh Hiệp nhận định về việc các mô hình ngôn ngữ, kể cả GPT4, đều chưa thể vượt qua trí tuệ của người thật.

Trao đổi với Tri thức - Znews, quản trị viên diễn đàn Tinh Tế thể hiện sự bất ngờ với khả năng xử lý và đưa ra câu trả lời của KiLM, bởi thời gian phát triển sản phẩm chưa lâu. “Tôi cho rằng Kiki có ưu thế tốt nhờ công cụ được huấn luyện trên kho dữ liệu tiếng Việt”, anh Hiệp nói thêm.

Theo TS Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI, dù có hàng chục nghìn mô hình ngôn ngữ lớn đang được phát triển, nhưng số sản phẩm hỗ trợ tốt cho tiếng Việt rất hiếm. Trong khi đó, việc phụ thuộc vào các giải pháp quốc tế cũng tiềm ẩn nhiều nguy cơ về bảo mật hay tốn kém chi phí do ngôn ngữ không tối ưu.

TS. Nguyễn Trường Sơn, Giám đốc khoa học của Zalo AI chia sẻ về quá trình phát triển KiLM. Ảnh: Quỳnh Danh.

Phiên bản Kiki tham gia Kahoot được phát triển trên mô hình ngôn ngữ lớn của Zalo AI. Mô hình dựa theo kiến trúc transformer, được huấn luyện bằng các kỹ thuật như Flash Attention với dữ liệu hướng dẫn chất lượng cao. Mô hình của Zalo AI đang hướng đến mục tiêu xử lý đa tác vụ, như dịch văn bản, sáng tạo và viết nội dung, trích xuất thông tin trong văn bản, trả lời câu hỏi... Trước đó, LLM này cũng đã từng được thử nghiệm để tạo ra hàng triệu bài thơ nhân dịp 8/3 và 20/10.

Phía Zalo cho biết đang phát triển mô hình ngôn ngữ lớn của mình trên nhiều kích cỡ mô hình khác nhau, từ 1B đến 30B tham số. Phiên bản được được trình diễn tại Zalo AI Summit 2023 được huấn luyện trên mô hình 7B tham số.

“Đây là mô hình nền tảng được Zalo xây dựng. Sau đó, từng ứng dụng của LLM này sẽ được tinh chỉnh cho phù hợp với mục đích sử dụng trong tương lai”, ông Sơn trả lời Znews.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Apple thu về hơn 10.000 tỷ trong quý III kỷ lục ở Việt Nam

Việc iPhone 15 bán sớm hơn mọi năm giúp Apple có thêm phần doanh thu quan trọng, đóng góp vào kết quả kinh doanh quý III.

18:10 17/12/2023

Sếp Nvidia lên tiếng vì nhân viên giàu lên quá nhanh

Do công ty phát triển bùng nổ, một số nhân sự của Nvidia giàu lên rất nhanh và đi làm trong trạng thái "nghỉ hưu bán thời gian".

16:07 17/12/2023

Zalo AI Summit 2023: Hướng đi cho mô hình ngôn ngữ lớn tiếng Việt

Tại sự kiện AI thường niên do Zalo tổ chức, nhiều diễn giả đã chia sẻ những nhận định mới nhất về AI tạo sinh, cũng như các thách thức khi xây dựng LLM tiếng Việt.

08:51 16/12/2023

Hùng Phi

mô hình ngôn ngữ lớn Zalo AI Zalo AI SUmmit chatgpt

Zalo
Zalo là ứng dụng nhắn tin và gọi điện miễn phí hoạt động trên nền tảng di động và máy tính, được phát triển bởi đội ngũ kỹ sư của công ty VNG và ra mắt lần đầu tháng 12/2012. Tháng 6/2016, Zalo bắt đầu phát hành phiên bản địa phương đầu tiên ở thị trường Myanmar. Tháng 5/2018, Zalo chính thức đạt mốc 100 triệu người dùng.
Bạn có biết: Tải Zalo PC cho máy tính để sử dụng các tính năng vượt trội trên Zalo PC như gửi file 1GB, Chụp màn hình, Chat nhóm, Phân loại nhóm,…
- Ra mắt: 12/2012
- Công ty phát triển: VNG
Website

Đọc tiếp

Người dùng cần làm gì trước thời điểm tắt sóng 2G vào tháng 9?

7 giờ trước 18:35 24/7/2026

Một số điện thoại 4G đời cũ, máy xách tay hoặc chưa bật VoLTE có thể không gọi, nhận cuộc gọi sau khi mạng 2G ngừng hoạt động, dù vẫn truy cập Internet bình thường.

Elon Musk nói về nỗi sợ AI: 'Cứ tận hưởng thôi'

8 giờ trước 17:34 24/7/2026

Elon Musk khẳng định đã quá muộn để ngăn chặn sự phát triển của AI và cho rằng nhân loại đơn giản là nên "tận hưởng hành trình này".