Được tổ chức lần đầu vào năm 2017, Zalo AI Summit là sự kiện quy tụ các chuyên gia nổi tiếng trong lĩnh vực AI. Với chủ đề “Việt Nam trong kỷ nguyên AI hóa” (Vietnam in the Era of AI-fication), Zalo AI Summit 2025 mang đến các giải pháp ứng dụng AI trong đời sống, dự báo xu hướng AI và các thành tựu của Zalo trong việc mang AI đến gần người dùng.
Chia sẻ mở màn sự kiện, ông Nguyễn Minh Tú, Giám đốc Công nghệ Zalo, cho biết kỷ nguyên AI đã nhen nhóm từ thời điểm 2018-2019 khi các mô hình transformer đầu tiên ra đời. Song phải đến khi GPT-3.5 cùng ChatGPT xuất hiện năm 2022, các mô hình ngôn ngữ mới đạt chất lượng cao, tiếp cận đến nhiều người dùng.
“Đó là lúc kỷ nguyên AI bắt đầu, khi mọi người hình thành thói quen sử dụng ChatGPT”, ông Tú nhấn mạnh.
Tín hiệu tích cực cho Việt Nam
Trong bối cảnh các công ty như Google, Anthropic hay DeepSeek ngày càng cải tiến mô hình ngôn ngữ lớn (LLM), thị trường AI chứng kiến bước ngoặt mang tên agentic AI.
Khác với AI thông thường chỉ có thể giải quyết tác vụ đơn lẻ, agentic AI là hệ thống tự hành, có khả năng kết nối các tác nhân (multi-agent) để xử lý vấn đề phức tạp.
“Agentic AI hoạt động như nhân viên của mọi người. Chúng có thể phân tích, suy luận, thực hiện nhiệm vụ và viết báo cáo dựa trên câu lệnh của chúng ta”, ông Tú nói thêm.
Tại Việt Nam, Zalo là một trong những công ty tích hợp nhiều tính năng AI phục vụ người dùng. Năm 2025, lượng người sử dụng các dịch vụ này đạt hơn 17 triệu, tăng hơn 200%. Hơn 7,5 triệu người tận dụng tính năng dictation (chuyển giọng nói thành văn bản).
"Tính năng trên đã thay đổi cách nhiều người sử dụng Zalo. Thay vì gõ văn bản, sử dụng giọng nói nhanh và tiện lợi hơn rất nhiều", ông Tú nhấn mạnh.
Tính năng dịch tin nhắn từ tiếng Việt sang tiếng Anh cũng thu hút lượng lớn người dùng. Ông Tú tiết lộ sẽ sớm bổ sung dịch thuật trực tiếp cho cuộc gọi Zalo trong tương lai.
|
| Ông Nguyễn Minh Tú, Giám đốc Công nghệ Zalo. |
Không chỉ phục vụ người dùng cuối, AI còn hỗ trợ quá trình vận hành của Zalo. Hãng xây dựng chatbot chăm sóc khách hàng, giúp giải quyết bài toán quy mô trong các dịp cao điểm, vốn rất khó tuyển thêm nhân viên.
Sau 3 tháng áp dụng, hệ thống chatbot trong Zalo đạt tỷ lệ phản hồi 90%, cao hơn so với con người. Chỉ khoảng 2-3% trường hợp chatbot cần người hỗ trợ ngược lại.
Đại diện Zalo thừa nhận còn một số thách thức khi ứng dụng AI nội bộ, xoay quanh quyền riêng tư và an toàn. Đó là lý do nền tảng chọn cách tiếp cận linh hoạt, áp dụng mô hình tự phát triển cho dữ liệu nhạy cảm, và tận dụng chatbot ngoài cho các dữ liệu ít nhạy cảm.
Ông Tú cũng đề cập đến Zalo AI Challenge 2025, cuộc thi phát triển giải pháp ứng dụng AI trong đời sống. Ngoài các bạn trẻ và sinh viên, cuộc thi năm nay thu hút một số thí sinh là học sinh trung học, thậm chí lọt top 5 chung cuộc.
“Điều đó cho thấy AI đã đi sâu vào tất cả lĩnh vực trong xã hội, lan tỏa đến ghế nhà trường khi các em được tiếp xúc với AI rất sớm. Đây là tín hiệu tích cực cho Việt Nam trong kỷ nguyên ‘AI hóa’”, đại diện Zalo nhấn mạnh.
Làn sóng AI agent
Trong phiên chia sẻ đầu tiên, PGS.TS Quản Thành Thơ từ Đại học Bách Khoa TP.HCM, đặt vấn đề AI đa phương thức sẽ thay đổi thế giới như thế nào. Ông cho rằng LLM đã đến chu kỳ cuối. Xu hướng công nghệ dần chuyển sang Multi-Agent System (MAS).
PGS.TS đồng tình với ông Tú về cột mốc quan trọng của LLM với sự ra đời của GPT-3.5, cho rằng mục tiêu chung của chatbot là mô phỏng giống con người nhất có thể. Khái niệm tác nhân AI (AI agent) đã có mặt từ trước, nhưng chỉ thực sự phát huy dưới thời của LLM.
“Agent là một kiến trúc khá cổ điển, khi được kết hợp với LLM mang đến khả năng giao tiếp giữa các mô hình”, ông Thơ cho biết. Từ khóa "AI Agents" và "Agentic AI" cũng nằm trong tìm kiếm nhiều nhất của Google Trends giai đoạn cuối 2024 đến nay.
|
| PGS.TS Quản Thành Thơ, Trưởng khoa Khoa Khoa học và Kỹ thuật Máy tính, Đại học Bách Khoa TP.HCM. |
PGS.TS chia sẻ rằng agentic AI chỉ một hệ thống gồm nhiều agent phối hợp với nhau. Khi nhận được câu lệnh từ người dùng, các agent sẽ chia nhỏ yêu cầu, phân công nhiệm vụ, lựa chọn công cụ phù hợp và thực thi theo từng bước nhằm đạt hiệu quả cao hơn so với một mô hình đơn lẻ.
Một số ứng dụng thực tế của MAS tại doanh nghiệp nội địa cũng được ông Thơ trình bày. Trong đó, AI agent cùng lúc xử lý tệp PDF, hình ảnh, tài liệu, giúp nâng cao hiệu suất đến 40-60%. Trong lĩnh vực bảo hiểm, công nghệ này giúp một công ty tự động hóa 20-40% khối lượng công việc.
Ngoài ra, AI agent có khả năng thu thập thông tin thời gian thực, giúp cung cấp tức thời giá cả thị trường. Tại nơi công tác, PGS.TS. cho biết hệ thống AI agent hoạt động như trợ lý thông minh, có thể trả lời câu hỏi liên quan đến trường cho phụ huynh, sinh viên. Trong giáo dục, AI agent giúp tạo ra các mô hình cá nhân hóa theo lộ trình học cho từng sinh viên.
|
| Zalo AI Summit 2025 thu hút đông đảo người tham gia, quan tâm đến lĩnh vực AI. |
Nhìn chung, lợi thế của MAS nằm ở khả năng xử lý nhiều vấn đề phức tạp song song. Qua quá trình suy luận, các agent có thể tự xử lý, học hỏi lẫn nhau và học từ người dùng để giảm sai sót, cho ra kết quả chính xác và cá nhân hóa.
Các kiến trúc agent ngày nay thường được cung cấp dưới dạng công cụ và nền tảng với giao diện thân thiện, giúp tiếp cận rộng hơn tới người dùng phổ thông.
Từ những công dụng này, ông Thơ nhấn mạnh tầm quan trọng của việc ứng dụng công nghệ và điều chỉnh quy trình làm việc trong nội bộ doanh nghiệp. Theo PGS.TS, trong bối cảnh xu hướng đổi mới diễn ra mạnh mẽ trên thế giới, đây là làn sóng mà các doanh nghiệp cần đặc biệt quan tâm.
Điều gì sẽ đến sau agentic AI?
Thời gian gần đây, robot hình người là xu hướng được giới công nghệ quan tâm. Đây cũng là ứng dụng phổ biến nhất của AI vật lý (physical AI).
Chia sẻ về chủ đề này, TS Trần Minh Quân, Senior Developer Technologist tại Nvidia Việt Nam, nhấn mạnh AI vật lý là bước phát triển tiên tiến nhất của các xu hướng AI, sau thời đại AI tạo sinh hay agentic AI.
“Những mô hình AI có khả năng tiếp nhận câu lệnh hoặc dữ liệu đầu vào, sau đó cho ra hành động cụ thể, tác động lên motor hoặc các thành phần điều khiển của robot như cánh tay, điều khiển xe tự lái, nhà máy... ”, ông Quân chia sẻ khái quát về AI vật lý.
|
| TS Trần Minh Quân từ Nvidia chia sẻ về xu hướng AI vật lý. |
Theo đại diện Nvidia, AI vật lý có thể trở thành ngành công nghiệp nghìn tỷ USD trong tương lai. Tiềm năng ứng dụng AI vật lý rất lớn khi hạ tầng phần cứng toàn cầu hiện có khoảng 2 tỷ camera công nghiệp, 10 triệu nhà máy, 200.000 kho bãi và 1,5 tỷ phương tiện, chưa kể hàng tỷ robot hình người có thể trang bị trong tương lai.
“Nếu mỗi thiết bị được trang bị "bộ não" AI để xử lý khối lượng công việc hiện tại, những tác vụ có thể được hỗ trợ với quy mô rất khác so với hiện nay”, ông Quân nói thêm.
Nhu cầu AI vật lý xuất phát từ thực tế thiếu hụt nhân sự tại nhiều ngành công nghiệp. Các công việc đòi hỏi kỹ thuật cao trong môi trường khắc nghiệt, chẳng hạn như hàn trong không gian kín và tối, đang gây khó khăn cho con người.
Robot lúc này là giải pháp cân bằng chi phí nhân sự và vận hành. Vấn đề chi phí có thể tối ưu khi robot hiện có khả năng tự học tác vụ mới, thay vì chỉ làm các công việc lặp lại.
“Đó là lý do ‘khoảnh khắc’ ChatGPT của ngành robotic có thể đến trong năm nay hoặc năm sau”, ông Quân nhấn mạnh.
|
| AI vật lý được xem là bước tiến tiếp theo sau AI tạo sinh và agentic AI. |
Để hiện thực hóa tầm nhìn này, đại diện Nvidia đề xuất mô hình 3 máy tính, tương ứng 3 giai đoạn then chốt trong quá trình phát triển AI vật lý.
Theo đó, giai đoạn thứ nhất tập trung xây dựng nền tảng trên máy chủ. Sau khi huấn luyện, có thể đưa mô hình vào môi trường giả lập (simulation) để học về tương tác nhân quả, giúp mô hình có thái độ tốt hơn trong thế giới thực.
Việc mô phỏng giúp robot nhận biết chính xác vật thể và cách xử lý. Quan trọng hơn, giả lập cho phép nhiều robot phối hợp cùng lúc, thử nghiệm các kịch bản va chạm mà không gây thiệt hại về chi phí phần cứng thực tế. Cuối cùng là triển khai trực tiếp lên phần cứng.
Bài toán triển khai AI quy mô lớn
Quá trình “AI hóa”, tức đưa công nghệ vào các hoạt động thường nhật nhằm nâng cao hiệu suất và hỗ trợ ra quyết định, đang được đẩy nhanh trên toàn cầu.
Theo TS Châu Thành Đức, Giám đốc Nghiên cứu tại Zalo AI, tốc độ AI hóa tại Việt Nam đến từ nhiều yếu tố, trong đó nổi bật là sự phát triển của các mô hình AI, cải thiện nhanh chóng của hạ tầng phần cứng, dữ liệu và quá trình chuyển đổi số.
Việt Nam được đánh giá là một trong những quốc gia có nhiều tiềm năng phát triển AI, thể hiện qua các chương trình tìm kiếm nhân tài, xây dựng cộng đồng công nghệ và sự hỗ trợ từ Chính phủ. Bên cạnh đó, người dân Việt Nam được đánh giá có mức độ sẵn sàng cao cho quá trình chuyển đổi số.
|
| TS Châu Thành Đức, Giám đốc Nghiên cứu Zalo AI. |
Trong công cuộc chuyển đổi đó, Zalo ra mắt nhiều tính năng liên quan đến AI như trợ lý ảo Kiki. Công ty hướng đến phát triển công cụ gia tăng hiệu suất làm việc, đặc biệt phải dễ sử dụng cho mọi người. Các công cụ của Zalo hỗ trợ từ coding, lập trình, tra cứu, đến các hoạt động thường ngày như giao tiếp, dịch thuật, tìm kiếm hình ảnh.
Tuy vậy, các chuyên gia cho rằng đây chỉ là bước khởi đầu, và còn nhiều khó khăn trong quá trình AI hóa. TS Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI, cho biết những khó khăn đến từ bảo mật, vấn đề chi phí và yêu cầu cao từ người dùng. Đây không chỉ là khó khăn của Zalo mà còn với người dùng, doanh nghiệp.
Trở ngại đầu tiên xoay quanh việc chọn mô hình AI nhằm bảo đảm mức độ tự chủ. Mô hình từ bên thứ ba thường cho hiệu suất và chất lượng đầu ra tốt hơn, trong khi mô hình nội bộ có ưu thế về khả năng kiểm soát thông tin, nhưng hạn chế về độ ổn định và hiệu quả.
![]() ![]() ![]() ![]() |
| Phần chia sẻ từ các đại diện Zalo AI. |
Bên cạnh đó, hầu hết mô hình hiện nay tồn tại điểm yếu chung như độ chính xác chưa toàn diện, kết quả đầu ra thiếu nhất quán. Khả năng hiểu và xử lý tiếng Việt của nhiều chatbot còn hạn chế, chưa đáp ứng đúng yêu cầu hoặc ngữ cảnh đặt ra.
Để khắc phục vấn đề này, các chuyên gia tại Zalo đưa ra một số giải pháp như áp dụng công nghệ phát triển mô hình tiên tiến, kết hợp nguồn dữ liệu đáng tin cậy trong quá trình huấn luyện chatbot. Song song đó, đội ngũ phát triển liên tục đánh giá mô hình thông qua các bài kiểm tra nội bộ.
Thách thức khác nằm ở bài toán cân bằng chi phí, hiệu suất và bảo mật. Theo TS Nguyễn Trường Sơn, việc sử dụng mô hình nhỏ để xử lý yêu cầu phức tạp có thể làm tăng thời gian xử lý và chi phí vận hành, và ngược lại.
|
| TS Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI. |
Ông cho rằng quá trình tối ưu có thể diễn ra ngay từ khâu nhập câu lệnh. Người dùng có thể giảm chi phí token bằng cách hạn chế độ dài không cần thiết, đồng thời cung cấp ngữ cảnh rõ ràng, súc tích cho chatbot.
Ở cấp độ hệ thống, đội ngũ Zalo triển khai nhiều giải pháp như gợi ý nhập lệnh phù hợp, triển khai các lớp kiểm soát nhằm bảo đảm an toàn và bảo mật thông tin người dùng.
Nhìn chung, Việt Nam được đánh giá có sự chuẩn bị nhất định cho làn sóng AI hóa toàn cầu. Zalo là một trong những đơn vị tham gia sớm vào quá trình chuyển đổi với trọng tâm giải quyết bài toán chi phí, chất lượng và bảo mật khi triển khai AI quy mô lớn.
Cuộc đua chip khốc liệt
Sự bùng nổ của AI là kết quả từ những tiến bộ về phần cứng hoặc chip. TS Phạm Hy Hiếu từ OpenAI nhấn mạnh sự xuất hiện của ChatGPT tạo ra cuộc cách mạng chip, đưa Nvidia tăng trưởng nhanh chóng trong thời gian ngắn.
Tại thời điểm ChatGPT mới ra mắt, việc vận hành mô hình gần như phụ thuộc hoàn toàn vào chip của Nvidia. Điều này tạo nên làn sóng mua phần cứng từ các ông lớn công nghệ như Anthropic hay Meta.
Tuy nhiên, cuộc chơi không chỉ dành cho Nvidia. Các đối thủ như AMD và Google cũng đang cung cấp giải pháp phần cứng tối ưu cho những đơn vị phát triển mô hình AI.
“Dòng chảy của chip và các nguồn vốn liên quan đến chip còn tác động đến dòng chảy kinh tế, ít nhất là sự tăng trưởng của nền kinh tế Mỹ.
Ngoài ra, những công ty nuôi mộng làm AI đều có tham vọng phát triển chip riêng bởi chi phí mua chip ngày càng cao, chỉ cần tiết kiệm khoản nhỏ đã là lợi ích lớn. Đó là lý do mỗi công ty đều muốn tự chủ tài nguyên chip”, ông Hiếu nói thêm.
|
| Đại diện OpenAI, TS Phạm Hy Hiếu. |
Thị trường chip AI hiện chia thành 2 loại chính dựa trên mục đích sử dụng. Loại thứ nhất là chip huấn luyện (training), đòi hỏi khả năng thực hiện phép nhân ma trận lớn, số chiều đều đặn, băng thông mạnh để kết nối hàng nghìn chip cùng lúc.
Loại thứ 2 là chip phục vụ (inference), yêu cầu khiêm tốn hơn về số lượng liên kết (khoảng 50-100 chip), tập trung vào bài toán ma trận nhỏ, kích thước không đều. Tuy nhiên, chip suy luận đòi hỏi khả năng tối ưu hóa điện năng tốt để vận hành bền vững.
Nhìn lại lịch sử phát triển, nếu giai đoạn 2019-2023 là thời kỳ tập trung huấn luyện và nén dữ liệu cho các mô hình GPT, từ năm 2024 trở đi, trọng tâm đang chuyển sang khả năng lý luận. Sự chuyển dịch này kéo theo nhu cầu về chip phục vụ (inference).
“Việt Nam chúng ta đóng vai trò gì trong cuộc chơi sản xuất chip? Tuy chip là ngành công nghiệp nghìn tỷ USD, chúng ta không cần hàng chục tỷ USD để tham gia. Người Việt Nam có thể đóng góp cho bản đồ chip AI bằng nhiều cách”, ông Hiếu chia sẻ.
|
| Chia sẻ từ TS Phạm Hy Hiếu về phần cứng trong hạ tầng AI. |
Đại diện OpenAI đưa ra 2 hướng đi chính. Thay vì chạy đua sản xuất chip cho các mô hình ngôn ngữ lớn, Việt Nam có thể tập trung phát triển chip tiêu thụ năng lượng thấp trên xe hơi, smartphone hoặc thiết bị y tế cấy ghép. Đây là những mảng thị trường vẫn còn nhiều dư địa và chi phí đầu tư thấp hơn.
Thứ hai là tích hợp phần cứng và phần mềm. Những đóng góp như thuật toán Flash Attention 2 cho thấy sự kết hợp thông minh giữa lập trình và phần cứng có thể tạo ra đột phá mà không cần nguồn vốn quá lớn.
“Tương lai nằm trong tay những người dám nhìn thấy cơ hội, dám dấn thân và đương đầu nguy hiểm”, ông Hiếu kết luận.
Những đội thi xuất sắc tại Zalo AI Challenge 2025
Sau phần chia sẻ của diễn giả, nhiều giải pháp thực tiễn nhằm ứng dụng AI được trình bày tại Zalo AI Challenge 2025. Khởi động từ cuối tháng 10, cuộc thi thu hút hơn 1.000 đội tham dự.
Năm nay, Zalo AI Challenge chia thành 2 bảng: RoadBuddy (dùng thuật toán xác định biển báo giao thông) và AeroEyes (thiết kế AI cho drone nhận diện vật thể mặt đất). Các đội thi giành chiến thắng nhận tổng giải thưởng tiền mặt 12.000 USD cùng phần quà từ nhà tài trợ.
Theo ban tổ chức, các đề thi năm nay đều mang tính thực tế, cho thấy tiềm năng của AI ngoài môi trường nghiên cứu nhằm giải quyết các vấn đề thực tiễn.
Với đề bài RoadBuddy, thí sinh tập trung xử lý dữ liệu từ camera hành trình trên ôtô. Các đội phải xử lý bộ dữ liệu video dài 5-15 giây, được ghi trong nhiều điều kiện thời gian. Nhiệm vụ của mô hình AI là nhận diện chính xác các chi tiết như biển báo, đèn tín hiệu và vạch kẻ đường xuất hiện trong video.
![]() ![]() ![]() ![]() |
| Phần chia sẻ và trao giải Zalo AI Challenge 2025. |
Với quy mô dữ liệu gồm 1.500 mẫu huấn luyện, các đội thi được đánh giá dựa trên 2 tiêu chí: độ chính xác và thời gian trả lời. Bộ câu hỏi gồm các câu trắc nghiệm, cần trả lời phù hợp dựa trên luật giao thông đường bôn Việt Nam
Theo đánh giá từ ông Nguyễn Trường Sơn, thí sinh đã áp dụng những kỹ thuật tiên tiến như mô hình ngôn ngữ thị giác (Vision Language Model - VLM). Quy trình chung là trích xuất khung hình từ video làm dữ liệu đầu vào, sau đó kết hợp các mô hình như Qwen hoặc YOLO để nhận diện vật thể, đưa ra phân tích logic.
Kết quả chung cuộc, đội CtelAI giành vị trí quán quân với tỷ lệ chính xác 71,3%, theo sau là BitterSweet với 70,5%.
Với chủ đề AeroEyes, các đội tham gia vòng loại trước khi bước vào vòng chung kết. Tại vòng chung kết, các ứng viên phải lập trình mô hình trực tiếp lên drone, thiết lập đường bay và điều khiển camera trong điều kiện thực tế để phát hiện vật thể.
Do độ khó của đề bài khiến số lượng đội đạt yêu cầu không cao, ban tổ chức đã linh hoạt đưa ra đề tài phụ. Các đội thi nhanh chóng điều chỉnh mô hình để đáp ứng yêu cầu. Kết quả, đội AIO_C3A giành chiến thắng nhờ hiệu quả cao nhất. Đồng giải nhì thuộc về 2 đội IUH_Alers_K16 và AEB.
Những câu hỏi chúng ta phải đối mặt trong thế giới AI
Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.
Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.







