Được tổ chức lần đầu vào năm 2017, Zalo AI Summit là sự kiện quy tụ các chuyên gia trong lĩnh vực AI tại Việt Nam và trên thế giới. Tại đây, những người đang làm việc trong lĩnh vực AI sẽ cùng thảo luận về những vấn đề chung, giúp AI Việt Nam phát triển hơn.
Hội thảo Zalo AI Summit lần thứ 4 diễn ra sáng 20/12 với chủ đề “Ứng dụng AI vào cuộc sống hàng ngày”, mục tiêu giúp AI len lỏi vào những khía cạnh gần gũi trong đời sống.
"AI là trọng tâm phát triển của Zalo"
Dữ liệu là một trong những yếu tố cốt lõi của AI. Mở đầu sự kiện, ông Vương Quang Khải, lãnh đạo Zalo cho biết từ năm 2017 đến nay, Zalo đã xây dựng cơ sở dữ liệu gồm 10.000 giờ giọng nói, 1 triệu thực thể tri thức và 50 triệu bức ảnh mỗi ngày.
Ông Vương Quang Khải, lãnh đạo Zalo chia sẻ về tầm nhìn trong lĩnh vực AI. Ảnh: Thuận Thắng. |
Bên cạnh đó, lãnh đạo của Zalo chia sẻ điều ông tự hào nhất là xây dựng được đội ngũ làm AI, big data, thể hiện quyết tâm đầu tư của Zalo cho AI.
"Con số này thể hiện sự quyết tâm để đầu tư, phát triển con người. Chúng tôi cũng đang có những đóng góp về học thuật. Trong năm vừa qua, chúng tôi có 3 bài nghiên cứu được đăng tải ở các hội thảo quốc tế. Đây là những thành công đầu tiên rất đáng khích lệ, và thể hiện con đường lâu dài chúng tôi muốn tiếp tục cống hiến cho nền khoa học Việt Nam cũng như quốc tế", ông Vương Quang Khải chia sẻ.
Theo ông Khải, hệ sinh thái của Zalo đang có 60 triệu người dùng. Sau thành công của ứng dụng nhắn tin Zalo, AI là lĩnh vực tiếp theo được nghiên cứu với trọng tâm là các sản phẩm “AI-first” (AI là nhân vật chính) như trợ lý ảo điều khiển bằng giọng nói.
Giọng nói sẽ là công cụ chính để con người giao tiếp với máy tính trong 5-10 năm tới.
Vương Quang Khải, lãnh đạo Zalo.
Chia sẻ về định hướng "AI-first", ông Khải cho rằng AI cần đóng vai trò trọng tâm của cuộc sống, chứ không chỉ đứng sau, đóng góp cho các sản phẩm mà không nhìn thấy được.
"Khi làm AI, chúng ta không chỉ muốn những hệ thống rất hay, phức tạp mà không nhìn thấy. Chúng ta muốn những sản phẩm AI-first, trong đó AI là tác nhân trực tiếp tạo ra những thay đổi trong cuộc sống", lãnh đạo Zalo giải thích.
Về lý do chọn trợ lý ảo giọng nói làm trọng tâm, ông Khải cho biết giọng nói là phương tiện giao tiếp tốt nhất giữa con người và máy tính, vì các thao tác sẽ tự nhiên hơn, đồng thời có khả năng truyền tải thông tin với tốc độ cao hơn so với gõ phím.
“Giọng nói sẽ là công cụ chính để con người giao tiếp với máy tính trong 5-10 năm tới”, ông Khải chia sẻ. Lãnh đạo Zalo cũng cho rằng có lẽ chỉ những ứng dụng trực tiếp đọc tín hiệu từ não mới vượt trội so với giọng nói.
Theo ông Khải, trợ lý ảo giọng nói có thể giúp con người tận dụng mọi lợi thế của công nghệ. Nhờ đó, không chỉ những người rành công nghệ mà mọi người, kể cả trẻ em, người già đều có thể sử dụng công nghệ.
Kiki - trợ lý ảo đa nền tảng cho người Việt
Tại sự kiện, Zalo đã ra mắt phiên bản mới của Kiki - trợ lý ảo tiếng Việt dành cho xe hơi và loa thông minh. Người dùng có thể kích hoạt Kiki bằng cách ra lệnh “Kiki ơi”. Tương tự các trợ lý ảo như Siri hay Google Assistant, Kiki có thể đặt báo thức, cung cấp thông tin thời tiết, kích hoạt bản đồ hoặc phát nhạc trên Zing MP3 một cách nhanh chóng.
Ngoài ra, các câu lệnh phức tạp như giải toán, hỏi về kiến thức như "Dân số Hà Nội là bao nhiêu", “Giá vàng hôm nay là bao nhiêu”, "Việt Nam giáp với nước nào" cũng được Kiki trả lời đầy đủ, chính xác.
Ông Trần Mạnh Hiệp, Admin diễn đàn Tinh tế chia sẻ rằng kích hoạt bản đồ là tính năng nổi bật của Kiki trên xe hơi, trong khi ngôn ngữ tiếng Việt được nhận diện tốt, phản hồi tự nhiên chứ không “máy móc” như một số trợ lý ảo.
"Điểm mình thích nhất ở Kiki là nó nói với mình bằng tiếng Việt, và giọng nói rất tự nhiên", ông Hiệp chia sẻ.
Khi xuất hiện lần đầu tại Zalo AI Summit 2018, Kiki chỉ có mặt trên smartphone Android. Với việc hỗ trợ xe hơi và loa thông minh, Kiki đã trở nên gần gũi hơn.
“Sau 2 năm, chúng tôi đã phát triển Kiki trên nhiều nền tảng khác nhau như Android hay iOS, tích hợp Kiki vào ứng dụng Zing MP3”, ông Duy Nguyễn, đại diện nhóm phát triển Kiki chia sẻ về cách trợ lý ảo "hiểu" được ngôn ngữ tự nhiên từ câu lệnh của người dùng qua hệ thống hiểu ngôn ngữ tự nhiên (NLU).
Từ năm ngoái, Zalo đã áp dụng Kiki lên Zing MP3 để tìm hiểu thói quen tìm kiếm của người dùng. Zalo đã phát triển hệ thống nhận diện lời bài hát và tên nhạc gần đúng để Kiki có thể đưa ra kết quả chính xác, dù câu lệnh tìm kiếm của người dùng bị sai lệch.
Đại diện nhóm phát triển Kiki chia sẻ về trợ lý ảo. |
“Chúng tôi muốn Kiki có khả năng phản hồi càng nhiều câu hỏi càng tốt, nhưng chất lượng câu trả lời cũng rất quan trọng”, ông Sơn Nguyễn, đại diện nhóm phát triển Kiki cho biết khó khăn khi phát triển mô hình hỏi đáp cho trợ lý ảo nằm ở lượng câu hỏi đa dạng, trong khi dữ liệu “huấn luyện” khá ít.
Trong tương lai, đội ngũ phát triển sẽ cải tiến Kiki bằng mô hình hỏi đáp tốt hơn, tận dụng nguồn dữ liệu do cộng đồng cung cấp (crowdsourcing) và thu thập phản hồi từ người dùng.
Ứng dụng AI trong y tế, báo chí
Hội thảo cũng có sự góp mặt của một số chuyên gia trong lĩnh vực AI. Bà My Nguyễn, Kiến trúc sư giải pháp tại Amazon Web Services đã chia sẻ một số kinh nghiệm trong việc vận hành hệ thống máy học hợp lý trên quy mô lớn. Trong đó, đội ngũ máy học và phần mềm cần làm việc với nhau một cách chặt chẽ hơn, quy mô đội ngũ cũng tỷ lệ thuận với quy mô hệ thống.
Từ Nhật Bản, Giáo sư Nguyễn Lê Minh, Giám đốc Trung tâm nghiên cứu Interpretable AI - Viện Khoa học và Công nghệ Nhật Bản (JAIST), cũng chia sẻ về tác động của đại dịch Covid-19. Ông cũng nói về việc áp dụng hệ thống xử lý ngôn ngữ tự nhiên (NLP) giúp các nhà khoa học thu nhận thông tin tốt hơn, đóng góp vào việc phòng chống đại dịch Covid-19 như nghiên cứu vaccine, giải quyết các vấn đề tâm lý...
Giáo sư Nguyễn Lê Minh chia sẻ trực tuyến về ứng dụng của AI trong phòng chống dịch Covid-19. Ảnh: Lê Trọng. |
Ông Chương Nguyễn, đại diện Zalo AI Lab đã chia sẻ về ứng dụng của AI trong lĩnh vực báo chí. Trong cuộc khảo sát với 71 tổ chức báo chí, AI được sử dụng nhiều nhất trong việc hỗ trợ sản xuất, phân phối nội dung và cải tiến mô hình kinh doanh báo chí.
Hiện tại, Zalo tập trung phát triển 3 khía cạnh chính cho AI trong báo chí gồm chuyển văn bản thành giọng nói tiếng Việt, lọc và phân phối nội dung. Hệ thống chuyển văn bản thành giọng nói đã xuất hiện trên ứng dụng Báo Mới, hỗ trợ tùy chỉnh giọng nam hoặc nữ, miền Bắc hoặc miền Nam.
Đội ngũ Zalo cũng đang nghiên cứu thuật toán nhận diện nội dung nhạy cảm, phân phối nội dung đến độc giả, hướng đến việc phát hiện tin giả hoặc video ghép mặt (deepfake) trong tương lai.
1.000 ứng viên tham gia Zalo AI Challenge
Trước hội thảo, các kỹ sư AI xuất sắc đã tham gia Zalo AI Challenge - cuộc thi nhằm khuyến khích và cổ vũ nghiên cứu AI tại Việt Nam.
Khi ra mắt sản phẩm, chúng ta mới nhận thấy nhiều bài toán thực tế của người dùng. Chúng ta phải đáp ứng những người dùng này thì sản phẩm mới thành công.
Duy Nguyễn, đại diện nhóm phát triển trợ lý ảo Kiki.
Tại hội thảo Zalo AI Summit, các ứng viên chiến thắng mỗi bảng đấu đã trình bày về thuật toán được đánh giá là hiệu quả nhất. Các đội quán quân sẽ nhận được 50 triệu đồng tiền mặt từ Zalo AI cùng các khóa học, dịch vụ từ Amazon Web Services.
Ông Huy Nguyễn, đại diện ban tổ chức cho biết Zalo AI Challenge 2020 thu hút khoảng 1.000 ứng viên tham gia trong và ngoài nước. Nhiều đại diện đang là sinh viên năm 3 hoặc 4, cho thấy các trường đại học đã quan tâm đầu tư nghiên cứu về AI nhiều hơn.
Các ứng viên giành chiến thắng 3 bảng thi tại Zalo AI Challenge 2020. |
Năm nay, Zalo AI Challenge gồm 3 bảng thi chính, với đề bài cho từng bảng gồm Nhận diện biển báo giao thông, Xác thực giọng nói tiếng Việt và Tóm tắt bài báo tiếng Việt. Mỗi đề bài đều có thách thức và yêu cầu riêng, cần có thuật toán xử lý một cách tối ưu, phù hợp.
Theo ông Huy, các đề tài của Zalo AI Challenge năm nay đều phù hợp với xu thế. Trong khi chủ đề nhận diện biển báo sẽ hữu ích trong lĩnh vực xe tự lái, chủ đề tóm tắt bài báo lại hình thành dựa trên xu hướng tiêu thụ nội dung từ nhiều nguồn khác nhau.