- Sự kiện Zalo AI Summit 2022 diễn ra vào 9h sáng 17/12 với chủ đề "AI đã thay đổi cuộc sống người Việt như thế nào".
- Các chuyên gia uy tín trong lĩnh vực AI tại Việt Nam chia sẻ giải pháp ứng dụng AI trong nhiều lĩnh vực như y tế, ngôn ngữ học và giáo dục.
- Đại diện Zalo AI nói về hành trình xây dựng trợ lý giọng nói tiếng Việt Kiki.
- Các đội thi xuất sắc tại Zalo AI Challenge trình bày giải pháp được đánh giá cao dành cho một số tác vụ cụ thể.
-
Chủ đề của Zalo AI Summit 2022
Được tổ chức lần đầu vào năm 2017, Zalo AI Summit là sự kiện quy tụ các chuyên gia uy tín trong lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam và trên thế giới.
Trong lần thứ 5 được tổ chức, Zalo AI Summit mang chủ đề "AI đã thay đổi cuộc sống người Việt như thế nào?". Những khách mời tại sự kiện sẽ mang đến các giải pháp ứng dụng AI vào các lĩnh vực trong cuộc sống.
Đề tài thu hút sự quan tâm của cộng đồng yêu công nghệ bởi trong 2 năm qua, ngành AI tại Việt Nam có bước tiến nhất định để đáp ứng các xu hướng mới, hình thành trong bối cảnh nhu cầu ứng dụng công nghệ tăng cao do đại dịch.
-
Các khách mời tại Zalo AI Summit 2022
Tiến sĩ Sơn Phạm, CEO BioTuring là tác giả của nhiều nghiên cứu tin sinh học (bioinformatics). Cùng với những chuyên gia khác, ông tham gia giảng dạy khóa học đầu tiên về tin sinh học trên Coursera với hơn 20.000 học viên.
PGS.TS Đinh Điền hiện là Giám đốc Trung tâm Điện toán Ngôn ngữ, Trường ĐH Khoa học Tự nhiên (ĐHQG TP.HCM). Ông có nhiều đề tài nghiên cứu và bài báo khoa học trên tạp chí quốc tế, xoay quanh việc áp dụng AI trong dịch máy, ngôn ngữ học đối chiếu và dạy tiếng Việt cho người nước ngoài.
Hội thảo còn có sự tham gia của các đại diện đến từ Zalo AI như ông Châu Thành Đức, Giám đốc Khoa học Dữ liệu Zalo AI, chịu trách nhiệm phát triển các sản phẩm “AI-first” (ưu tiên cho AI).
Câu chuyện về sự ra đời của trợ lý giọng nói Kiki được chia sẻ bởi ông Nguyễn Hoàng Khánh Duy, một trong những người phát triển trợ lý giọng nói tiếng Việt từ các dòng mã đầu tiên. Từ khi ra mắt vào tháng 12/2020, Kiki được tích hợp trên hơn 18 hãng màn hình ôtô thông minh, đạt mốc 200.000 lượt cài đặt.
Bên cạnh chia sẻ từ chuyên gia, các giải pháp thực tiễn nhằm ứng dụng AI trong xã hội sẽ được trình bày bởi các kỹ sư xuất sắc của Zalo AI Challenge - cuộc thi nhằm khuyến khích và cổ vũ nghiên cứu AI tại Việt Nam.
-
Trước giờ sự kiện bắt đầu, hàng trăm bạn trẻ đã có mặt tại VNG Campus để thực hiện thủ tục check-in. Việc xác minh thông tin được thực hiện nhanh chóng thông qua việc quét mã QR bằng ứng dụng Zalo trên di động.
-
Sự kiện bắt đầu
Đúng 9h10, ông Tú Nguyễn, Giám đốc Công nghệ Zalo công bố khai mạc sự kiện. Ông Tú chia sẻ hiện AI đã được ứng dụng vào nhiều lĩnh vực như y tế, tài chính, nông nghiệp... giúp tăng năng suất, giảm chi phí và tăng cường chất lượng đời sống. "Đây là sự kiện được Zalo quan tâm đầu tư. Trong đó, AI Summit là nơi chia sẻ giá trị, ứng dụng của AI trong đời sống và kể cả tại Zalo", ông Tú cho biết.
Ngay tại Zalo, AI cũng được ứng dụng trong nhiều lĩnh vực như nhận diện khuôn mặt, bên cạnh trợ lý giọng nói Kiki dùng cho xe hơi. Hiện tại, hơn 200.000 ôtô tại Việt Nam đã được cài công cụ này. -
1.500 đội dự thi Zalo AI Challenge
Đối với Zalo AI Challenge, sự kiện được tổ chức thường niên nhằm cổ vũ nghiên cứu, phát triển AI tại Việt Nam. "Bộ đề của Zalo được lựa chọn phù hợp với thực tiễn xã hội, cùng với bộ dữ liệu dành cho các đội thi giúp triển khai hiệu quả các giải pháp", ông Tú chia sẻ.
Với các mô hình được chia sẻ, ông Tú cho biết AI sẽ ngày càng dễ tiếp cận, có thể giảng dạy online hoặc tại các trường đại học.
Zalo AI Challenge năm nay có sự tham gia của một số cố vấn giúp ra đề thi chất lượng hơn. Ngoài ra, cách tính điểm performance cũng có sự thay đổi nhằm quyết định người chiến thắng. Theo ông Tú, có khoảng 1.500 đội tham gia Zalo AI Challenge năm nay, cao hơn so với các năm trước.
-
Nhiều khó khăn trong quá trình huấn luyện AI
Ông Nguyễn Hoàng Khánh Duy, Quản lý Sản phẩm Kiki, chia sẻ về chủ đề "Chặng cuối để đưa AI vào đời thực". Ông cho biết Kiki hiện có hơn 1 triệu người dùng, trong đó lượng người dùng cài đặt Kiki trên xe hơi đạt mốc 200.000 người.
Khi chuyển đổi từ Zing MP3 sang mô hình sử dụng trên xe hơi, đội ngũ tại Zalo gặp khó khăn trong việc nhận diện tên địa điểm từ giọng nói. Với mô hình ASR cùng dữ liệu của 350.000 địa điểm, Kiki có thể "hiểu" địa điểm của người dùng tốt hơn, đồng thời phân biệt tên địa điểm với lời bài hát.
Ông Duy đưa ra các trường hợp sử dụng thực tế, khi nhiều thông tin nhập vào từ người dùng bao gồm cả tiếng Việt và nhiều ngôn ngữ khác. Do đó, Kiki cần đủ thông minh để phân biệt các trường hợp để ghi nhận nội dung được chia sẻ.
-
Phát triển giọng nói trên Kiki
Trong mô hình ASR, đội ngũ Kiki còn tích hợp module nhận diện giọng nói (Voice Activity Detection - VAD), kết hợp phân tích bối cảnh để nhận biết thời điểm hoàn thành nhận lệnh. GIải pháp này giúp giảm 40% lần nhận diện sai, và giảm 30% thời gian chờ dừng lệnh.
Đối với những dòng lệnh có quãng nghỉ giữa câu dài (do thói quen người dùng), trợ lý giọng nói có thể dừng nhận lệnh dù chưa hết câu. "Trong thử nghiệm, mạng ổn định AI có thể hoạt động liền mạch. Tuy nhiên ra thực tế, sản phẩm sẽ đối mặt với nhiều vấn đề phức tạp khác", ông Duy chia sẻ về những khó khăn trong quá trình xây dựng Kiki tại Zalo.
Đội ngũ dự án cho biết sẽ liên tục làm việc, cập nhật để giải quyết vấn đề người dùng có trải nghiệm tốt nhất cùng trợ lý giọng nói. "Xây dựng Kiki là hành trình cố gắng, chăm chút từ những điều nhỏ nhất để tạo ra sự khác biệt, mang đến trải nghiệm tốt nhất cho người dùng", ông Duy nói.
-
Giải pháp xác thực danh tính
Ông Châu Thành Đức, Giám đốc Khoa học Dữ liệu Zalo AI, chịu trách nhiệm phát triển các sản phẩm “AI-first” (ưu tiên cho AI) chia sẻ về quá trình xây dựng giải pháp xác thực danh tính eKYC. Theo ông Đức, hiện có 5 ngân hàng và tỗ chức tài chính sử dụng eKYC, với 30.000 lượt xác thực danh tính mỗi ngày. Hệ thống của Zalo sử dụng ảnh chân dung đối chiếu với căn cước công dân để xác minh danh tính người dùng.
Một số khó khăn khi đối chiếu dữ liệu bao gồm ảnh bị mờ, chói sáng tại khu vực quan trọng hoặc căn cước không hợp lệ. Điều đó khiến quá trình xác thực không thành công.
"Một mô hình eKYC muốn đi vào sử dụng thực tế phải giải quyết được toàn bộ những vấn đề này", ông Đức nói.
-
AI không được tạo ra để thay thế con người hoàn toàn
Bên cạnh lỗi ảnh kém chất lượng, một số trường hợp tấn công (chụp ảnh màn hình, chân dung từ ảnh in hoặc hình nộm), người dùng bị tai nạn biến dạng mặt hoặc phẫu thuật thẩm mỹ. Từ các trường hợp trên, đội ngũ Zalo AI Lab đã xây dựng các giải pháp xử lý để sử dụng trong thực tế.
Cuối cùng, trong những trường hợp khó, vẫn phải dùng tới biện pháp xác thực thủ công bằng con người. Ông Đức cho rằng AI không được tạo ra để thay thế hoàn toàn con người.
-
Khó có AI hoàn hảo ngay từ khi ra mắt
Tối ưu để sử dụng trong thực tế là mục tiêu chính của eKYC. Dù vậy theo ông Đức, vẫn còn "chặng đường dài" để tạo ra sản phẩm tốt hơn theo từng ngày. "Sự hoàn hảo trên AI có thể không có thật trong thực tế. Đội ngũ muốn gửi gắm mục tiêu phát hiện ra lỗi và hoàn thiện sản phẩm mỗi ngày", ông Đức nói thêm.
-
Toàn cảnh sự kiện
-
Ứng dụng của AI trong ngôn ngữ học
PGS.TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học Tính toán, Trường ĐH Khoa học Tự nhiên (ĐHQG TP.HCM) chia sẻ về đề tài "Ứng dụng AI trong Ngôn ngữ học và Giáo dục".
Theo thống kê, tiếng Việt là một trong 20 ngôn ngữ được sử dụng nhiều nhất thế giới. Đối với tiếng Việt, bên cạnh ngữ âm còn có thanh điệu nên sẽ khó học với những người dùng ngôn ngữ mẹ đẻ không có thanh điệu. Điều đó đặt ra bài toán dạy tiếng Việt hiệu quả cho người nước ngoài trong mọi thời điểm. Đó là lúc xây dựng mô hình AI hiệu quả.
Các ứng dụng của AI có thể được sử dụng để nghe và nhận diện cách người nói phát âm, tìm lỗi sai.
-
Huấn luyện AI học tiếng Việt
Để xây dựng mô hình AI dạy tiếng Việt, các kỹ sư cần lập danh sách từ được sử dụng nhiều, sau đó "huấn luyện" AI cách tiếp nhận đầy đủ một từ hoặc cụm từ hoàn chỉnh, không bị ngắt quãng. Ngoài ra, AI cũng cần phân biệt loại từ (danh từ, động từ, tính từ...) để sử dụng đúng ngữ cảnh.
"Làm sao để AI biết đâu là một từ, đâu là tiếng, thành tố trong một từ. Các yêu cầu này buộc phải dùng đến máy học, AI", Tiến sĩ Đinh Điền chia sẻ quan điểm. Theo ông Điền, khi nắm được 10% số từ thông dụng, người học đã có thể đọc 90% số văn bản được viết bằng một loại ngôn ngữ.
-
AI được dùng để đo độ khó ngôn ngữ
Sau khi nhận diện ngữ pháp, AI tiếp tục được huấn luyện để dạy văn phạm, gồm các câu dài và phức tạp theo từng cấp độ. Theo ông Điền, để nhận diện độ khó của câu, AI được huấn luyện để nhận biết tần suất sử dụng của các từ, cấu trúc câu (câu đơn, câu phức) và sự liên kết ý nghĩa giữa các câu.
Ông Điền cho rằng độ khó của một từ được tính toán bằng cách đo độ thông dụng của từ. Được sử dụng trong thực tế càng ít, độ khó của từ càng cao. Hệ thống nhận diện độ khó văn phạm của AI có thể ứng dụng trong việc tuyển phóng viên, viết tài liệu, chỉnh sửa sách, biên soạn từ điển hoặc sách giáo khoa, với độ khó phù hợp theo từng độ tuổi.
"Con người không thể biết chắc một từ dễ hay khó. Bảng xếp hạng dựa trên máy học, AI giúp xác định tần suất sử dụng của từ chính xác hơn", Tiến sĩ Đinh Điền nói.
-
Một trong những đặc điểm của tiếng Việt là một từ có thể mang nhiều nghĩa. Các kỹ sư có thể xây dựng kho dữ liệu gồm các câu chứa những từ trên, sau đó "huấn luyện" AI để đưa ra từ ngữ phù hợp để dùng trong câu tiếng Việt, giúp người nước ngoài sử dụng đúng cách tùy ngữ cảnh.
"Dựa trên dữ liệu của câu nói, máy học có thể đưa ra ví dụ về trường hợp sử dụng thực tế của một từ. Nhờ đó, người dùng có thể học hiệu quả hơn", ông Điền nói.
-
Máy dịch thay thế con người
Tiến sĩ Đinh Điền đưa ra vấn đề về các ứng dụng dịch thuật. Hiện tại, những phương tiện hỗ trợ dịch thuật từ tiếng Anh có thể được ứng dụng nhiều trong thực tế. "Liệu việc đào tạo phiên dịch tiếng Anh có còn cần thiết?", ông Điền đặt câu hỏi.
Tiến sĩ cho rằng kho dữ liệu của máy dịch ngày càng được mở rộng nhờ sự đóng góp của cộng đồng.Tuy nhiên tính ồn định của công nghệ vẫn cần được chứng minh, dựa trên ngữ cảnh. Do đó, con người cần sử dụng kiến thức, kỹ năng cho các lĩnh vực yêu cầu cao hơn. Trong khi đó, AI có thể được sử dụng thay thế cho những nhu cầu cơ bản.
-
Dùng AI để dịch chữ Nôm
Đối với những người nghiên cứu văn học, dịch từ chữ Nôm sang chữ Quốc ngữ là nhu cầu cần thiết. Tuy nhiên, đa số công cụ dịch hiện nay chỉ hỗ trợ dịch Anh - Việt hoặc Hán - Việt. Ông Điền nêu một số lý do cần dịch chữ Nôm sang chữ Quốc ngữ như tìm hiểu lịch sử, đọc tài liệu liên quan đến chủ quyền, và AI là công cụ hỗ trợ hiệu quả.
Bài toán khó khi dùng AI dịch chữ Nôm sang chữ Quốc ngữ là một chữ Nôm có thể có nhiều cách dịch, trong khi những dịch giả có thể có cách dịch khác nhau.
-
Theo ông Điền, những thách thức khi ứng dụng AI trong ngôn ngữ và giáo dục như bộ dữ liệu huấn luyện chưa đa dạng. Thay vì sử dụng công cụ của Google, AI dịch thuật do người Việt xây dựng có thể ứng dụng trong môi trường doanh nghiệp, hỗ trợ các công ty nước ngoài trong dịch thuật, tránh những sai sót gây sai nghĩa do ngắt câu không đúng vị trí.
Ông Điền khẳng định đó là thế mạnh của người Việt trong xây dựng bộ dữ liệu ngôn ngữ để huấn luyện Iuyện AI trong dịch thuật.
-
Một vũ trụ khác trên đầu ngón tay
Bên cạnh giáo dục và ngôn ngữ, y tế cũng là lĩnh vực thu hút sự quan tâm của các kỹ sư AI. Tiến sĩ Sơn Phạm, CEO BioTuring là tác giả của nhiều nghiên cứu tin sinh học (bioinformatics), chia sẻ về chủ đề "AI nghiên cứu con người: hướng đến hiểu biết sâu sắc hơn về bệnh tật và phương pháp điều trị".
Ông Sơn cho rằng con người đang tìm cách để khai phá vũ trụ. Tuy nhiên, một vũ trụ khác ở bên cạnh chúng ta có thể được nghiên cứu, chính là sinh học. "Khi dùng kính hiển vi soi vào đầu ngón tay, chúng ta nhìn thấy một tế bào. Sâu hơn trong đó là các lớp tế bào, nhân tế bào. Trong nhân là bộ gen là nhiễm sắc thể", ông Sơn chia sẻ.
-
Ông Sơn cho biết ADN của con người có thể quy đổi ra cuốn sách với 3 tỷ chữ cái. Trong lịch sử, nhiều nhà khoa học đã góp phần xây dựng công trình giải mã trình tự gen, lập ra bản đồ gen của con người. Trong các nghiên cứu về giải trình tự gen, khó khăn chung đến từ khối lượng dữ liệu, cách tổ chức và sắp xếp.
-
Khán giả theo dõi chia sẻ của ông Sơn về quãng thời gian đưa công trình giải mã trình tự gen đầu tiên của con người lên Internet, gồm những thách thức, khó khăn và kết quả ban đầu.
-
Ứng dụng AI để dự báo bệnh tật
Theo ông Sơn, một trong những khó khăn khi ứng dụng AI vào sinh học chính là cách đưa dữ liệu để huấn luyện, đại diện các trình tự gen theo cách mà máy tính có thể đọc.
Đi sâu vào "vũ trụ" của mỗi con người, một trong những khía cạnh nghiên cứu phổ biến tập trung vào tế bào miễn dịch và ung thư.Thách thức là nhận biết tế bào nguy hiểm, đồng thời "dịch" dữ liệu đại diện các cấu trúc xoắn của chuỗi protein.
-
Ông Sơn lấy ví dụ với công trình của DeepMind, bằng cách theo dõi sự hình thành và cấu trúc sẵn có để dự đoán cấu trúc xoắn của chuỗi protein.
Mỗi con người có 37 nghìn tỷ tế bào. Theo CEO BioTuring, AI có thể được ứng dụng để nhận biết từng tế bào, sau đó phân loại, phân tích cách tương tác cũng như nhận biết tế bào có khả năng gây bệnh.
Với ứng dụng trên, AI có thể giúp các nhà khoa học phân tích các loại tế bào mới, lập bản đồ "vũ trụ" tế bào trong mỗi con người, từ đó so sánh sự khác biệt giữa người khỏe mạnh và người bệnh.
-
Trao giải Zalo AI Challenge
Sau phần chia sẻ của diễn giả, các giải pháp thực tiễn nhằm ứng dụng AI trong xã hội được trình bày bởi các kỹ sư xuất sắc của Zalo AI Challenge. Đây là cuộc thi nhằm khuyến khích và cổ vũ nghiên cứu AI tại Việt Nam.
Năm nay, cuộc thi chia thành 3 bảng với những đề bài gồm: E2E Question Answering - tìm câu trả lời chính xác từ Wikipedia cho một câu hỏi, Liveness Detection - xác định khuôn mặt người trong video là thật hay giả và Lyric Alignment - giải pháp cân chỉnh khớp lời bài hát và nhạc. Zalo AI Challenge 2022 có 1.500 đội tham gia với tổng giải thưởng 15.000 USD.
-
Đội thắng giải hạng mục đầu tiên
Đại diện ban giám khảo Zalo AI Challenge 2022 cho biết sau 4 tuần, giải pháp từ các đội thi đều cho hiệu quả cao, thời gian xử lý nhanh chóng. Với đề bài đầu tiên, các giải pháp được đánh giá cao đến từ 2 đội NguyenLe và Telegram.
Năm nay, cuộc thi áp dụng đo thời gian trả kết quả và tỷ lệ tương đồng sau mỗi lần truy vấn, dựa theo độ phức tạp để tính điểm xếp hạng. Chung cuộc, đội Telegram chiến thắng bảng thi E2E Question Answering.
-
Tại bảng thi Liveness Detection (xác định khuôn mặt người trong video là thật hay giả), 2 đội xếp hạng cao gồm NNN và Cool Water. Các đội đều áp dụng những mô hình mới, được đánh giá cao. Sau khi cho nhận diện 1.253 mẫu, đội Cool Water giành chiến thắng với hiệu quả nhận diện cao, thời gian xử lý trung bình nhanh hơn.
Đề bài cuối cùng là Lyric Alignment (giải pháp cân chỉnh khớp lời bài hát và nhạc). Đội thi được cung cấp file nhạc và lời bài hát, từ đó tạo ra thuật toán chạy lời bài hát sao cho khớp với nhạc, tương tự các phần mểm karaoke.
2 đội xếp hạng cao tại bảng thi gồm Farmers và Telegram. Sau khi đánh giá hiệu quả thực tế trên các bài hát có tiết tấu chậm (cấp độ dễ) đến tiết tấu nhanh (cấp độ khó), đội Farmers giành chiến thắng.
-
Những nhà vô địch Zalo AI Challenge 2022
PGS.TS Trần Minh Triết trao giải cho các đội á quân từng bảng thi, với kỷ niệm chương cùng 1.500 USD. Tiếp theo, ông Nguyễn Minh Tú, Giám đốc Công nghệ Zalo trao giải 3.500 USD cho quán quân từng bảng thi.
Telegram, Cool Water và Farmers là 3 nhà vô địch của Zalo AI Challenge 2022. Tại sự kiện, BTC còn trao giải phụ cho các đội có giải thuyết phục (trị giá 100 USD) và đội có tốc độ xử lý nhanh (trị giá 250 USD).
-
Ngoài giải thải chính, BTC tiếp tục trao thưởng dành cho các đội thi nội bộ, trị giá 1.000 USD cho mỗi giải. Những đội chiến thắng là pikapaki (bảng E2E Question Answering), Songoku (bảng Liveness Detection) và luannd (bảng Lyric Alignment).
-
Sự kiện kết thúc sau hơn 3 giờ. Khán giả đã được nghe chia sẻ về giải pháp ứng dụng AI trong y tế và giáo dục, hành trình xây dựng trợ lý giọng nói Kiki. Ngoài ra, cuộc thi Zalo AI Challenge chứng kiến các giải pháp hữu ích, hiệu quả trong việc ứng dụng AI vào những tác vụ cụ thể.
Zalo AI Summit 2022
Thách thức khi ứng dụng AI trong cuộc sống
Tiềm năng và thách thức khi ứng dụng AI trong cuộc sống đã được các chuyên gia chia sẻ tại hội thảo Zalo AI Summit 2022 diễn ra sáng 17/12.
Những khoảnh khắc đáng nhớ tại Zalo AI Summit 2022
Các chủ đề thảo luận tại Zalo AI Summit 2022 thu hút sự quan tâm của cộng đồng yêu công nghệ, chú trọng vào những thành công và khó khăn khi ứng dụng AI trong cuộc sống người Việt.
Zalo AI Summit 2022 - đưa trí tuệ nhân tạo trở nên 'bình dân' hơn
Ngày 17/12, tại VNG Campus, Zalo AI Summit 2022 đã diễn ra với sự tham dự của các chuyên gia, diễn giả hàng đầu và đông đảo thành viên của cộng đồng yêu công nghệ.
Zalo AI Summit 2022 - AI và những tác động đến đời sống người Việt
Tại hội thảo, các kỹ sư công nghệ tại Zalo cùng nhiều chuyên gia trong các lĩnh vực khác nhau đã trao đổi về thành công và thách thức khi ứng dụng AI vào cuộc sống.