“Show US the Data” là cuộc thi được phát động trên phạm vi toàn cầu với tổng giá trị giải thưởng 90.000 USD (hơn 2 tỷ đồng). Cuộc thi nhằm tìm kiếm giải pháp trong phân tích và xử lý dữ liệu để giải quyết các vấn đề “nóng” toàn cầu như đại dịch, biến đổi khí hậu, an ninh lương thực, đa dạng sinh học, đói nghèo, suy dinh dưỡng ở trẻ em... Điều này là cơ sở cho chính sách của các tổ chức chính phủ tại Mỹ, đồng thời giúp đánh giá hiệu quả dữ liệu quốc gia để có sự đầu tư hợp lý.
Đây là sân chơi có tính cạnh tranh cao, đòi hỏi các chuyên gia trí tuệ nhân tạo (AI), nhà khoa học máy tính phải tìm giải pháp AI nổi bật và chưa từng có, giúp nhận dạng tài liệu, dữ liệu công hiệu quả và nhanh chóng. Quán quân cuộc thi sẽ nhận được giải thưởng 30.000 USD.
Thành tích của đội thi Zalo trên bảng thành tích của Kaggle. |
Sau gần 3 tháng dự thi, 2 kỹ sư trẻ Việt Nam vượt qua 1.600 đội chơi từ nhiều quốc gia mang về niềm tự hào cho lĩnh vực công nghệ nước nhà. Trong khi các đối thủ tập trung phát hiện từ khóa chính, phụ thuộc những bộ dữ liệu được cung cấp và có thể bỏ sót giá trị, kỹ sư Zalo chọn hướng tiếp cận dựa trên deep learning (học sâu) để đưa ra giải pháp AI có thể phát hiện dữ liệu dựa trên các thành tố, thông tin ngữ cảnh liên quan dữ liệu chính được cung cấp. Những dữ liệu được tìm ra (detect) gần như không bị bỏ sót và phụ thuộc vào nguồn (tên, mã) dữ liệu được cung cấp ban đầu.
Điều này giúp 2 kỹ sư của Zalo chiến thắng ở cuộc thi AI toàn cầu. Ngoài việc giành về giải thưởng trị giá 30.000 USD, các giải pháp của 2 kỹ sư trẻ Nguyễn Quán Anh Minh và Nguyễn Tuấn Khôi của Zalo dự kiến được ứng dụng trong việc phân tích dữ liệu tại Mỹ.
Nguyễn Tuấn Khôi sinh năm 1994, hiện là kỹ sư data tại Zalo. |
Đánh giá về AI Việt Nam và thế giới, 2 kỹ sư của Zalo cho rằng trí tuệ của người Việt không thua quốc tế, có thể đưa ra các mô hình và giải pháp có sức cạnh tranh. Tuy nhiên, việc có sản phẩm vượt qua nhiều nước có nền tảng AI phát triển từ trước sẽ gặp nhiều thách thức. Tại Việt Nam, nhiều đơn vị bắt đầu tập trung nghiên cứu nghiêm túc lĩnh vực này.
Nguyễn Quán Anh Minh (kỹ sư AI, 1997) và Nguyễn Tuấn Khôi (kỹ sư data, 1994) là 2 thành viên khá trẻ tại Zalo. Đây cũng là một trong những đơn vị đi đầu trong việc nghiên cứu và ứng dụng AI ở Việt Nam, tập trung 4 mảng chính là thị giác máy tính (computer vision), xử lý tiếng nói (speech proceesing), xử lý ngôn ngữ tự nhiên (NLP), và big data & machine learning (dữ liệu lớn và máy học).
Nguyễn Quán Anh Minh sinh năm 1997, hiện là kỹ sư AI tại Zalo AI. |
Hiện thành tựu nghiên cứu từ AI của Zalo được ứng dụng trên nhiều sản phẩm của hệ sinh thái nhằm mang đến trải nghiệm tốt nhất cho người Việt. Ngoài ra, Zalo cũng cung cấp các công cụ giúp phát hiện đường lưỡi bò phi pháp, chuyển đổi văn bản thành giọng nói, phân loại hình ảnh, kiểm duyệt nội dung miễn phí ra cộng đồng.
Trong đó, sản phẩm trợ lý tiếng nói Kiki của Zalo dựa trên công nghệ tổng hợp tiếng nói và xử lý ngôn ngữ tự nhiên khá phổ biến trên xe hơi điều khiển bằng giọng nói, ứng dụng nghe nhạc Zing MP3, sắp tới xuất hiện trên hệ thống nhà thông minh.
Trợ lý tiếng Việt Kiki được người lái xe quen dùng từ năm 2020 đến nay. |
Ở mảng học thuật, Zalo cũng được đánh giá tích cực. “AI Summit” là một trong những diễn đàn lớn nhất trong năm về trí tuệ nhân tạo dành cho giới chuyên môn. Trong khi đó, “Zalo AI Challenge” là cuộc thi khuyến khích các bạn trẻ tham gia và nghiên cứu AI với sự hướng dẫn từ các chuyên gia AI trong ngành.
Đơn vị này cũng đạt được nhiều giải thưởng cao trong lĩnh vực AI về công nghệ xử lý tiếng nói. Các kỹ sư AI của Zalo có nhiều bài báo được đăng trên tạp chí khoa học quốc tế.
Ra đời vào năm 2010, Kaggle trở thành nền tảng thi đấu về AI lớn nhất thế giới, đặc biệt ở lĩnh data sciences và machine learning. Kaggle cung cấp các bộ dữ liệu lớn để cộng đồng tham gia giải quyết các bài toán mang tính xã hội cao và so sánh thuật toán với nhau đến khi đạt độ chính xác cao nhất. Kaggle cũng là cộng đồng cho phép việc chia sẻ các mã, thuật toán, dữ liệu cũng như các khóa huấn luyện AI ngắn hạn. Đây được xem là nơi thích hợp để học và rèn luyện về AI, đặc biệt ở lĩnh vực data sciences và machine learning.
Bình luận