Voice Verification (định danh bằng giọng nói) là quá trình xác minh hai câu nói có thuộc cùng cá nhân hay không, từ đó, cho phép máy định danh người nói và cá nhân hóa trải nghiệm người dùng trong các tác vụ tiếp theo.
Trên thế giới, định danh bằng giọng nói không còn xa lạ với người dùng. Trong các lĩnh vực như an ninh, ngân hàng, công nghệ này là phương pháp nhận diện sinh trắc học bên cạnh nhận diện khuôn mặt, vân tay hay mống mắt. Dùng giọng nói để xác minh danh tính tại ngân hàng, thực hiện các tác vụ bảo mật trên điện thoại hoặc các thiết bị thông minh là những ứng dụng phổ biến của công nghệ này.
Với sự phát triển của các mô hình học sâu (deep learning) và nguồn dữ liệu phong phú, công nghệ xác thực giọng nói trong tiếng Anh có độ chuẩn xác cao. Tuy nhiên, với cộng đồng công nghệ Việt Nam, bài toán xác định danh tính bằng giọng nói tiếng Việt vẫn còn ở giai đoạn sơ khai, chưa có cách tiếp cận tối ưu với sự đa dạng của phương ngữ.
Trong cuộc thi “Zalo AI Challenge 2020”, các đội thi phải giải bài toán mới và có tính bản địa cao thông qua bảng đấu Voice Verification - xác thực danh tính bằng giọng nói tiếng Việt. Ở bảng này, các đội xây dựng mô hình máy học nhằm rút trích đặc trưng trong giọng nói người Việt, từ đó so sánh hai câu nói nhằm xác thực danh tính người nói.
Bảng thi đấu Voice Verification lần đầu xuất hiện tại Việt Nam. |
Đến với cuộc thi, các đội chơi được cung cấp bộ dữ liệu gồm hơn 10.000 câu nói tiếng Việt của hơn 500 người Việt được trích xuất từ các video phỏng vấn. Đây là nguồn dữ liệu giúp các đội huấn luyện các mô hình máy học nhằm phân biệt được giọng nói của hai người. Ngoài bộ dữ liệu cung cấp sẵn, các đội thi được khuyến khích tận dụng nguồn dữ liệu bên ngoài để gia tăng độ chính xác cho mô hình huấn luyện.
Tiến sĩ Nguyễn Tiến Huy, thành viên Zalo AI Lab, đồng thời là cố vấn cuộc thi, cho biết: “Sau 1 tuần mở cổng đăng ký, bảng đấu Voice Verification thu hút hơn 120 đội thi. Hiện tại, kết quả của các đội dẫn đầu rất sát sao với điểm chênh lệch 0,1%. Bảng xếp hạng cũng biến động từng ngày, các nhân tố bứt phá xuất hiện mỗi ngày, khiến cuộc đua trở nên thú vị hơn”.
Thứ hạng trên bảng đấu biến đổi từng ngày với kết quả sát sao. |
Dân công nghệ vốn quen với nhiều hình thức định danh khác nhau, từ mật khẩu, vân tay, khuôn mặt đến mống mắt. Trong thời gian tới, người Việt sẽ có thể xác thực nhanh chóng thông qua giọng nói bằng tiếng mẹ đẻ.
Bảng thi Voice Verification mang ý nghĩa mấu chốt với cộng đồng AI Việt Nam và được kỳ vọng là tiền đề giúp kỹ sư AI Việt tiếp cận và phát triển thêm nhiều ứng dụng từ công nghệ này.
“Zalo AI Challenge” là sự kiện hàng năm nhằm khuyến khích hoạt động nghiên cứu và ứng dụng trí tuệ nhân tạo ở Việt Nam. Với quan niệm công nghệ trước hết để phục vụ cuộc sống, đề bài của “Zalo AI Challenge” luôn được đánh giá cao ở tính thực tiễn, phù hợp với bối cảnh Việt Nam.
Zalo AI Challenge 2020 gồm 3 bảng đấu là News Summarization - tóm tắt nội dung tin tức tiếng Việt; Traffic Sign Detection - phát hiện và đọc nội dung biển báo giao thông Việt Nam và Voice Verification - xác thực danh tính bằng giọng nói tiếng Việt.
Ngoài giải thưởng tiền mặt 300 triệu đồng, mỗi đội quán quân và nhì bảng nhận được tài khoản AWS Activate Credits trị giá 10.000 USD với thời hạn sử dụng 2 năm, cùng 1 năm dịch vụ miễn phí từ đội ngũ hỗ trợ doanh nghiệp của AWS, giá trị 1.500 USD. Bên cạnh đó, top 15 của mỗi bảng thi cũng nhận được tài khoản tương tự với giá trị 1.000 USD/đội.
Độc giả tham khảo thêm thông tin chi tiết về cuộc thi tại đây.
Bình luận