Zalo đạt giải nhất cuộc thi AI về xử lý tiếng nói

Thứ năm, 7/11/2019 18:30 (GMT+7)
18:30 7/11/2019

Tại cuộc thi VLSP năm 2019 do Viện Hàn lâm Khoa học và Công nghệ cùng Trường ĐH Khoa học tự nhiên tổ chức, Zalo đạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.

Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP ((Vietnamese Language and Speech Processing) nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.

VLSP 2019 được phát động từ đầu tháng 9, có 4 hạng mục: Hate Speech Detection on Social Networks (Nhận diện các nội dung tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc tiếng Việt); Automatic Speech Recognition (Nhận dạng tiếng nói); Text To Speech (Tổng hợp tiếng nói).

Ban tổ chức và các đội dự thi tại VLSP.

Về đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1.000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình AI của các đội thi phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.

Điểm khó nhất của đề thi này là dữ liệu đầu vào khá nhiễu, các đội thi cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có 2 tuần khiến cho nhiều đội thi gặp trở ngại.

“Team Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội thi khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo chia sẻ.

Xử lý dữ liệu đầu vào càng tốt, mô hình AI cho kết quả càng cao. Ảnh: Exteme Tech.

Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý tiếng nói tiếng Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và tiếng nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, team Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.

Xử lý tiếng nói tiếng Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Ông Nguyễn Quốc Bảo cho rằng dữ liệu huấn luyện phải từ 2.000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng tiếng nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.

Hiện Zalo đang ứng dụng công nghệ xử lý tiếng nói vào phát triển và hoàn thiện trợ lý ảo Ki-Ki, đồng thời, sẽ triển khai tích hợp vào 2 sản phẩm Zing News và Báo Mới trong thời gian tới để mang đến trải nghiệm tốt nhất cho người dùng.

Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện tiếng nói).

Người Việt đang cố tạo ra AI có trí tưởng tượng như não người

Trí tưởng tượng, một trong những khả năng tuyệt vời của con người cũng là những gì mà các nhà khoa học về trí tuệ nhân tạo đang nghiên cứu và xây dựng cho các hệ thống AI của mình.

16:44 16/10/2019

Hà My

zalo đoạt giải cuộc thi vlsp 2019 Zalo vlsp xử lý giọng nói zalo ai trí tuệ nhân tạo

Zalo
Zalo là ứng dụng nhắn tin và gọi điện miễn phí hoạt động trên nền tảng di động và máy tính, được phát triển bởi đội ngũ kỹ sư của công ty VNG và ra mắt lần đầu tháng 12/2012. Tháng 6/2016, Zalo bắt đầu phát hành phiên bản địa phương đầu tiên ở thị trường Myanmar. Tháng 5/2018, Zalo chính thức đạt mốc 100 triệu người dùng.
Bạn có biết: Tải Zalo PC cho máy tính để sử dụng các tính năng vượt trội trên Zalo PC như gửi file 1GB, Chụp màn hình, Chat nhóm, Phân loại nhóm,…
- Ra mắt: 12/2012
- Công ty phát triển: VNG
Website

Zalo đạt giải nhất cuộc thi AI về xử lý tiếng nói

Người Việt đang cố tạo ra AI có trí tưởng tượng như não người

Zalo

Đọc tiếp

Riot hé lộ game biến người chơi thành huấn luyện viên LMHT

Khoa Pug đã sửa video về nữ phục vụ Nhật nhưng không xin lỗi

Bị chê xấu, iPhone 11 vẫn trở thành một chuẩn mực

Bạn có thể quan tâm