Sau hơn một tháng diễn ra, Zalo AI Challenge 2021 chính thức khép lại, 3 đề bài đã tìm ra 3 đội quán quân với các giải pháp hữu hiệu nhất.
Ở đề 5K Compliance, quán quân thuộc về đội NTBN với 0,86703 điểm đo bằng chỉ số F1. Đề Hum to song tìm được quán quân là đội Wano với 0,40188 điểm đo bằng chỉ số MRR. Cuối cùng, đề thi Legal text retrieval tìm được quán quân là đội 3PU với số điểm 0,64804 đo bằng số đo F2.
Những người trẻ gắn liền với ghế nhà trường
Nhà vô địch Zalo AI Challenge hàng năm đều là những người có tuổi đời và tuổi nghề còn rất trẻ. Năm 2021 cũng không ngoại lệ bởi cả ba đội quán quân đều chưa đến tuổi 30 và còn gắn liền với ghế nhà trường.
Quán quân đề 5K Compliance là Nguyễn Nhật Hoàng, sinh năm 1999 và đang là sinh viên năm cuối chuyên ngành Khoa học máy tính, Đại học Bách Khoa Hà Nội. Trong mắt Hoàng, Zalo AI Challenge là cuộc thi về trí tuệ nhân tạo hàng đầu trong nước nên dù là sinh viên, bạn vẫn muốn thử sức để trau dồi kinh nghiệm.
Hoàng cho rằng với kiến thức ở trường, bạn có thể tự tin lựa chọn và huấn luyện các mô hình trí tuệ nhân tạo. Sau cuộc thi, Hoàng sẽ tập trung cho đồ án tốt nghiệp đại học và tiếp tục theo đuổi đam mê nghiên cứu AI.
Quán quân đề 5K Compliance là Nguyễn Nhật Hoàng, sinh năm 1999. Ảnh chụp từ website chương trình. |
Tương tự Nhật Hoàng, các thành viên đội Wano - quán quân đề Hum to song - cũng là những người trẻ. Vừa tốt nghiệp đại học, họ chọn Zalo AI Challenge để kiểm định kiến thức được học áp dụng vào thực tế như thế nào.
"Đội mình mới làm quen với lĩnh vực Speech, Voice, kiến thức còn hạn chế, nhưng may mắn có kiến thức nền về Toán, Trí tuệ nhân tạo được học tại trường đại học nên cũng khá tự tin", đại diện đội Wano chia sẻ.
Cuối cùng, đội 3PU - quán quân đề Legal Text Retrieval - gồm ba kỹ sư trẻ đang theo học chương trình nghiên cứu sinh tiến sĩ về lĩnh vực trí tuệ nhân tạo và khoa học dữ liệu tại Mỹ. Việc học tập và nghiên cứu giúp họ có thêm kinh nghiệm phân tích dữ liệu, lựa chọn, thực thi mô hình cho giải pháp.
Nỗ lực cải thiện giải pháp AI qua từng năm
Ngoài sức trẻ, một điểm chung của ba đội quán quân Zalo AI Challenge 2021 là đi lên từ những thất bại. Các quán quân năm nay đều từng tham gia cuộc thi và không giành vị trí cao những mùa trước.
Sau thất bại ở năm trước, Nhật Hoàng tiếp tục trau dồi kiến thức để khi Zalo AI Challenge 2021 chính thức công bố đề thi, bạn đã bắt tay vào nghiên cứu tìm ra giải pháp. Hoàng chọn đề bài 5K Compliance vì đề thuộc lĩnh vực thị giác máy tính mà bạn đang nghiên cứu và đây là đề bài thiết thực trong cuộc sống hiện tại.
Vào ngày cuối cùng của cuộc thi, Hoàng vẫn loay hoay xây dựng docker để đóng gói giải pháp và gửi về ban tổ chức. "Vì mô hình của mình khá nặng nên việc tải lên Google Drive rất khó khăn. Có lúc mình định bỏ cuộc, nhưng thật may mình đã quyết tâm thực hiện đến cùng để không đi vào vết xe đổ năm 2020", cậu chia sẻ.
"Để thực hiện giải pháp năm nay, nhóm mình đã nghiên cứu các phương pháp đa dạng hóa dữ liệu, mô hình phát hiện đối tượng và đặc biệt là mô hình phân loại ảnh. Mình thấy giải pháp của đội có tính ứng dụng thực tế khá tốt, nhưng mình vẫn chưa tự tin về tốc độ nếu muốn sử dụng trong thời gian thực. Muốn làm được điều này, mình phải cân bằng thêm giữa tính chính xác và tốc độ của mô hình", quán quân đề 5K Compliance nhận xét.
Quán quân đề Hum to song là ba bạn trẻ vừa tốt nghiệp đại học. Ảnh chụp từ website chương trình. |
Rút kinh nghiệm từ thất bại năm 2020, đội Wano thực hiện giải pháp gồm hai phần chính: "Đầu tiên là xây dựng, huấn luyện mô hình rút trích đặc trưng để trích xuất các đặc trưng của hum và song. Sau đó, so khớp đặc trưng của hum với đặc trưng của các song để tìm ra song liên quan đến hum nhất. Để nâng cao điểm số, đội xây dựng phương pháp tăng cường dữ liệu cho mô hình rút trích đặc trưng trong lúc huấn luyện", các thành viên chia sẻ.
Quán quân đề Legal Text Retrieval là ba nghiên cứu sinh tiến sĩ tại Mỹ. Ảnh chụp từ website chương trình. |
Quyết tâm thay đổi vị trí xếp hạng so với năm ngoái, đội 3PU chuẩn bị kỹ càng hơn bằng việc liên tục cập nhật kiến thức, các bài báo mới nhất về lĩnh vực Information Retrieval và học cách diễn tả ý tưởng sao cho hiệu quả.
"Chúng mình bắt đầu đi từ mô hình đơn giản và thông dụng nhất cho bài toán Information Retrieval là BM25. Điểm số khi đó khá thấp nên chúng mình quyết định cải thiện bằng các mô hình học sâu (Deep learning) khác nhau kết hợp BM25. Chúng mình cũng tìm hiểu thêm kinh nghiệm huấn luyện (training) và kết hợp (ensemble) nhiều mô hình từ Kaggle, các bài báo khoa học mới nhất hoặc giải pháp từ challenge tương tự trên thế giới như Microsoft MACRO Document/Passage Retrieval để cải thiện giải pháp của nhóm", đội cho biết.
Trong bối cảnh dịch bệnh, một tháng diễn ra cuộc thi không phải là thời gian quá dài nhưng đủ để cho thấy nỗ lực của những người trẻ Việt đang cố gắng chinh phục đỉnh cao trí tuệ nhân tạo.
Bình luận