Cuộc thi “Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực” do Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) tổ chức, được triển khai toàn cầu trên Kaggle - sân chơi uy tín dành cho cộng đồng khoa học dữ liệu. Cuộc thi diễn ra từ 31/12/2020 đến 31/3/2021.
Sau 3 tháng tranh tài, cuộc thi đã tìm ra chủ nhân của ba vị trí nhất, nhì, ba và giải thưởng đặc biệt dành cho đội Việt Nam có thành tích cao nhất trên tổng số 1.277 đội thi.
Đứng thứ nhất cuộc thi và nhận giải thưởng trị giá 20.000 USD là đội MS2F, gồm các thành viên đến từ Ủy ban Năng lượng Nguyên tử Quốc gia Argentina, Công ty Công nghệ y tế Ấn Độ HealthGenYZ, Tập đoàn Intel và H2O.ai (Google). Đội SZI đứng thứ hai với ba thành viên đến từ Nga. Đội đứng về ba là Scumed gồm năm thành viên đến từ Trung Quốc và Malaysia. MS2F, SZI và Scumed là 3 đội luôn dẫn đầu trong suốt quá trình huấn luyện mô hình trên dữ liệu thử nghiệm.
Kết quả cuộc thi “Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực”. |
Giải đặc biệt của cuộc thi dành cho đội Việt Nam được trao cho Chu Tấn Kiệt, Khoa Khoa học máy tính, Đại học Drexel, Philadelphia, Pennsylvania (Mỹ). Đội thi xếp hạng thứ 10 chung cuộc với giải thưởng trị giá 8.000 USD.
Chu Tấn Kiệt cho biết: “Cuộc thi xử lý ảnh y tế do VinBigdata tổ chức có độ thực tiễn cao hơn so với các cuộc thi khác trên Kaggle khi đồng thời phải phân loại bất thường và khoanh vùng điểm bất thường cho 14 nhóm bệnh. Ngoài ra, với phần thưởng lớn, cuộc thi cũng thúc đẩy người Việt tham gia tìm hiểu và tiếp cận các bài toán y tế thực tiễn”.
Với thử thách xây dựng thuật toán học máy để phát hiện và khoanh vùng 14 loại bất thường tim - phổi phổ biến, cuộc thi cung cấp bộ dữ liệu gồm 18.000 ảnh y khoa đặc trưng của người Việt. Dữ liệu được thu thập và chú giải bởi các bác sĩ giàu kinh nghiệm của Bệnh viện Vinmec, Bệnh viện Trung ương Quân đội 108 và Bệnh viện Đại học Y Hà Nội.
Bài toán mô phỏng công việc của các bác sĩ chẩn đoán ảnh y tế tại bệnh viện cung cấp nguồn dữ liệu chuẩn hóa, giúp người yêu công nghệ tiếp cận vấn đề thực tiễn. Kết quả chung cuộc được hệ thống tự động đánh giá dựa trên độ chính xác của thuật toán mà các đội thi gửi về, thông qua so sánh trực tiếp với kết quả mẫu của bác sĩ.
TS Nguyễn Quý Hà, Trưởng phòng Xử lý ảnh y tế, Viện Nghiên cứu Dữ liệu lớn VinBigdata cho biết: “Với bộ dữ liệu chất lượng và quy mô lớn, cuộc thi thu hút hàng nghìn thành viên tham dự. Trong đó có hơn 10% là Kaggle Master hoặc Grandmaster - các đại kiện tướng trên Kaggle về khoa học dữ liệu và các chuyên gia đến từ các công ty công nghệ lớn trên thế giới như Google, NVIDIA, Intel, ABBYY, Oracle, Preferred Networks…”.
VinBigdata kỳ vọng có thể giải quyết được nhiều bài toán y tế khóa bằng công nghệ khoa học dữ liệu. |
Theo TS Hà, ba đội thi xuất sắc dẫn đầu đã có những cách tiếp cận hiệu quả, từ đó có thể phát triển những giải pháp có ý nghĩa thực tiễn. Đặc biệt với 103 đội thi Việt Nam tham dự, đây là một trong những cuộc thi về khoa học dữ liệu quy mô toàn cầu có nhiều đội Việt Nam tham gia nhất từ trước đến nay.
Kết thúc cuộc thi, bộ dữ liệu 18.000 ảnh X-quang được thu thập và gán nhãn bởi các bác sĩ chẩn đoán hình ảnh uy tín sẽ tiếp tục được VinBigdata chia sẻ trên Kaggle. Cuộc thi góp phần mở rộng cơ hội tiếp cận công nghệ mới cho cộng đồng khoa học dữ liệu, hướng đến phát triển các giải pháp để giải quyết bài toán y tế của Việt Nam.
“Mục tiêu của Tập đoàn Vingroup là tạo ra những thay đổi tích cực trong cuộc sống người dân bằng việc thúc đẩy nghiên cứu khoa học và đổi mới công nghệ. Thông qua cuộc thi, VinBigdata hy vọng tạo cơ hội để người yêu công nghệ trong nước và quốc tế cọ xát, tiếp cận với bài toán và dữ liệu thật, từ đó giải quyết những bài toán y tế. Chúng tôi cũng mong muốn truyền cảm hứng cho các doanh nghiệp khác, tổ chức chia sẻ những bộ dữ liệu đa dạng hơn cho cộng đồng”, giáo sư Vũ Hà Văn - Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) chia sẻ.
Từ 1/4, VinBigdata mở VinDr Lab - phần mềm gán nhãn được sử dụng để xây dựng bộ dữ liệu trên cho cộng đồng. Phần mềm này được phát triển với mục đích chia sẻ dữ liệu, thúc đẩy nghiên cứu và phát triển ngành khoa học dữ liệu và AI tại Việt Nam.
Kaggle.com (phát triển bởi Google) là nền tảng nổi tiếng thế giới trong lĩnh vực khoa học dữ liệu và AI, với cộng đồng hơn 5 triệu thành viên. Các cuộc thi trên Kaggle đều được đánh giá nghiêm ngặt về tính ảnh hưởng của bài toán và chất lượng của dữ liệu. Là đơn vị đầu tiên tại Việt Nam tổ chức cuộc thi trên Kaggle, giải thưởng của VinBigdata nằm trong top 10 mức thưởng cao nhất hiện tại.
Bình luận