Nghiên cứu được cấp bằng sáng chế của đội ngũ FPT Software là nền tảng để công ty phát triển các giải pháp thông minh trong tương lai.
Sáng chế huấn luyện AI nhận diện vật thể
Nhóm chuyên gia gồm 5 nhà nghiên cứu đến từ FPT Software (Công ty thành viên của Tập đoàn FPT) vừa nhận bằng sáng chế cho giải pháp công nghệ “Group-equivariant convolutional neural networks for 3D point clouds” - mạng nơ-ron tích chập đẳng biến với các phép biến đổi nhóm để xử lý đám mây điểm 3D. Công nghệ này ứng dụng trong huấn luyện trí tuệ nhân tạo (AI), nhận dạng hình ảnh qua học sâu (deep learning).
Nhờ tính ứng dụng và hiệu quả cải thiện, nhóm chuyên gia được trao một trong những bằng sáng chế uy tín nhất thế giới của Văn phòng Sáng chế và Nhãn hiệu Mỹ (USPTO). Hoạt động từ năm 1836, USPTO là tổ chức cấp bằng chế đầu tiên của nước Mỹ được Tổng thống George Washington ký chứng nhận.
Sáng chế của FPT Software giúp cải thiện độ chính xác trong huấn luyện AI nhận diện vật thể từ một góc chụp nhờ cơ chế tăng cường hiệu suất tính toán cho mạng nơ-ron phân tách đặc trưng của vật thể. Mạng nơ-ron dễ dàng được thiết lập và triển khai cho nhiều bên, tạo ra giải pháp công nghệ có tính ứng dụng cao. Đồng thời, với cách huấn luyện AI này, lượng dữ liệu đầu vào cần ít hơn nên tiết kiệm nguồn lực đáng kể.
Bằng sáng chế do USPTO cấp cho nhóm nhà nghiên cứu FPT Software. |
Chia sẻ về dấu mốc quan trọng, ông Nguyễn Xuân Phong - Giám đốc AI của FPT Software, cũng là một trong năm nhà nghiên cứu - nhận định thành công này khẳng định chất lượng nghiên cứu và sự sáng tạo của các giải pháp độc quyền do FPT Software xây dựng.
“Nhờ sự kiên trì đầu tư vào nghiên cứu, chúng tôi có thêm cơ sở để tạo nên sản phẩm mới và khẳng định uy tín trên trường quốc tế. Bên cạnh đó, nghiên cứu này là nền móng để FPT Software phát triển các giải pháp thông minh trong thời gian tới”, ông cho biết.
Ý tưởng mới từ mạng nơ-ron tích chập
Nhóm các nhà nghiên cứu FPT Software gồm những thành viên từ nhiều bộ phận như tư vấn chuyển đổi số toàn cầu, phòng nghiên cứu AI, các nghiên cứu sinh được đào tạo từ chương trình AI Residency,... Đặt mục tiêu nghiên cứu giải pháp ứng dụng công nghệ đám mây điểm 3D vào thực tiễn, các nhà khoa học phát hiện những điểm hạn chế khi kết hợp AI với đám mây điểm 3D.
Đám mây điểm 3D là tập hợp các điểm trong không gian ba chiều thể hiện một hình ảnh thu nhỏ các vật thể - ứng dụng trong tái tạo hình ảnh và vật thể 3D. Theo đại diện nhóm, với sự phát triển của các dòng máy ảnh 3D hiện đại, kho ảnh 3D dạng đám mây điểm ngày càng nhiều.
Tuy nhiên, trong quá trình ứng dụng đám mây điểm 3D vào deep learning để hỗ trợ huấn luyện AI, đến năm 2020, các nhà khoa học thế giới vẫn nhận định dù deep learning giải quyết được nhiều vấn đề trên ảnh 2D, việc áp dụng lên đám mây điểm 3D chỉ ở mức bắt đầu. Đặc biệt, nếu dữ liệu đám mây điểm 3D chỉ có trên một góc chụp, khả năng AI nhận diện vật thể qua các góc chụp khác vẫn cần được cải thiện.
Đặt mục tiêu cải thiện việc huấn luyện AI, nhóm nghiên cứu kết hợp mô hình deep learning tiên tiến là mạng nơ-ron tích chập, có thể phân tách hình ảnh đầu vào để đưa ra đặc trưng riêng của vật thể. Ứng dụng trong nhận dạng hình ảnh, mạng nơ-ron được sử dụng rộng rãi trong đa ngành từ công cụ tìm kiếm, bảo mật đến y khoa. Nhóm nghiên cứu tìm tòi, thử nghiệm cách đơn giản hóa việc thiết lập và vận hành mạng nơ-ron để đưa ứng dụng đến gần với đời sống.
Qua gần một năm nghiên cứu, các chuyên gia FPT Software thử nghiệm thành công khi kết hợp mạng nơ-ron có tính chất đẳng biến và phép quay (rotation - equivariant). Cốt lõi của phát kiến này là hệ thống cơ sở hạ tầng chứa các câu lệnh có sẵn. Khi được nạp dữ kiện, đám mây điểm 3D sẽ triển khai mạng nơ-ron được thiết lập sẵn, cho đầu ra là một tenxơ (tensor) có toàn bộ thông tin của vật thể trong không gian ba chiều.
Đây là điểm mấu chốt trong sáng kiến cải thiện việc huấn luyện AI nhận diện hình ảnh, giúp đội ngũ FPT Software nhận chứng chỉ sáng chế của USPTO.
Thành viên nhóm là các nghiên cứu sinh được đào tạo từ chương trình AI Residency. |
Theo số liệu từ USPTO, đến năm 2019, văn phòng này cấp hơn 4.000 bằng sáng chế công nghệ mảng AI/học máy, trên 60.000 hồ sơ gửi đến mỗi năm. Trong số các bằng sáng chế AI trên toàn thế giới, 40% bằng nằm trong mảng học máy, theo thống kê của Wipo. Trong đó, deep learning và mạng nơ-ron là các mảng được nhiều ông lớn công nghệ nghiên cứu, phát triển.
Là một trong những doanh nghiệp công nghệ hàng đầu Đông Nam Á, FPT Software đầu tư vào phát triển nhân tài và nghiên cứu AI. Công ty dự kiến mở rộng nghiên cứu và ứng dụng các dự án liên quan đến nhận diện hình ảnh và deep learning, sử dụng dữ liệu 3D dạng đám mây điểm.
Bên cạnh đó, FPT Software triển khai chương trình đào tạo AI Residency - một trong những cơ hội để các nhà nghiên cứu trẻ gặp gỡ, học hỏi từ chuyên gia AI hàng đầu thế giới.
Bình luận