Bạn có thể chuyển sang phiên bản mobile rút gọn của Tri thức trực tuyến nếu mạng chậm. Đóng

AI phân biệt người chuyển giới thế nào?

Quan niệm về tính đa dạng của IBM nhấn mạnh vào các lựa chọn về chiều cao hốc mắt và sống mũi, nhưng loại trừ sự tồn tại của những người chuyển giới.

AI anh 1

Ảnh minh hoạ. Nguồn: Freepik.

Giới hạn trong việc loại bỏ thiên kiến ở các hệ thống

Để hiểu rõ hơn về những hạn chế của việc phân tích thiên kiến trong trí tuệ nhân tạo, chúng ta có thể nhìn vào những nỗ lực nhằm khắc phục vấn đề này. Năm 2019, IBM đã cố gắng giải quyết vấn đề thiên kiến trong hệ thống AI của mình bằng cách tạo ra một bộ dữ liệu được mô tả là “bao hàm tất cả”, có tên gọi Diversity in Faces (Tính đa dạng trong những khuôn mặt, gọi tắt là DiF).

DiF là một phần trong phản ứng của ngành đối với công trình đột phá được công bố một năm trước đó bởi các nhà nghiên cứu Joy Buolamwini và Timnit Gebru chứng minh rằng một số hệ thống nhận diện khuôn mặt - bao gồm cả hệ thống của IBM, Microsoft và Amazon - có tỷ lệ lỗi cao hơn nhiều khi dùng để nhận diện người da sẫm màu, đặc biệt phụ nữ. Kết quả là cả ba công ty được nhắc tên trên đều đang nỗ lực để chứng minh sự tiến bộ của mình trong việc khắc phục vấn đề này.

Các nhà nghiên cứu của IBM đã viết: “Chúng tôi kỳ vọng hệ thống nhận diện khuôn mặt sẽ hoạt động chính xác đối với mọi người” nhưng cách duy nhất để “giải quyết thách thức về tính đa dạng” là xây dựng “một bộ dữ liệu bao gồm khuôn mặt của mọi người trên thế giới”.

Các nhà nghiên cứu của IBM quyết định sử dụng một bộ dữ liệu sẵn có gồm 100 triệu hình ảnh được lấy từ Flickr, bộ sưu tập công khai lớn nhất trên Internet vào thời điểm đó. Sau đó, họ sử dụng 1 triệu bức ảnh làm mẫu nhỏ và đo khoảng cách giữa các điểm mốc trên khuôn mặt: mắt, độ rộng mũi, chiều cao môi, chiều cao lông mày... Giống như Morton đo hộp sọ, các nhà nghiên cứu của IBM tìm cách phân loại các số đo hộp sọ thành các nhóm phân biệt.

Mặc dù nhóm nghiên cứu của IBM tuyên bố mục tiêu của họ là tăng tính đa dạng cho dữ liệu nhận dạng khuôn mặt, nhưng cách phân loại mà họ sử dụng lại tiết lộ bản chất chính trị đằng sau ý nghĩa của “tính đa dạng” trong bối cảnh này.

Ví dụ, để dán nhãn giới tính và tuổi tác cho khuôn mặt, nhóm nghiên cứu đã giao việc cho những người lao động đám đông để họ tiến hành chú thích theo đánh giá chủ quan, sử dụng mô hình hai giới tính hạn chế. Bất kỳ ai có ngoại hình nằm ngoài khuôn khổ phân loại giới tính nhị phân này đều bị loại khỏi bộ dữ liệu.

Quan niệm về tính đa dạng của IBM nhấn mạnh vào các lựa chọn về chiều cao hốc mắt và sống mũi, nhưng lại loại trừ sự tồn tại của những người chuyển giới hoặc không theo giới tính nhị phân. “Tính công bằng” bị thu hẹp thành việc hệ thống nhận dạng khuôn mặt do máy móc thực hiện đạt được tỷ lệ chính xác cao hơn, và “tính đa dạng” được hiểu là một số lượng khuôn mặt nhiều hơn để huấn luyện mô hình.

Phép đo sọ hoạt động như một chiêu đánh tráo khái niệm, loại đi yếu tố chính trị trong quan niệm về đa dạng và thay thế nó bằng việc tập trung vào biên độ dao động của những sai khác.

Kate Crawford/NXB Trẻ

Bình luận

SÁCH HAY