Video nhóm người thuộc cộng đồng LGBTQIA+ diễu hành do Sora AI tạo. Ảnh: Sora. |
San Francisco - thủ phủ của Thung lũng Silicon - nổi tiếng là trung tâm sáng tạo, đổi mới của trí tuệ nhân tạo, nhưng đây cũng là một trong những thành phố “gay” nhất ở Mỹ. Trụ sở OpenAI ở khu Mission nằm kế bên khu Castro, nơi các lối dạo bộ được phủ đầy màu lục sắc và không khó để bắt gặp người khỏa thân đi đường.
Theo Wired, rất nhiều người đồng tính đang bắt đầu tham gia vào cuộc cách mạng AI. "Không ít người trong lĩnh vực này là những người đồng tính nam. Đó là điều mà tôi nghĩ ít ai đề cập đến", Spencer Kaplan, nghiên cứu sinh tiến sĩ tại Đại học Yale, cho biết.
CEO Sam Altman của OpenAI cũng là người đồng tính. Năm ngoái, ông kết hôn với bạn trai trong một buổi lễ riêng tư bên bờ biển với khoảng 10 vị khách. Ngoài Altman, nhiều thành viên của cộng đồng LGBTQIA+ hiện cũng tham gia vào các dự án AI và kết nối thông qua các hội nhóm, như Queer in AI.
AI mô tả người đồng tính một cách rập khuôn
Nhưng vẫn có sự chênh lệch nhất định giữa những người đồng tính quan tâm đến trí tuệ nhân tạo và hình ảnh của họ do các công cụ AI tạo ra. Ngay cả những mô hình tạo hình ảnh và video AI tốt nhất, cũng chỉ gói gọn cộng đồng này trong một vài khuôn mẫu cũ kỹ.
Ảnh người chuyển giới nữ do Midjourney tạo ra. Ảnh: Midjourney. |
Mặc dù có nhiều cải tiến về chất lượng hình ảnh, hình ảnh do AI tạo ra thường đóng khung cuộc sống cộng đồng queer trong một vài định kiến.
Đơn cử như với Midjourney, đồng tính nữ thường xuất hiện với khuyên mũi, biểu cảm lạnh lùng, khó gần. Đồng tính nam thì đều là những người ăn mặc thời trang, lòe loẹt.
Trong khi đó, hình ảnh chuyển người chuyển giới nữ là sexy với nội y, góc máy ảnh zoom vào các đường cong, điểm nhạy cảm.
Theo Wired, những hình ảnh này cho thấy dữ liệu được sử dụng để đào tạo chúng cũng rất rập khuôn.
Thông tin chủ yếu được thu thập bằng cách quét hàng tỷ nội dung văn bản và hình ảnh từ Internet, nơi chỉ mang một vài khuôn mẫu nhất định về người đồng tính, như đồng tính nam phải ẻo lả, còn đồng tính nữ phải nam tính, gai góc. Khi sử dụng AI để tạo ra hình ảnh của các nhóm thiểu số khác, người dùng có thể gặp phải các kết quả mang thành kiến tương tự.
Theo kết quả đầu ra của Midjourney, những người song tính và phi nhị giới luôn luôn phải nhuộm tóc tím, tỉa layer. Midjourney cũng liên tục miêu tả đồng tính nữ là những người cạo tóc hai bên mai, mang hình xăm trải dài quanh ngực. Nếu không đề cập đến chủng tộc trong câu lệnh, hầu hết người đồng tính mà công cụ hình ảnh này tạo ra đều là người da trắng.
Theo Wired, công cụ AI cũng thất bại khi miêu tả người chuyển giới một cách chân thực. Khi được yêu cầu tạo ảnh của một người chuyển giới nam, Midjourney đã tạo ra hình ảnh của một người có đường quai hàm nam tính, mặc vest và tạo dáng trong một văn phòng gỗ, trong khi chuyển giới nữ thì luôn gắn liền với bộ đồ màu hồng, son môi màu hồng và mái tóc dài xoăn.
“AI coi những người phi nhị giới là những người ít giống con người nhất hoặc khác xa nhất với định nghĩa về 'con người' của nó”, nghiên cứu sinh tiến sĩ Sourojit Ghosh giải thích cách Stable Diffusion vẽ lại hình ảnh người đồng tính.
Ảnh người phi nhị giới (trái) và song tính (phải) do Midjourney tạo ra. Ảnh: Midjourney. |
Trong nghiên cứu, Ghosh phát hiện rằng khi Stable Diffusion được yêu cầu vẽ một người bất kỳ, kết quả phổ biến nhất là hình ảnh đàn ông da trắng. Hình ảnh về những người phi nhị giới rất hiếm, thậm chí có khi còn được tạo thành từ những bức ảnh ghép kỳ lạ về những đặc điểm giống con người.
Sự cứng nhắc của thuật toán
Câu hỏi đặt ra là làm thế nào để cải thiện các công cụ AI tạo ra và làm cho kết quả đầu ra phù hợp với hình ảnh thực tế của cộng đồng người đồng tính?
Theo Wired, một biện pháp khả thi là tập trung vào dữ liệu thực, đại diện cho người thuộc cộng đồng LGBTQIA+ từ khắp nơi trên thế giới. "Để cải thiện các hệ thống đó, chúng tôi cần dữ liệu tốt hơn", Sonia Katyal, giám đốc tại Trung tâm Luật và Công nghệ Berkeley, nói.
Một giải pháp tiềm năng khác để đa dạng hóa đầu ra từ các mô hình AI là cho phép các nhà phát triển tạo hàng rào bảo vệ (guardrail) và sửa câu lệnh của người dùng. Có vẻ như OpenAI đã làm theo cách này.
Khi yêu cầu Dall-E 3 thông qua ChatGPT "vẽ một bộ phim hoạt hình về một cặp vợ chồng đồng tính”, nó đã mở rộng câu lệnh hình ảnh, mà không cần người dùng nhắc. Chatbot AI viết câu lệnh thành một đoạn văn hoàn chỉnh bao gồm giới tính, chủng tộc và các thông tin nền bổ sung.
Video được tạo bởi Sora với câu lệnh "cặp đôi chuyển giới chơi trò chơi ở ngoài không gian". Ảnh: Sora. |
Mặc dù khá hữu ích, việc thay đổi câu lệnh cũng có thể gây khó chịu cho người dùng nếu kết quả ra không đúng ý. CEO của Google đã phải xin lỗi khi Gemini, nền tảng AI của Google, thay đổi câu lệnh của người dùng và tạo ra những bức ảnh sai lệch về lịch sử.
Ngay cả khi có dữ liệu cao cấp hơn và hàng rào bảo vệ, sự cứng nhắc của thuật toán cũng khó lòng thỏa mãn mọi nhu cầu khi thế giới con người luôn không ngừng biến đổi.
"Về cơ bản, họ đang sử dụng quá khứ để tạo ra tương lai", William Agnew, nghiên cứu sinh sau tiến sĩ tại Carnegie Mellon, nói.
Bằng cách khuếch đại các khuôn mẫu, các công cụ AI không chỉ có nguy cơ xuyên tạc hình ảnh các nhóm thiểu số, lan truyền đến đại chúng, mà còn có khả năng hạn chế cách những người đồng tính nhìn nhận và thấu hiểu bản thân, Wired nhận định.
Những câu hỏi chúng ta phải đối mặt trong thế giới AI
Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.
Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.