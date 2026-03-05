Đằng sau lời hứa về kính AI thông minh của Meta là chuỗi xử lý dữ liệu toàn cầu, nơi những khoảnh khắc riêng tư có thể bị xem và gắn nhãn bởi con người cách nửa vòng Trái Đất.

Khi Mark Zuckerberg đeo chiếc kính AI mới trên sân khấu ở Menlo Park tháng 9/2025 và để khán giả nhìn thế giới qua chính đôi mắt mình, ông gọi đó là tương lai của Meta.

Chiếc kính mang tên Meta Ray-Ban smart glasses được quảng bá như một trợ lý rảnh tay. Chỉ cần nói “Hey Meta”, người dùng có thể hỏi đường, dịch ngôn ngữ, nhận thông tin về những gì đang nhìn thấy, hoặc ghi lại khoảnh khắc trước mắt.

Trên sân khấu, mọi thứ trông đầy hứa hẹn.

Nhưng cách đó hơn 14.000 km, tại Nairobi (Kenya), những con người vô danh đang nhìn thế giới qua đôi mắt của người khác theo một cách rất khác thường.

“Chúng tôi thấy mọi thứ, từ phòng khách đến cơ thể khỏa thân”.

Mark Zuckerberg cho biết kính thông minh Ray-Ban đã bán hết ở nhiều nơi. Ảnh: David Paul Morris/Bloomberg.

Lực lượng đứng sau chiếc kính thông minh

Trong một tòa nhà văn phòng trên đường Mombasa, hàng nghìn nhân viên ngồi trước màn hình máy tính. Họ làm việc cho Sama, một nhà thầu công nghệ hợp tác với Meta. Công việc của những người này là “data annotator” - gắn nhãn dữ liệu.

Họ vẽ khung quanh đồ vật trong ảnh, đặt tên cho từng chi tiết: “người”, “cửa sổ”, “thẻ ngân hàng”, “giường ngủ”; kiểm tra bản ghi cuộc trò chuyện để đảm bảo AI trả lời đúng; dạy hệ thống hiểu thế nào là một căn bếp, một phòng khách, một con đường.

Nói cách khác, đó là những người đang âm thầm dạy AI cách “nhìn” thế giới xung quanh. Cái gọi là “machine learning” (học máy) phần lớn được xây dựng trên lao động thủ công của con người. Sự thật này ít được các ông lớn công nghệ nhắc đến.

Theo điều tra của hai tờ báo Thụy Điển Svenska Dagbladet và Göteborgs-Posten, các nhân viên tại Nairobi đã phải xem nhiều đoạn video nhạy cảm được ghi lại từ kính thông minh của Meta.

Một người kể: “Trong một số video, bạn thấy ai đó đi vệ sinh hoặc đang cởi quần áo. Tôi không nghĩ họ biết mình đang bị ghi lại. Nếu biết, họ đã không quay”.

Một nhân viên khác nói: “Chúng tôi thấy mọi thứ, từ phòng khách đến cơ thể khỏa thân”.

Kính AI của Meta được cho ghi lại cảnh cởi đồ, khỏa thân của người dùng. Ảnh: Svenska Dagbladet.

Những mô tả họ đưa ra bao gồm: người đeo kính bước vào nhà tắm, cảnh thay đồ trong phòng ngủ, các đoạn ghi hình quan hệ tình dục khi người đeo vẫn mang kính, thẻ ngân hàng vô tình lọt vào khung hình...

Trong một trường hợp, theo lời kể, một người đàn ông đặt kính trên bàn cạnh giường rồi rời khỏi phòng. Thiết bị tiếp tục ghi hình. Ít phút sau, một phụ nữ, được cho là vợ ông, bước vào và thay quần áo.

“Bạn hiểu đó là đời sống riêng tư của ai đó. Nhưng đây là công việc. Bạn không được đặt câu hỏi”, một annotator nói.

Meta cho biết kính chỉ ghi hình khi người dùng nhấn nút vật lý hoặc ra lệnh bằng giọng nói. Trên gọng kính có đèn báo sáng khi camera hoạt động. Tuy nhiên, theo lời các nhân viên dữ liệu, nhiều đoạn video cho thấy những người xuất hiện trong khung hình dường như không hề nhận thức được mình đang bị ghi lại.

Có thể họ không nhìn thấy đèn báo, không biết thiết bị vẫn đang hoạt động. Hoặc có thể họ đơn giản không nghĩ rằng hình ảnh riêng tư trong phòng ngủ của mình có thể xuất hiện trên màn hình cách đó nửa vòng Trái Đất.

“Có những khuôn mặt vẫn hiện rõ”

Meta cho biết dữ liệu được lọc trước khi đến tay nhân viên, bao gồm việc làm mờ gương mặt để bảo vệ danh tính. Nhưng các annotator tại Kenya nói rằng việc ẩn danh không phải lúc nào cũng hoạt động hoàn hảo.

“Trong điều kiện ánh sáng phức tạp, thuật toán có thể bỏ sót”, một nguồn tin cho biết. “Có những khuôn mặt vẫn hiện rõ”.

Điều này có nghĩa là trong một số trường hợp, người gắn nhãn có thể nhìn thấy đầy đủ gương mặt và chi tiết cơ thể của người trong video.

Nghịch lý là trong khi họ tiếp xúc với những khoảnh khắc riêng tư nhất của người khác, chính các nhân viên này lại làm việc trong môi trường giám sát nghiêm ngặt. Theo lời kể, văn phòng có camera ở nhiều vị trí. Nhân viên không được mang điện thoại cá nhân vào khu vực làm việc. Mọi thiết bị có khả năng ghi hình đều bị cấm.

Lý do rất rõ ràng, nếu những đoạn video này bị rò rỉ, hậu quả sẽ khôn lường. “Chỉ cần một clip bị phát tán, đó sẽ là một vụ bê bối khổng lồ”, một người nói.

Nhiều cuộc trò chuyện nhạy cảm cũng nằm dưới sự theo dõi của các nhân viên dữ liệu Meta. Ảnh: Svenska Dagbladet.

Công việc của các nhân viên này không dừng ở hình ảnh. Annotator cũng phải xem bản ghi hội thoại giữa người dùng và trợ lý AI. Những đoạn hội thoại này có thể liên quan đến bất kỳ chủ đề nào: đời sống cá nhân, mối quan hệ, thậm chí cả các vấn đề nhạy cảm như tội phạm hay tình dục.

Một nhân viên kể lại việc đọc một đoạn văn trong đó người dùng mô tả cơ thể của một phụ nữ và những ham muốn tình dục của mình.

“Không phải chỉ là những câu chào hỏi. Có những nội dung rất tối”, người này nói.

Trên sân khấu ở Mỹ, công nghệ được trình bày như thể nó tự phát triển, tự thích nghi, tự hiểu thế giới. Nhưng phía sau đó là hàng nghìn giờ lao động của con người. Mỗi đoạn video phải được xem, phân loại, gắn nhãn, kiểm tra chất lượng. AI thị giác không tự biết đâu là “phòng ngủ” hay “nhà tắm” mà nó học từ những gì con người chỉ cho.

Càng muốn AI hiểu đời sống thường nhật chi tiết hơn, hệ thống càng phải “nhìn” sâu vào đời sống ấy.

Khi được hỏi có cảm thấy như đang xâm nhập vào đời tư người khác hay không, một annotator trả lời: “Khi bạn xem những video đó, cảm giác đúng là như vậy. Nhưng bạn phải hoàn thành công việc. Bạn biết đó là cuộc sống riêng tư của ai đó, nhưng bạn được kỳ vọng không đặt câu hỏi”.

Phần lớn những người tham gia điều tra yêu cầu ẩn danh. Họ đã ký các thỏa thuận bảo mật nghiêm ngặt. Vi phạm có thể đồng nghĩa với mất việc.

Meta khẳng định họ “rất nghiêm túc trong việc bảo vệ dữ liệu” và cho biết chỉ trong một số trường hợp, dữ liệu mới được xem xét thủ công nhằm cải thiện trải nghiệm người dùng.

Tuy nhiên, quy mô thực tế của việc xem xét này là bao nhiêu? Bao nhiêu video được con người xem? Bao nhiêu trong số đó chứa nội dung riêng tư? Chưa có câu trả lời cụ thể.

Chỉ có một thực tế đang dần rõ ràng là đằng sau lời hứa về một trợ lý thông minh, rảnh tay, tồn tại một chuỗi xử lý dữ liệu toàn cầu - nơi những khoảnh khắc đời thường nhất có thể được chuyển từ một căn phòng ngủ ở châu Âu sang một văn phòng tại châu Phi.

Một annotator kết luận: “Nếu người dùng biết quy mô dữ liệu được thu thập và xử lý lớn đến mức nào, tôi không nghĩ họ còn muốn đeo chiếc kính đó”.