Có lẽ lúc nào đó trong vài năm vừa rồi, bạn đã báo với Facebook là bạn “like”, ví dụ như, Kim Kardashian West. Khi bạn click vào biểu tượng ngón tay cái đó, bạn có thể đơn thuần là muốn những post của ngôi sao truyền hình thực tế đó xuất hiện trên newsfeed.
Có thể bạn biết là những nhà quảng cáo có thể lọc bạn để nhắm cho các quảng cáo dựa vào điều bạn thích đó.
Các kết quả tính cách dựa vào sở thích của bạn trên Facebook. Ảnh: New York Times. |
Điều bạn không biết là những nhà nghiên cứu còn có thể dựa vào sở thích Kardashian của bạn để đưa ra những phân loại tính cách, ví dụ như bạn hướng ngoại thế nào (rất nhiều), hay gây gổ ra sao (thường xuyên) và cởi mở tới đâu (hơi hơi).
Và khi sở thích của bạn với Kardashian được kết hợp với những sở thích khác bạn khai báo với Facebook, thuật toán của họ có thể dự đoán được chính xác xu hướng chính trị và nhiều thói quen khác – thậm chí là chính xác hơn chính người thân của bạn.
10 “likes” dự đoán chính xác hơn đồng nghiệp
Cuộc khủng hoảng hiện tại của Facebook cũng xuất phát từ thuật toán này. Công ty tư vấn Cambridge Analytica đã thu thập dữ liệu của hơn 50 triệu người dùng Facebook mà không có sự chấp thuận của họ để dựng lên các mô thức hành xử của họ nhằm nhắm tới các cử tri trong một loạt các chiến dịch bầu cử.
John R. Bolton, từng làm việc trong chính quyền George W. Bush, cũng như trong chiến dịch tranh cử của Trump năm 2016. “Chúng tôi sẽ tìm ra cử tri và khiến họ phải hành động”, hãng này khoe trên mạng.
Cambridge Analytica giờ nói đã hủy kho dữ liệu người dùng họ lấy từ Facebook. Thông tin mà New York Times có được thì lại nói các bản sao dữ liệu này vẫn còn. Và những thông tin như vậy có thể là công cụ rất kinh khủng: đưa ra được mô thức để “lừa” người dùng hành động, gây thay đổi kết quả bầu cử. Đây chính là tập đoàn đứng đằng sau vụ Brexit cũng như chiến dịch tranh cử của Tổng thống Trump.
Hãng này phát triển các mô hình phân loại tính cách dựa vào nghiên cứu của các trường Stanford và Cambridge. Các nghiên cứu này lấy dữ liệu từ app của Facebook có tên myPersonality (Tính cách của tôi) với khoảng 100 câu hỏi do trung tâm đo tính cách Psychometrics Center của Đại học Cambridge nhằm đánh giá tính cách một người có cởi mở, hướng ngoại, dễ gần,… - các tính cách thường được trong giới gọi vắn tắt là Ocean.
Rất nhiều người khi thực hiện bài điều tra myPersonality này cho phép app đó lấy thông tin của họ trên profile Facebook và lấy thông tin của những người bạn của họ - khi đó Facebook cho phép lấy data kiểu vậy. Việc này cho phép những nhà nghiên cứu đối chiếu kết quả thông qua các “likes” Facebook và dựng ra được mô hình và các mối liên quan.
Từ mô hình này, những nhà nghiên cứu có thể dự đoán chính xác về tính cách sử dụng chỉ bằng các “like” trên Facebook.
Một nghiên cứu của Psychometrics Center, được đăng trên tạp chí Proceedings của Viện Hàn lâm Khoa học Quốc gia Mỹ, dựa trên “likes” và điểm số Ocean của hơn 70.000 người từng trả lời thăm dò myPersonality trên Facebook.
Nghiên cứu phát hiện rằng những người thích phim “Fight Club” chẳng hạn, thường cởi mở với những trải nghiệm hơn là những người thích coi “American Idol”.
Trong nghiên cứu đó, các nhà nghiên cứu so sánh độ chính xác của mô hình của mình với những đánh giá tính cách mà bạn bè của người dùng đó đưa ra. Những người bạn đó trả lời 10 câu hỏi về tính cách của những người này.
Dựa vào dữ liệu của hơn 32.000 người tham gia được đánh giá thông qua cả bằng mô hình thuật toán và dựa bằng bạn bè, các nhà nghiên cứu thấy mô hình chỉ cần dùng 10 “likes” là có thể dự đoán chính xác hơn cả đồng nghiệp. Với 70 likes, có thể dự đoán chính xác hơn cả người ở cùng phòng; 150 likes, có thể chính xác hơn cả người trong gia đình, và với 300 likes, chính xác hơn cả vợ/chồng.
Vô số sơ hở
Các nhà nghiên cứu nói mô hình thuật toán này đặc biệt giỏi trong dự đoán các “kết quả cuộc đời mà có giá trị sử dụng thật sự như thái độ chính trị và sức khỏe tinh thần”.
Khi Cambridge Analytica tiếp cận Psychometrics Center về việc sử dụng mô hình này, trung tâm này đã từ chối. Cambridge Analytica sau đó đã tiếp cận Aleksandr Kogan, giáo sư tâm lý ở đại học Cambridge, người biết về nghiên cứu của trung tâm kia.
Tiến sĩ Kogan sau đó đã phát triển một app tương tự có tên “thisisyourdigitallife” để lấy thông tin từ 50 triệu người dùng Facebook. Trong số này, 30 triệu người dùng là đủ thông tin để đưa ra chi tiết tính cách. Nhưng chỉ có 270.000 người trong số này cho phép app của ông Kogan tiếp cận data của họ (những người còn lại, Cambridge Analytica đã lấy trái phép). Tất cả những người này đều chỉ được báo thông tin dùng cho nghiên cứu học thuật.
Cambridge sau đó bán dịch vụ của mình cho các khách hàng chính trị gia và thương mại, từ Mastercard cho đến CLB New York Yankees và cả Hội đồng Tham mưu trưởng liên quân Mỹ.
Facebook hiện đã cấm cả Cambridge Analytica và Tiến sĩ Kogan. Theo lời Facebook thì ông Kogan đã vi phạm quy định của họ. Nhưng những tác hại từ hoạt động của Cambridge Analytica thì đã rõ.