Bạn có thể chuyển sang phiên bản mobile rút gọn của Tri thức trực tuyến nếu mạng chậm. Đóng

Thuật toán nghiên cứu về các gia đình dễ đổ vỡ

25.000 nghiên cứu và liên quan đến 8 triệu đối tượng trong hơn 100 năm đi đến kết luận: “Các hiệu ứng tâm lý xã hội thường có hệ số tương quan 0,21".

Cuộc thi đã thu hút sự quan tâm đáng kể của các nhà nghiên cứu. Báo cáo cuối cùng trình bày kết quả từ 160 đội có trình độ cao được chọn từ nhiều ứng viên quốc tế. Hầu hết các đối thủ được chọn đã miêu tả mình là nhà khoa học dữ liệu và ứng dụng máy học.

Trong chặng đầu tiên của cuộc thi, các đội tham gia truy cập vào toàn bộ dữ liệu của một nửa mẫu nghiên cứu, trong đó có sáu kết quả thực tế. Họ sử dụng “dữ liệu đào tạo” này để xây dựng thuật toán dự đoán.

Sau đó các thuật toán của họ được áp dụng (để dự đoán sáu kết quả) cho các gia đình trong nửa mẫu nghiên cứu còn lại chưa được sử dụng để xây dựng thuật toán. Đại lượng đo lường độ chính xác là sai số bình phương trung bình (MSE): sai số dự đoán của từng trường hợp là bình phương của chênh lệch giữa kết quả thực tế và dự đoán của thuật toán.

Gia dinh anh 1

Ảnh minh hoạ. Nguồn: Oleksandr P/Pexels.

Những mô hình về nhất trong cuộc thi tốt đến mức nào? Lẽ dĩ nhiên, được xây dựng từ một bộ dữ liệu lớn, các thuật toán học máy tinh vi đã mang lại kết quả dự đoán tốt hơn so với các mô hình tuyến tính đơn giản (và suy ra là tốt hơn dự đoán của con người).

Nhưng so với một mô hình rất đơn giản, độ cải thiện của các mô hình Ai cũng không nhiều, và độ chính xác vẫn thấp một cách đáng thất vọng. Khi dự đoán về việc bị trục xuất, mô hình tốt nhất đạt hệ số tương quan 0,22 (PC = 57%).

Các hệ số tương quan cỡ đó cũng được tìm thấy cho những sự kiện riêng lẻ khác, như liệu người nuôi dưỡng chính đang mất việc hay đang được đào tạo việc làm và điểm số của đứa trẻ về “tính kiên trì bền bỉ”, một đặc điểm tính cách kết hợp sự kiên trì và niềm đam mê một mục tiêu cụ thể. Đối với những sự kiện này, các hệ số tương quan nằm trong khoảng từ 0,17 đến 0,24 (PC = 55-58%).

Hai trong số sáu kết quả mục tiêu là những kết quả tổng hợp, dễ đoán hơn nhiều. Về điểm trung bình của đứa trẻ, hệ số tương quan giữa dự đoán của mô hình và kết quả thực tế là 0,44 (PC = 65%); còn về điểm đánh giá tổng quát khó khăn vật chất trong 12 tháng trước, hệ số tương quan là 0,48 (PC = 66%).

Điểm đánh giá tổng quát này dựa trên 11 câu hỏi, như “Em có bao giờ bị đói không?” và “Dịch vụ điện thoại của em có bị hủy không?” Ai cũng biết, các kết quả tổng hợp thường dễ đoán hơn những kết quả đơn lẻ. Kết luận chính của cuộc thi là: một lượng lớn thông tin dự đoán vẫn không đủ để dự đoán các sự kiện đơn lẻ trong dòng đời con người, và ngay cả việc dự đoán những kết quả tổng hợp cũng khá hạn chế.

Các kết quả quan sát trong nghiên cứu trên có tính chất điển hình, và nhiều hệ số tương quan khác mà các nhà khoa học xã hội tường thuật cũng nằm trong miền giá trị này. Việc rà soát tổng quan nhiều nghiên cứu tâm lý xã hội, bao gồm 25.000 nghiên cứu và liên quan đến 8 triệu đối tượng trong hơn 100 năm, đã đi đến kết luận: “Các hiệu ứng tâm lý xã hội thường có hệ số tương quan 0,21.”

Những mối tương quan cao hơn nhiều, như hệ số tương quan 0,60 giữa chiều cao và kích thước bàn chân người trưởng thành mà chúng tôi đã đề cập trên đây, khá phổ biến trong đo lường vật lý nhưng rất hiếm trong các ngành khoa học xã hội. Xem xét tổng quan 708 nghiên cứu trong khoa học hành vi và nhận thức, người ta cũng nhận thấy, các hệ số tương quan từ 0,50 trở lên chỉ chiếm khoảng 3%.

Hệ số tương quan thấp như vậy có thể gây ngạc nhiên nếu bạn từng đọc về những kết quả nghiên cứu được gọi là “có ý nghĩa thống kê” hoặc thậm chí “có ý nghĩa thống kê cao.” Các thuật ngữ thống kê thường gây hiểu lầm cho những độc giả ngoài ngành, và “có ý nghĩa thống kê” xem ra là ví dụ điển hình tệ hại nhất.

Daniel Kahneman, Olivier Sibony, Cass R. Sunstein/NXB Trẻ

SÁCH HAY

Dai hoi Hoi Xuat ban Viet Nam lan thu V hinh anh

Đại hội Hội Xuất bản Việt Nam lần thứ V

0

Việc chuyển đổi mô hình hoạt động có thể giúp đơn vị xuất bản chủ động sản xuất từ sách giấy, ebook cho đến sách nói để tạo sự sôi nổi và đa dạng cho thị trường.

Tu sach 50 nam giai phong mien Nam, thong nhat dat nuoc hinh anh

Tủ sách 50 năm giải phóng miền Nam, thống nhất đất nước

0

Sách ảnh song ngữ Việt - Anh “Di sản Sài Gòn - Thành phố Hồ Chí Minh (Saigon - Ho Chi Minh City Heritage)” tái hiện quang cảnh và nếp sống của con người ở vùng đất Sài Gòn - Thành phố Hồ Chí Minh từ những thế kỷ trước.

BOOK SPACE hinh anh

BOOK SPACE

0

Read Station tại TP.HCM kết hợp cà phê, thư viện, nhà sách và không gian làm việc với hơn 10.000 đầu sách, thu hút nhóm khách trẻ đến học tập và sử dụng trong thời gian dài.

Nghe viet van hinh anh

Nghề viết văn

0

Nhiều nhà văn có con đường học vấn khá sâu rộng, ngược lại một số người chủ yếu tự học và viết bằng trải nghiệm. Các nhà văn sẽ tự học bằng việc đọc, nó giúp họ tích lũy tri thức.

Song mot doi xung dang hinh anh

Sống một đời xứng đáng

0

Chừng nào mẹ còn năng lượng, thì chừng đó mẹ còn có quyền quyết định tiếp tục dùng nó để mang lại niềm vui cho chính mình và những người xung quanh. Thấy hai cha con tôi cười phá lên, với mẹ, thế là xứng đáng.

Vu tru tuan hoan hinh anh

Vũ trụ tuần hoàn

0

Sau khoảng một nghìn tỷ năm hoặc hơn, một vụ nổ lớn mới xảy ra và một chu kỳ mới bắt đầu.

Giai ma hooc-mon dopamine hinh anh

Giải mã hoóc-môn dopamine

0

Nhân vô thập toàn, con người ai cũng có khuyết điểm. Có điều cách bạn đối diện với nó ảnh hưởng rất nhiều từ thái độ sống mà chúng ta được cha mẹ hình thành tự nhỏ.

6 vat lieu dinh hinh van minh nhan loai hinh anh

6 vật liệu định hình văn minh nhân loại

0

Nó nhẹ đến mức nổi trên dầu, mềm đến mức có thể cắt bằng dao nhà bếp, nhưng lại phản ứng mạnh đến mức sôi sục và phát nổ khi tiếp xúc với nước và không khí.

Diem ky di da can ke hinh anh

Điểm kỳ dị đã cận kề

0

Ray Kurzweil dự đoán đầu những năm 2040, các nano robot sẽ có thể đi vào não bộ của người còn sống và sao chép toàn bộ dữ liệu tạo nên ký ức và tính cách của người gốc.