Khi một kết quả thống kê được miêu tả là “có ý nghĩa thống kê”, ta chớ vội kết luận rằng nó đang miêu tả một tác động mạnh. Nó chỉ đơn giản có nghĩa là: kết quả đó không chắc chỉ là tình cờ. Với một mẫu đủ lớn, một mối tương quan có thể ngay lập tức “rất có ý nghĩa thống kê” và quá nhỏ nên không đáng để thảo luận.
Khả năng dự đoán hạn chế về các sự kiện riêng lẻ trong cuộc thi mang lại thông điệp đáng ngại về sự khác nhau giữa hiểu biết và dự đoán. Nghiên cứu Gia đình Dễ đổ vỡ được xem là một kho dữ liệu khoa học xã hội quý báu, và như ta đã thấy, dữ liệu đó đã được sử dụng trong rất nhiều nghiên cứu.
Các học giả tham gia nghiên cứu ắt hẳn cảm thấy công trình của họ giúp ta hiểu biết thêm nhiều về cuộc sống của những gia đình dễ đổ vỡ. Đáng tiếc thay, cảm giác tiến bộ này không cân xứng với khả năng dự đoán chi tiết về các biến cố riêng lẻ của đời người.
Các tác giả đã tường thuật kết quả tranh tài dựa trên dữ liệu Nghiên cứu Gia đình Dễ đổ vỡ với một lời khuyên rõ ràng trong phần giới thiệu: “Các nhà nghiên cứu phải dung hòa giữa ý tưởng cho rằng họ hiểu quỹ đạo cuộc sống với thực tế là chẳng có lấy một dự đoán nào là rất chính xác.”
Ảnh minh hoạ. Nguồn: Yan Krukau/Pexels. |
Hiểu và dự đoán
Cần có đôi lời giải thích về lôgíc đằng sau kết luận bi quan đó. Khi các tác giả cuộc thi Gia đình Dễ đổ vỡ đánh đồng hiểu biết với dự đoán (hoặc đánh đồng thiếu hiểu biết với không thể dự đoán), họ sử dụng thuật ngữ hiểu với một ý nghĩa cụ thể. Từ này còn có nghĩa khác: nếu bạn nói bạn hiểu một khái niệm toán học hoặc hiểu tình yêu là gì, có lẽ bạn không có ý nói về một năng lực dự đoán cụ thể nào cả.
Tuy nhiên, trong diễn ngôn khoa học xã hội và trong hầu hết các cuộc chuyện trò đời thường, khi người ta nói họ hiểu điều gì đó thì cũng ngầm định họ hiểu nguyên nhân gây ra điều đó. Khi thu thập và nghiên cứu hàng nghìn biến số trong Nghiên cứu Gia đình Dễ đổ vỡ, các nhà khoa học xã hội đang tìm kiếm nguyên nhân của những kết quả mà họ đã quan sát được.
Khi hiểu căn bệnh của bệnh nhân, các bác sĩ cũng đồng thời tuyên bố rằng bệnh lý họ vừa chẩn đoán là nguyên nhân của những triệu chứng mà họ đã quan sát được. “Hiểu” có nghĩa là miêu tả một chuỗi nhân quả.
Năng lực dự đoán là thước đo cho ta biết liệu ta có thật sự nhận diện được chuỗi nhân quả đó hay không. Và hệ số tương quan là thước đo độ chính xác của dự đoán, nó biểu thị mức độ hiểu biết của ta về chuỗi nhân quả đó.
Câu trên có thể gây ngạc nhiên nếu bạn đã từng tiếp xúc với thống kê cơ bản và thường nghe cảnh báo rằng “tương quan không có nghĩa là quan hệ nhân quả.” Ví dụ, hãy xem tương quan giữa cỡ giày và khả năng toán học ở trẻ em: rõ ràng hai biến số này không có quan hệ nhân quả.
Tương quan phát sinh từ thực tế là cả kích thước giày và kiến thức toán học đều tăng theo độ tuổi của đứa trẻ. Mối tương quan là có thật và hỗ trợ một dự đoán: nếu bạn biết một đứa trẻ có bàn chân lớn, bạn sẽ dự đoán trình độ toán học cao hơn so với khi bàn chân còn nhỏ. Nhưng bạn không nên suy ra quan hệ nhân quả từ mối tương quan này.
Tuy nhiên, nên nhớ rằng tương quan không ngụ ý nhân quả, nhưng nhân quả ắt là ngụ ý tương quan. Khi thấy có quan hệ nhân quả, ta nên tìm mối tương quan. Nếu không thấy mối tương quan giữa độ tuổi và cỡ giày của người trưởng thành, khi đó bạn có thể yên tâm kết luận rằng sau khi qua tuổi vị thành niên, tuổi tác không làm cho bàn chân phát triển lớn hơn và bạn phải tìm nguyên nhân khác dẫn đến cỡ giày khác đi.
Nói tóm lại, hễ có nhân quả là có tương quan. Suy ra, khi có quan hệ nhân quả, thì ta có thể dự đoán; và hệ số tương quan là đại lượng đo lường độ chính xác của dự đoán, nó biểu thị mức độ hiểu biết của ta về quan hệ nhân quả đó.
Do đó, kết luận của các nhà nghiên cứu Princeton là thế này: khả năng dự đoán của các nhà xã hội học về những sự kiện như bị mất chỗ ở, thể hiện qua hệ số tương quan 0,22, cho thấy độ hiểu biết của họ về quỹ đạo cuộc sống của những gia đình dễ đổ vỡ. Sự vô minh khách quan chẳng những làm hạn chế khả năng dự đoán mà còn làm hạn chế mức độ hiểu biết của con người.
Vậy thì, hầu hết các chuyên gia có ý gì khi tự tin tuyên bố họ hiểu lĩnh vực của họ? Làm thế nào họ có thể bàn về nguyên nhân gây ra những hiện tượng mà họ đang quan sát và dự đoán chắc chắn về chúng? Tóm lại, tại sao các chuyên gia - và tại sao tất cả chúng ta - dường như đánh giá thấp sự vô minh khách quan của ta về thế giới?