Công nghệ, dữ liệu lớn giúp con người dự đoán về dịch bệnh. Ảnh: Awforum. |
Dữ liệu lớn là một trong những trụ cột của nền kinh tế số sau cách mạng công nghệ 4.0. Dữ liệu mở ra những khả năng vô tận cho con người. Thông qua các mối tương quan và phương pháp phân tích, giá trị những dữ liệu được tận dụng. Chúng có thể đưa ra các dự đoán về xu hướng phát triển của sự việc. Dịch cúm năm 2009 và Covid-19 năm 2019 là một ví dụ điển hình.
Mô hình dự đoán tương lai
Năm 2009, dịch cúm H1N1 bùng phát và các nhà khoa học nhận định rằng quy mô của nó có thể sánh ngang với dịch cúm tại Tây Ban Nha năm 1918 (đại dịch Cái chết đen). Hy vọng duy nhất của ngành y tế thế giới là làm sao để ngăn chặn tình trạng lây nhiễm chéo nhiều nhất có thể. Thời điểm đó, không có loại vắc xin nào chống lại được căn bệnh này.
Để khoanh vùng ổ bệnh, các nhà khoa học đã dùng đến dữ liệu của Google. Bất kỳ khu vực nào có tần suất tìm kiếm thông tin về dịch cúm và cách chữa trị H1N1 tăng đều có thể là nơi dịch bệnh bùng phát. Các dữ liệu này được Google đặt trong tương quan với các dịch bệnh trước đó diễn ra vào năm 2003, 2008. Từ đó đưa ra những dự đoán cụ thể về xu hướng lây lan của H1N1. Dự đoán này đã giúp Trung tâm kiểm soát và phòng ngừa dịch bệnh (CDC) Mỹ có thể ứng biến kịp thời với các tình huống khẩn cấp.
Viktor Mayer-Schonberger hiện là chuyên gia nghiên cứu về dữ liệu lớn tại đại học Oxford. Ảnh: SMUC. |
Trong cuốn sách Dữ liệu lớn, tác giả Viktor Mayer-Schonberger và Kenneth Cukier cho rằng công nghệ dự đoán này đã tạo nên cuộc cách mạng trong lĩnh vực y tế công. Chúng thu hẹp khoảng thời gian khoanh vùng dịch tễ cho các trung tâm kiểm soát.
Mười năm sau, khi dịch Covid-19 bùng phát, dữ liệu của Google tiếp tục trở thành một công cụ đắc lực cho các nhà nghiên cứu. Một bài báo khoa học của đại học Queenland (Australia) đã chỉ ra mối tương quan giữa kết quả tìm kiếm của Google và dự báo thời tiết. Nhóm nhà khoa học khảo sát Google về lượng các từ khóa như “vắc-xin Covid”, “xét nghiệm Covid” và “các triệu chứng Covid”. Sau đó tích hợp với các địa chỉ người tìm kiếm từ khóa và dự báo thời tiết địa phương, kết quả cho ra là virus SARS-CoV-2 sẽ phát triển và lây lan nhanh hơn dưới thời tiết lạnh. Khác với các nghiên cứu trước đó, nhóm nhà khoa học còn chỉ ra rằng môi trường ẩm thấp là tác nhân chính khiến Covid-19 phát triển mạnh hơn.
Thử nghiệm trong bài báo khoa học trên cho thấy mối tương quan phi tuyến tính đặc trưng của các nhà phân tích dữ liệu lớn. Theo Viktor Mayer-Schonberger, sự phi tuyến tính này đem đến khả năng xác định các chỉ số trước đây chưa thể thực hiện được, chẳng hạn chỉ số hạnh phúc của con người sẽ được đo bằng GDP.
Chỉ báo dữ liệu từ quá khứ
Cứ khoảng 20 năm, các mốt thời trang lại quay trở lại. Những cái quần jeans ống rộng, ống loe in đủ loại hình thù cùng những chiếc áo cắt xẻ táo bạo đại diện cho thời trang Y2K ngày càng phổ biến với giới trẻ. Đối với Gary Smith (tác giả cuốn Huyễn tưởng về trí tuệ nhân tạo), việc hồi mốt này thực chất có thể lý giải bằng phương pháp hồi quy áp dụng trong phân tích dữ liệu lớn. Các kết quả trong quá khứ luôn có tỷ lệ lặp lại ở hiện tại.
Cuốn sách Huyễn tưởng về trí tuệ nhân tạo của Gary Smith. Ảnh: Netabooks. |
Phương pháp này là một quy trình thống kê giúp đánh giá mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. Chẳng hạn với dịch cúm 2009, phán đoán của Google hầu như dựa trên các thông tin trước đó thu thập được từ đợt dịch 2008, 2003. Trí tuệ nhân tạo của Google sẽ loại dần từng kết quả sao cho ứng với dữ liệu mới được người tìm kiếm đặt ra, được gọi là biến phụ thuộc. AI đã thực hiện bước tổng hợp vài nghìn tỷ tỷ biến độc lập chỉ trong vài giây để cho ra một câu trả lời xứng với biến phụ thuộc.
Phân tích hồi quy là một công cụ hữu ích để tìm ra tiên lượng, rủi ro liên quan đến các trường hợp của từng bệnh nhân. Nó cũng có thể cung cấp dự báo cần thiết cho việc điều trị.
Bài báo Multiple regression model to analyze the total LOS for patients undergoing laparoscopic appendectomy trên blog khoa học y tế BMC cũng từng chỉ ra rằng mô hình phân tích hồi quy đã cho thấy kết quả về thời gian lưu trú cần thiết cho bệnh nhân cắt ruột thừa nội soi. Đây là công cụ giúp cho các bác sĩ chẩn đoán được liệu các biến chứng có thể xuất hiện hay không và bệnh nhân có đặc điểm như nào cần được theo dõi lâu hơn.
Trong đại dịch Covid-19, phương pháp hồi quy được thực hiện bởi các nhà khoa học tại Thụy Sĩ cho thấy lượng cholesterol và cân nặng ảnh hưởng đến khả năng tử vong và nhiễm bệnh. Trong đó, tỷ lệ nhập viện do Covid-19 của những người mắc bệnh béo phì cao hơn rõ rệt.
Không thể phủ nhận rằng, cuộc sống của chúng ta được hình thành từ dữ liệu và big data là công nghệ hữu ích trong nhiều lĩnh vực. Các công ty lớn như Amazon, Target... cũng ứng dụng công nghệ này từ cách đây gần 10 năm, cho đến nay họ đã trở thành các "đế chế" thương mại toàn cầu. Tìm hiểu về dữ liệu lớn là cách để hiểu về vị trí của con người trong không gian mạng.
Đọc được sách hay, hãy gửi review cho Zing News
Bạn đọc được một cuốn sách hay, bạn muốn chia sẻ những cảm nhận, những lý do mà người khác nên đọc cuốn sách đó, hãy viết review và gửi về cho chúng tôi. Zing News mở chuyên mục “Cuốn sách tôi đọc”, là diễn đàn để chia sẻ review sách do bạn đọc gửi đến qua Email: books@zingnews.vn. Bài viết cần gửi kèm ảnh chụp cuốn sách, tên tác giả, số điện thoại.
Trân trọng