Đội nghiên cứu bảo mật tại Comparitech vừa phát hiện một ngân hàng dữ liệu không được bảo mật kỹ lưỡng, khiến gần 235 triệu tài khoản Instagram, TikTok và YouTube đã bị chia sẻ trên mạng. Đây là một vụ rò rỉ khổng lồ, theo Forbes.
Gần đây, nhiều người dùng báo cáo lo ngại vấn đề dữ liệu người dùng xuất hiện trên các diễn đàn dark web. Theo ước tính, đang có 15 tỷ thông tin đăng nhập lộ ra từ hơn 100.000 vụ xâm nhập, và 386 triệu bộ dữ liệu được hacker chia sẻ miễn phí.
Không phải mọi dữ liệu trên đều có được từ các vụ tấn công. Trong một số trường hợp, như sự cố tại Utah Gun Exchange, chính các cơ sở dữ liệu không được bảo mật đã khiến thông tin bị rò rỉ trên mạng.
Cơ sở dữ liệu không bảo mật đang ngày càng trở thành vấn đề lớn. Một số nguồn tin cho rằng một nhà nghiên cứu bảo mật đã chủ trì một loạt cuộc tấn công "Meow", ghi đè lên bảng chỉ số của hàng nghìn cơ sở dữ liệu không bảo mật. Một trong số đó được các nhà nghiên cứu tại Comparitech, đứng đầu là Bob Diachenko, phát hiện vào ngày 1/8. Bộ dữ liệu đó chứa thông tin của gần 235 triệu tài khoản Instagram, TikTok và YouTube mà bất kỳ ai cũng có thể tải về.
Bộ dữ liệu gồm nhiều các tệp dữ liệu con, tệp đáng chú ý nhất có 2 bộ phận, chứa tổng cộng gần 200 triệu thông tin gom góp từ các tài khoản được cho là từ Instagram. Tệp dữ liệu lớn thứ 3 chứa thông tin của gần 42 triệu người dùng TikTok kèm 4 triệu tài khoản YouTube.
Dựa trên mẫu dữ liệu mà Comparitech thu thập được, 1/5 bộ dữ liệu chứa thông tin số điện thoại hoặc địa chỉ email người dùng. Đa số bộ dữ liệu bao gồm một hoặc tất cả thông tin cơ bản như tên, tuổi, giới tính của người dùng.
Bộ dữ liệu data từ các mạng xã hội là mồi ngon của những kẻ lừa đảo. Ảnh: Forbes. |
“Thông tin này rất có giá trị đối với những kẻ gửi thư rác và tội phạm mạng đang lên kế hoạch cho các chiến dịch lừa đảo dạng phishing. Mặc dù có thể được truy cập công khai, nhưng thực tế dữ liệu bị rò rỉ dưới dạng cơ sở dữ liệu có cấu trúc rõ ràng khiến nó có giá trị hơn nhiều so với từng tài khoản riêng lẻ”, Paul Bischoff, thành viên của Comparitech cho biết.
Hiện chưa rõ nguồn gốc các dữ liệu này. Tên các tệp dữ liệu cùng các bằng chứng khác hướng nhóm nghiên cứu đến Deep Social, một công ty từng bị Facebook và Instagram ra lệnh cấm năm 2018 sau khi có hành vi rút trích dữ liệu người dùng. Công ty này lụi tàn dần sau sự cố đó.
Rút trích thông tin web (Web scraping) là thủ thuật dùng công cụ tự động để sao chép dữ liệu và thông tin từ website với số lượng lớn. Không dễ phân biệt các công cụ này với người truy cập web thông thường, do đó các mạng xã hội thường khó ngăn chặn chúng tiếp cận dữ liệu người dùng đến khi quá muộn.
Thời điểm đó, phát ngôn viên từ Facebook trả lời Forbes rằng "rút trích thông tin người dùng từ Instagram rõ ràng là hành động vi phạm chính sách của chúng tôi. Chúng tôi đã chấm dứt quyền tiếp cận của Deep Social đối với dữ liệu các nền tảng của mình và gửi một thông báo pháp lý để ngăn cấm các hành động khai thác dữ liệu sâu hơn".
Khi tìm được bộ dữ liệu và manh mối nguồn gốc của nó, Bischoff và đồng đội đã thông báo đến Deep Social. "Chúng tôi đinh ninh rằng dữ liệu thuộc về họ", Bischoff nói. Ban lãnh đạo của Deep Social đã gửi thông báo này đến Social Data, một công ty data-marketing hướng đến người nổi tiếng trên mạng xã hội có trụ sở tại Hong Kong.
Social Data phủ định mọi liên hệ giữa họ và Deep Social.
"Social Data đã ngắt kết nối máy chủ chứa cơ sở dữ liệu này, 3 tiếng sau khi chúng tôi gửi email đầu tiên", Bischoff nói.
Kể từ thời điểm phát hiện hôm 1/8, chưa rõ hàng triệu tài khoản người dùng đã bị phát tán bao lâu trên Internet. Theo đó, Comparitech đã chỉ ra rằng các thí nghiệm của nhóm cho thấy tin tặc có thể tìm và tấn công ngân hàng dữ liệu chỉ vài giờ sau khi bị rò rỉ.
“Chúng tôi chỉ thu thập dữ liệu và kết hợp chúng với các chỉ báo có ích cho khách hàng của mình, và họ cũng chỉ dùng dữ liệu này để phục vụ các mục đích đúng đắn. Thật đáng tiếc khi sự cố này đã xảy ra. Tuy nhiên, ngay sau khi nắm bắt được sự việc, chúng tôi đã khắc phục nó ngay lập tức. Chúng tôi đang hợp tác chặt chẽ với các chuyên gia an ninh thông tin để kiểm tra cơ sở hạ tầng của mình và tăng cường mức độ bảo mật thông tin cần thiết để tránh những sự cố tương tự xảy ra trong tương lai”, đại diện Social Data cho biết.
Đến nay, cả TikTok lẫn Google vẫn đang trong quá trình xem xét và chưa đưa ra bất cứ xác nhận nào. Thời điểm hiện tại, người dùng Instagram, TikTok hay YouTube nên đặc biệt cảnh giác với những chiêu thức lừa đảo qua email hoặc dưới dạng bình luận để tránh trở thành nạn nhân của tội phạm mạng.