CEO CrowdStrike George Kurtz nhận trách nhiệm về sai sót này và cho biết bản sửa lỗi phần mềm đã được phát hành. Ảnh: Bloomberg. |
“Bạn đã thử tắt đi bật lại chưa?” là câu nói quen thuộc của các phòng IT, nhưng nay lại được Microsoft lặp đi lặp lại liên tục vào ngày 19/7. Nó được xem như một lời khuyên của hãng, giúp sửa bản cập nhật CrowdStrike bị lỗi đã đánh sập hàng nghìn PC và máy chủ Windows chỉ trong một ngày.
Không phải tấn công mạng hay sự cố bảo mật
Các ngân hàng, hãng hàng không, truyền hình và hệ thống y tế trên toàn thế giới sử dụng Microsoft 365 đồng loạt ngừng hoạt động trên diện rộng vào đầu ngày 19/7.
Hàng nghìn chuyến bay và dịch vụ tàu hỏa đã bị hủy trên toàn cầu, trong đó có hơn 1.800 chuyến ở Mỹ. Đồng thời, nhiều dịch vụ công cộng và bán lẻ khác cũng bị gián đoạn.
Sự cố xảy ra do sự cố kỹ thuật sau khi công ty an ninh mạng toàn cầu CrowdStrike cập nhật phần mềm. CrowdStrike là công ty cung cấp phần mềm chống virus cho Microsoft cho các thiết bị Windows.
“Đầu ngày hôm nay, bản cập nhật CrowdStrike đã khiến một số hệ thống CNTT trên toàn cầu bị sập”, Microsoft nói với CBS News.
Hàng loạt thiết bị sử dụng dịch vụ Microsoft gặp lỗi. Ảnh: Bloomberg. |
Cuối ngày 19/7, Microsoft cho biết hãng đã "hoàn thành các biện pháp giảm nhẹ ảnh hưởng”. Đồng thời, dữ liệu đo từ xa cũng chỉ ra tất cả ứng dụng và dịch vụ Microsoft 365 bị ảnh hưởng đều đã được phục hồi. “Chúng tôi đang bước vào giai đoạn giám sát để đảm bảo hậu quả được giải quyết hoàn toàn”, hãng công nghệ khẳng định.
Về phía CrowdStrike, CEO George Kurtz nhận trách nhiệm về sai sót này và cho hay bản sửa lỗi phần mềm đã được phát hành. Ông cảnh báo rằng có thể phải mất thêm một thời gian nữa toàn bộ hệ thống mới khôi phục, trở lại bình thường.
“Chúng tôi rất xin lỗi về hậu quả đã gây ra cho khách hàng, khách du lịch và bất kỳ ai bị ảnh hưởng bởi việc này”, ông Kurtz trả lời phỏng vấn với NBC.
Ông cho biết CrowdStrike đang liên lạc với những khách hàng bị ảnh hưởng. Lỗi gây ra sự cố này được tìm thấy trong một bản cập nhật dành cho máy chủ Windows. Máy chủ Mac và Linux không bị ảnh hưởng. "Đây không phải là sự cố bảo mật hay tấn công mạng. Sự cố đã được xác định, cách ly và bản sửa lỗi đã được triển khai”, CEO nói.
Khó phục hồi toàn bộ hệ thống
Trong một thông báo trên Azure, Microsoft cho biết nhiều khách hàng nói rằng việc thử khởi động lại máy ảo và PC nhiều lần có thể sẽ hiệu quả.
“Chúng tôi đã nhận được phản hồi từ khách hàng rằng cần phải khởi động lại nhiều lần (đôi khi lên đến 15 lần). Nhưng nhìn chung, khởi động lại là một cách khắc phục sự cố hiệu quả ở thời điểm này”, hãng công nghệ cho biết.
Nếu khởi động lại máy 15 lần không hiệu quả, Microsoft khuyến nghị một giải pháp thay thế được nhiều chuyên gia IT đang sử dụng hiện nay. Đó là xóa driver CrowdStrike bị lỗi.
Nhưng với các máy ảo Azure của Microsoft, lời khuyên là nên để các nhân viên phòng IT chạy lại ổ đĩa hơn và cố gắng xóa tệp bị lỗi, thay vì phải khởi động máy vào Chế độ An toàn (Safe Mode)
Thời gian sử lỗi sẽ mất nhiều ngày. Ảnh: The National. |
Theo The Verge, nhiều nhân viên IT nói rằng việc khởi động lại quả thật đã khắc phục sự cố. Thật đáng kinh ngạc khi một trong những sự cố lớn nhất trong lịch sử ngành công nghệ lại có thể được khắc phục chỉ bằng cách tắt và bật lại thiết bị, trang tin nhận định.
Nói với Reuters, Giám đốc thông tin của công ty bảo mật danh tính CyberArk, Omer Grossman, cho rằng ngay cả khi CrowdStrike phát hành bản sửa lỗi, hậu quả vẫn sẽ mất thời gian để giải quyết. Lý do là vấn đề liên quan đến hệ thống phát hiện và phản hồi các mối nguy hại tại điểm cuối (Endpoint Detection & Response - EDR), chạy trên các máy khách cá nhân.
"Các điểm cuối đã sập, gây ra màn hình xanh chết chóc, nên chúng không thể được cập nhật từ xa và vấn đề phải được giải quyết theo cách thủ công, tức là từng điểm cuối một. Quá trình này dự kiến sẽ mất nhiều ngày", Grossman cho biết.
Trong cuộc phỏng vấn với CNBC, CEO Kurtz của CrowdStrike cho biết nhiều hệ thống bị ảnh hưởng đã bắt đầu phục hồi. Bên cạnh đó, đối với một số khách hàng, họ có thể dễ dàng sửa lỗi bằng cách khởi động lại máy tính hoặc máy chủ.
Tuy nhiên, ông thừa nhận rằng "một số hệ thống có thể không phục hồi hoàn toàn và chúng tôi đang làm việc riêng với từng khách hàng”. Kurtz không cung cấp khung thời gian chính xác. Có vẻ như nhiều công ty và tổ chức trên thế giới sẽ phải dựa vào bộ phận IT của riêng mình để khôi phục và vận hành hệ thống, CBS News kết luận.
Nhóm người săn lùng loại mã độc nguy hiểm nhất thế giới công nghệ
Trong quyển sách mới, Renee Dudley và Daniel Golden đưa độc giả đến gần hơn với cuộc chiến thầm lặng của những chuyên gia công nghệ toàn cầu, chống lại kẻ đứng sau ransomware.