Amazon Web Services (AWS) – nhà cung cấp hạ tầng điện toán đám mây hàng đầu thế giới – đã gặp sự cố nghiêm trọng vào chiều nay, khiến hàng loạt website và dịch vụ lớn bị ngừng hoạt động trên diện rộng.
Một loạt trang web lớn bị ảnh hưởng
Sự cố bắt đầu khoảng 14 giờ trưa theo giờ Việt Nam (tức sau nửa đêm giờ Thái Bình Dương) tại khu vực US-East-1, trung tâm dữ liệu chủ lực của AWS đặt tại Bắc Virginia, Hoa Kỳ.
Theo thông báo trên trang trạng thái dịch vụ của AWS, công ty cho biết đang gặp vấn đề về DNS (Domain Name System) đối với DynamoDB – dịch vụ cơ sở dữ liệu then chốt được sử dụng để vận hành nhiều ứng dụng khác của AWS.
Hệ thống DNS có nhiệm vụ chuyển đổi tên miền của trang web thành địa chỉ IP, cho phép trình duyệt và các ứng dụng truy cập và tải nội dung.
AWS thông báo đang đối mặt với “sự cố vận hành” ảnh hưởng đến “nhiều dịch vụ”, đồng thời cho biết họ đang “thực hiện song song nhiều biện pháp để đẩy nhanh quá trình khắc phục”. Thông tin này được đăng tải vào lúc 16 giờ 01 phút theo giờ Việt Nam, với hơn 70 dịch vụ nội bộ của AWS bị ảnh hưởng. Không lâu sau đó, AWS xác nhận “đang ghi nhận những dấu hiệu phục hồi rõ rệt”.
Đến 17 giờ 35 phút theo giờ Việt Nam, công ty cho biết “sự cố đã được khắc phục hoàn toàn”, và “phần lớn các dịch vụ AWS hiện đang hoạt động bình thường”.
AWS cho biết: “Một số yêu cầu có thể vẫn bị giới hạn trong khi chúng tôi tiếp tục xử lý triệt để sự cố”, đồng thời thừa nhận một số dịch vụ vẫn đang giải quyết lượng yêu cầu tồn đọng.
Ảnh hưởng lan rộng đến các dịch vụ công và doanh nghiệp lớn
Ngay cả các trang web của chính phủ Anh, bao gồm Gov.uk và Cục Thuế & Hải quan (HMRC), cũng bị ảnh hưởng – theo dữ liệu từ Downdetector.
Người phát ngôn của Chính phủ Anh cho biết: “Chúng tôi đã ghi nhận sự cố ảnh hưởng đến Amazon Web Services và nhiều dịch vụ trực tuyến phụ thuộc vào hạ tầng của họ. Theo quy trình ứng phó sự cố đã thiết lập, chúng tôi đang phối hợp với AWS để khôi phục dịch vụ sớm nhất có thể”.
Lloyds Banking Group cũng xác nhận một số dịch vụ của họ gặp trục trặc và kêu gọi khách hàng “kiên nhẫn trong thời gian khắc phục”. Khoảng 20 phút sau, ngân hàng cho biết các hệ thống đang dần trở lại trực tuyến.
Reddit thông báo họ “đang trong quá trình khôi phục hoạt động lên 100%” – theo lời người phát ngôn của công ty.
Một số hành khách của United Airlines và Delta Air Lines chia sẻ trên mạng xã hội rằng họ không thể tra cứu vé, làm thủ tục hoặc gửi hành lý trực tuyến.
Người dùng cũng phản ánh nhiều trò chơi điện toán đám mây như Roblox và Fortnite bị gián đoạn, trong khi sàn giao dịch tiền mã hóa Coinbase xác nhận “nhiều người dùng không thể truy cập tài khoản”.
Công cụ thiết kế đồ họa Canva cho biết họ đang “ghi nhận tỷ lệ lỗi tăng đột biến, ảnh hưởng đến chức năng của nền tảng”, đồng thời nói rõ “sự cố lớn nằm ở nhà cung cấp đám mây nền tảng của chúng tôi”.
Công cụ tìm kiếm AI Perplexity cũng bị ảnh hưởng. Giám đốc điều hành Aravind Srinivas viết trên X (Twitter): “Nguyên nhân gốc rễ là lỗi từ AWS. Chúng tôi đang làm việc để khắc phục”.
Hạ tầng tập trung – điểm yếu của thế giới số
Đây không phải lần đầu các công ty công nghệ lớn bị “tê liệt” bởi sự cố kỹ thuật. Tháng 7 năm 2024, một bản cập nhật lỗi từ hãng an ninh mạng CrowdStrike đã khiến hệ điều hành Microsoft Windows trên toàn cầu ngừng hoạt động, gây thiệt hại hàng triệu USD và làm ngưng trệ hàng nghìn chuyến bay. Sự cố đó còn ảnh hưởng đến bệnh viện và ngân hàng trên khắp thế giới.
Theo ông Rob Jardin, Giám đốc kỹ thuật số của công ty an ninh mạng NymVPN, “không có dấu hiệu nào cho thấy sự cố AWS lần này là một cuộc tấn công mạng. Đây có vẻ là lỗi kỹ thuật tại một trung tâm dữ liệu lớn của Amazon”.
Ông Jardin nhận định: “Những sự cố như thế này có thể xảy ra khi hệ thống bị quá tải hoặc một bộ phận trọng yếu của mạng ngừng hoạt động. Do quá nhiều trang web và ứng dụng phụ thuộc vào AWS, tác động lan truyền rất nhanh”.
Ông Jardin cũng nhấn mạnh: “Sự cố này nhắc nhở rằng an ninh mạng không chỉ là phòng thủ trước các mối đe dọa, mà còn là khả năng chống chịu. Doanh nghiệp cần chuẩn bị cho cả các lỗi kỹ thuật, không kém phần nghiêm túc so với việc phòng chống tấn công mạng – bằng cách xây dựng hệ thống dự phòng, sao lưu dữ liệu và áp dụng chiến lược đa nền tảng đám mây để duy trì dịch vụ khi có sự cố bất ngờ”.
“Một cái hắt hơi của Amazon, cả Internet cảm cúm”
Theo Mike Chapple, Giáo sư Công nghệ Thông tin tại Trường Kinh doanh Mendoza – Đại học Notre Dame, và cựu chuyên gia khoa học máy tính tại Cơ quan An ninh Quốc gia Hoa Kỳ (NSA):
“DynamoDB là cái tên mà phần lớn người dùng chưa từng nghe tới, nhưng nó chính là một trong những ‘bộ nhớ trung tâm’ của Internet hiện đại”.
Ông nói thêm: “Các báo cáo ban đầu cho thấy đây không phải là vấn đề với bản thân cơ sở dữ liệu – dữ liệu vẫn an toàn. Sự cố nằm ở phần ‘bản đồ chỉ dẫn’ giúp các hệ thống khác biết nơi tìm dữ liệu của mình”.
Giáo sư Chapple kết luận bằng một nhận xét đáng suy ngẫm: “Sự cố này là lời nhắc nhở rõ ràng rằng thế giới đang phụ thuộc nặng nề vào một vài nhà cung cấp dịch vụ đám mây lớn như Amazon, Microsoft và Google. Khi một trong ba ‘gã khổng lồ’ này hắt hơi – toàn bộ Internet liền cảm cúm”.
1thegioi