Vì lỗi "đánh máy", hệ thống máy chủ S3 của Amazon bị tê liệt, ảnh hưởng đến hàng loạt website lớn

Ryankog

Administrator
Tham gia
6/4/16
Bài viết
4,237
Được thích
4,574
1636 #1

Vào đầu tuần này, mạng Internet đã bị ảnh hưởng khi các server lưu trữ dữ liệu của nhiều dịch vụ quan trọng đột nhiên ngừng hoạt động. Cụ thể, các server đó nằm trong hệ thống máy chủ S3 của Amazon và đây là nơi chứa dữ liệu của những trang và dịch vụ lớn như Quora, Trello, IFTTT. Tuy sau đó vài giờ, Amazon đã khắc phục được sự cố, nhưng nguyên nhân dẫn đến việc này chắc chắn sẽ khiến bạn bất ngờ.

Vào một buổi sáng thứ ba đẹp trời, các nhân viên phụ trách S3 đang debug hệ thống và họ cần phải tắt một vài server nhỏ. “Xui thay, một trong những câu lệnh đã bị gõ sai và dẫn đến rất nhiều server bị tắt", Amazon cho biết. “Các server vô tình bị tắt trên còn hỗ trợ cho hai hệ thống con khác của S3”.

Hai hệ thống con này vô cùng quan trọng. Một trong số đó có vai trò quản lý metadata và thông tin vị trí của tất cả các dịch vụ liên quan đến hệ thống máy chủ S3 trong khu vực, không có hệ thống trên, những dịch vụ dựa vào S3 không thể thực hiện phục hồi dữ liệu và tác vụ cơ bản.

“Chúng tôi muốn gửi lời xin lỗi vì những hậu quả mà sự cố này gây ra cho khách hàng[...]Chúng tôi sẽ rút kinh nghiệm sâu sắc và cải thiện trong tương lai", Amazon thông báo đến người dùng.

Tham khảo: TheVerge
 
Last edited by a moderator:
Top Bottom