클라우드플레어의 R2 오브젝트 스토리지 플랫폼에서 피싱 URL을 차단하려는 시도가 역효과를 불러와서, 거의 한 시간 동안 여러 서비스가 중단되는 대규모 장애가 발생했습니다. 클라우드플레어 R2는 Amazon S3와 유사한 오브젝트 스토리지 서비스로, 확장 가능하고, 내구성이 있으며, 저렴한 데이터 저장을 위해 설계되었습니다. 이 서비스는 무료 데이터 검색, S3 호환성, 여러 위치에 걸친 데이터 복제, 그리고 클라우드플레어 서비스 통합을 제공합니다.
이번 장애는 어제 클라우드플레어의 R2 플랫폼에서 피싱 URL에 대한 학대 보고에 대응하는 직원이 특정 엔드포인트를 차단하는 대신 실수로 전체 R2 게이트웨이 서비스를 꺼버렸을 때 발생했습니다. 클라우드플레어는 사후 분석에서 "일상적인 학대 대응 과정에서 보고서와 관련된 특정 엔드포인트/버킷을 차단하는 대신 실수로 R2 게이트웨이 서비스를 비활성화하는 조치가 취해졌다"고 설명했습니다.
이 사건은 UTC 기준으로 오전 8시 10분부터 9시 9분까지 59분 동안 지속되었으며, R2 오브젝트 스토리지 자체뿐만 아니라 스트림, 이미지, 캐시 예약, 벡터라이즈, 로그전달, 주요 투명성 감사자와 같은 서비스에도 영향을 미쳤습니다. 클라우드플레어는 이 사고에서 인적 오류와 큰 영향이 있는 작업에 대한 검증 검사와 같은 안전 장치의 부재가 중요한 요인이라고 지적했습니다.
요약
- 클라우드플레어의 R2 오브젝트 스토리지 플랫폼에서 피싱 URL을 차단하려는 시도가 역효과를 불러와서, 거의 한 시간 동안 여러 서비스가 중단되는 대규모 장애가 발생했다.
- 이번 장애는 어제 클라우드플레어의 R2 플랫폼에서 피싱 URL에 대한 학대 보고에 대응하는 직원이 특정 엔드포인트를 차단하는 대신 실수로 전체 R2 게이트웨이 서비스를 꺼버렸을 때 발생했다.
- 이 사건은 UTC 기준으로 오전 8시 10분부터 9시 9분까지 59분 동안 지속되었으며, R2 오브젝트 스토리지 자체뿐만 아니라 다른 여러 서비스에도 영향을 미쳤다.
※ 이 글은 생성형 AI(ChatGPT-4)에 의해 요약되었습니다.