디지털 중심 사회에서 IT 인프라에 대한 재해 상황은 더 이상 단순한 시스템 장애에 머물지 않고, 국가와 사회의 일상적인 운영 자체를 흔드는 ‘디지털 재난’으로 확산되는 시대가 되었습니다.민간 플랫폼이 멈추면 국민 생활이 멈추고, 공공 시스템이 멈추면 행정·인증·민원·복지 등 핵심 서비스가 동시에 정지될 수 밖에 없습니다.
따라서 전력·통신·데이터센터·백업·재해복구 체계를 포함한 인프라 전반의 복원력(Resilience)이 국가 경쟁력과 기업 신뢰도를 좌우하는 시대가 되었다고 할 수 있을 겁니다.
RPO(목표 복구 시점)와 RTO(목표 복구 시간)를 거의 0에 가깝게 만든다는 가장 이상적인 재해 복구 시스템의 목표에도 불구하고, 완벽한 DR 센터를 구축한다는 건 쉬운 일이 아니죠.
그리고, 실제 현장에서 재해 복구가 지연되는 결정적인 이유는 기술력의 부족보다는 '판단과 커뮤니케이션의 부재' 라는 게 재해 복구 전문가들의 의견이기도 합니다.
" 당장 사고가 터지면, 'DR 시스템을 가동할 수 있는가?', 'DR 시스템 가동이 불가하면 어떻게 복구할 것인가?', '어떤 시스템을 우선순위 1번으로 둘 것인가' 등에 대해 빠른 의사결정이 이루어져야 해요.
- HS 효성인포메이션시스템 김형주 팀장 -
이번 TMI(Tech Men Interview) EP 08에서는 재해 현장의 최전방을 누비는 HS효성인포메이션시스템의 김형주 팀장과 금융권 인프라 전문가 양경모 매니저를 모시고, 재해 발생 직후의 우선순위와 복구 과정의 실질적인 고충을 허심탄회하게 짚어보았습니다.
문서 속의 계획이 아니라 긴박한 재해 현장 속에서 핵심 자산을 지켜낼 수 있는 중요 체크 포인트들을 이번 잇츠맨 리뷰로 전해드릴까 합니다.