영화 다이하드 4.0을 보면 파이어 세일이라는 용어가 나온다. 이 용어는 3단계의 해킹과 크래킹 과정을 의미한다. 그 과정을 통해 가공할 만한 전상장애를 일으켜 국가를 붕괴시켜버리는 것이다. 1단계는 교통기관 시스템 마비, 2단계는 금융·통신 전산 장애, 3단계는 가스·수도·전기·원자력 시스템을 점령하는 것이다. 모든 것이 컴퓨터 속의 소프트웨어로 컨트롤 되고 있으므로 위의 3단계와 같은 전산장애만 일으킨다면 국가가 무너지는 것은 불을 보듯 뻔한 것이다.

 

국가가 아니라 당신이 위험하다
현실에서의 전산장애는 영화처럼 1,2,3 단계가 동시에 발생하지는 않으므로 국가가 아니라 개인과 기업을 위협한다. 현실에서 실제로 발생하는 전산장애를 생각해보자. 오늘이 만기일이라고 가정하자. 오후 4시에 송금을 하려고 했는데 은행에 전산장애가 발행해 송금이 불가능 하다면 기업이 부도가 날 수 있고 개인이라면 신용불량자가 될 수 있다. 이로 인해 부도난 기업의 CEO는 자살할 수도 있다. 30분의 전산장애로 기업과 개인의 운명이 바뀔 수 있는 것이다.
 
늑장 대응을 도마 위로 올려보자
의도적인 해킹과 크래킹 등을 통한 전산장애는 보안 솔루션을 도입하면 전산장애를 최소화 할 수는 있다. 하지만 전산장애를 완벽히 막을 수는 없다. 왜냐하면 해킹뿐 아니라 자연재해, 인재(사람의 실수)등은 예고되지 않을뿐더러, 막기도 힘들다. 따라서 전산장애 발생의 확률을 최대한 낮추는 것과 전산장애를 만났을 때 빨리 대처하는 것이 최선이다. 전산장애를 만났을 때 빨리 해결해야만 당신의 피해가 최소화되는 것이다. 그런데 많은 기업에서는 왜 전산장애에 늑장 대응을 하는 것일까? 오늘은 이 부분을 다루려고 한다.


전산 장애를 해결하는데 시간이 오래 걸리는 이유는 장애가 발생했을 때 신속히 전산 담당자들에게 알리는 경보 시스템이 없다거나, 장애 복구 시스템(DR)이 없거나, 담당자가 없어서 원인을 분석할 수 없기 때문이 아니다. 물론 그런 경우도 있겠지만 기본적인 것들을 준비하지 않고서 장애를 빨리 해결하려는 것은 당치도 않은 욕심이다. 많은 기업들이 기본적인 것들은 준비하고 있다. 그럼에도 불구하고 장애가 빨리 해결되지 않는 이유는 세 가지로 볼 수 있다. 이 세 가지 문제들은 지난 몇 십 년간 방치되어 왔다. 장애를 빨리 해결하려면 이제는 더 이상 방치하면 안될 것이다. 다행히, 일부의 기업에서 이런 문제를 간파하여 장애시의 Down Time을 최소화 하고 있지만 아직 갈 길은 멀다

늑장의 원인 세 가지는 무엇인가?
많은 기업들이 간과하는 세 가지 문제는 간단한 것이다. 첫 번째, 장애상황에서 대응을 못하도록 정신적인 고통을 주는 사람이 당신의 조직에 있다는 것을 알고 있는가? 말도 안 된다고과연 그런가두 번째, 장애상황을 극복하려면 해당분야의 전문 지식이 필요하다. 그런데 전문 지식을 가질 수 없게 만드는 사람이 여러분의 주위에 있다면 당신은 믿겠는가? 세 번째, 일단 장애를 해결했으면 앞으로 비슷한 유형의 장애는 발생하지 않게 해법을 만들어야 한다. 하지만 많은 경우에 해법이라는 것이 임시방편이므로 같은 유형의 장애를 또 만나게 된다는 것을 알고 있는가? 다시 말해, 소를 잃었음에도, 외양간을 고치지 않고 있다. 여러분이 근무하는 곳은 어떤가? 위의 세 가지 일이 발생하지 않는다고 장담할 수 있는가? 이제부터 세 가지에 대해 좀더 상세히 알아보자.


 

1. 심리적 관점

병풍치기가 무엇인가?
장애가 나면 언제나 볼 수 있는 풍경이 있다. 조치를 하고 있는 전산담당자의 바로 뒤편에 관리자들이 주~욱 둘러선다. 장애 때문에 발을 동동 구를 수도 있고, 언제 장애가 풀릴 것인지 궁금해서 그럴 수도 있고, 담당자가 얼마나 빠른 조치를 하는지 보려는 사람도 있을 것이다. 필자는 이런 현상을 “장애시의 병풍치기”라고 한다. 병풍치기만 없어져도 장애가 빨리 해결될 수 있다. 수십 명이 담당자의 뒤편에 병풍을 치고 있는데, 이 사람들은 감시자인가? 아니면 담당자의 도우미인가? 도우미는 경험 많은 사람 한 명, 그리고 관련분야의 지식이 풍부한 전문가 한 명, 총 두 명이면 충분하다. 이 두 명도 뒤편에서 병풍을 칠 것이 아니라 담당자의 왼편과 오른편에서 모니터를 같이 바라보아야 한다. 문제를 해결하려는 동료의 관점에서 말이다

장애를 해결하는 당사자의 심리
서버 담당자가 장애를 해결하기 위해 특정 명령어를 날리려고 한다. 그런데 1년에 한번 쓸까 말까 한 명령어이므로 기억하기 힘들다. 그래서 매뉴얼을 보거나 인터넷으로 명령어를 찾아야 한다. 그런데 병풍이 쳐져 있으면 책을 보거나, 인터넷을 뒤져보기 힘들다. 왜냐하면 병풍이 쳐져 있을 때, 담당자는 다음처럼 생각하기 때문이다. 내가 명령어를 찾으려고 인터넷을 뒤지면 내 뒤에 있는 관리자들이 어떻게 생각 할까? “서버 담당자 맞아? 어떻게 명령어도 모를 수가 있지?” 라고 생각하겠군. 

Walking Dictionary?
이런 생각은 담당자의 머릿속에만 존재하는 것이 아니라 여지없이 현실로 나타난다. 장애 담당자가 명령어를 인터넷에서 찾기라도 하면, 기다렸다는 듯이 뒤편의 사람들이 수군거리기 시작한다. 도대체 누가 모든 명령어를 외우고 다닌단 말인가? 다른 분야의 전문가들에게 물어보라. 의사가 의학서적을 뒤지는 이유, 변호사가 법률서적을 뒤지는 이유, 영문학 번역가가 영어사전을 뒤지는 이유를 물어보라.

병풍은 장애당당자를 어떻게 방해하나?
뒤편의 사람들이 수군거리기 시작하고, 장애로 인해 타격을 받는 부서의 사람들은 계속 발을 동동 구르고 있고, 전산부서의 관리자들은 사태가 언제쯤 해결될지 계속해서 담당자에게 질문을 해대고…… 전형적인 병풍치기 광경이다. 전산당당자들이 이런 상황에서 제대로 일을 할 수 있을까? 담당자의 실력을 의심하는것, 발을 동동 구르는 것, 담당자에게 계속 질문을 해대는 것, 모두가 담당자를 방해하는 것이다.

역지사지 (易地思之)
장애 담당장의 뒤편에 서있을 뿐, 그 사람의 실력을 의심한 적은 없다고 혹자는 생각 할 수도 있다. 하지만 불행히도 그런 생각과는 아무 상관이 없다. 무슨 말이냐 하면, 어떤 사람이 술집에서 음란한 이야기를 했다고 치자. 그 자리에 같이 있던 여성이 나중에 수치심을 느끼고 그 사람을 신고할 수 있다. 그 사람은 재미로 이야기 한 것이지만, 그 여성이 어떻게 받아들이느냐에 따라서 신고할 수도 아닐 수도 있는 것이다. 마찬가지로 장애를 복구하는 담당자가 뒤편에서 팔짱을 끼고 있는 사람을 어떻게 받아들이느냐가 중요한 것이다. 장애 담당자의 대부분은 뒤에 서있는 사람을 불편하게 생각한다는 것을 알고 있는가?


장애보고는 단 한번으로 족하다

내가 만나본 최악의 상황은 전산 담당자가 똑 같은 장애상황을 다섯 번이나 보고한 것이다. 서로 다른 병풍이 다섯 번이나 나타난 것이다. 즉 관리자A가 나타나서 어떻게 된 일인지 질문을 하면 담당자는 장애 상황에 대해 답변을 해야 한다. 그런데 관리자가 어디 한 명뿐인가? 관리자 B, 관리자 C, 관리자 D, …… 계속해서 관리자나 장애와 관련된 사람들이 나타나고 담당자는 계속 설명한다. 조금이라도 빨리 장애를 복구해야할 담당자가 일은 하지 않고 5분간 말만하고 있다. 장애가 어떻게 발생된 것인지 궁금하겠지만 조금이라도 장애시간을 줄이려면 담당자에게 질문하지 말아야 한다. 필자 또한 이런 질문을 한 적이 있다. 명백한 나의 실수였다.   

조선시대에 왕은 일반인이 알아볼 수 없도록 변장을 하고, 백성들이 어떻게 사는지 살펴보곤 하였다. 변장을 하지 않으면 어떤 식으로든 백성들에 민폐를 끼치기 때문이다. 조선시대의 왕처럼 전산실을 넘나드는 사람들도 장애를 복구하는 사람에게 어떠한 방해도 끼쳐서는 안 된다. 이 둘간의 차이점은 민폐를 끼치지 않으려는 방법이 서로 다른 것이다. 변장을 하는 것과 병풍을 치우는 것.

그림의 출처 http://www.chosun.com/site/data/html_dir/2007/10/04/2007100400081.html

병풍을 치워라
병풍치기는 담당자를 얼어붙게 만들며, 뒤편의 사람들에게 지속적으로 신경을 써야 하므로 장애상황에 집중할 수 없게 한다. 장애상황에서 빨리 해결하도록 담당자를 돕고 싶으면 병풍을 없애라. 담당자에게 장애보고를 받아야 한다고? 그렇게 하면 뭐가 달라지는가? 선 조치 후 보고를 하면 왜 안 되는가? 장애의 해결이 먼저인가? 아니면 보고가 먼저인가? 물론 관리자의 의사결정이 필요한 경우는 있다. 그러면 담당자가 자연스럽게 물어볼 것이다. 그때 결정 해주면 된다. 장애의 해결을 막는 병풍은 필요 없다. 담당자는 누구보다 장애에 대해 큰 스트레스를 받는다. 이 상태에서 병풍까지 만들어 심리적으로 괴롭히면 문제를 해결하는데 방해가 될 뿐이다.


2. 조직문화
원인을 파악하고 해결책을 구하는데 며칠이 걸린다면 이미 끝난 게임이다. 이런 일이 발생하지 않으려면 평소에 관련분야의 매뉴얼과 책을 읽어야 장애 시에 빠른 원인 파악과 조치가 가능하다. 전산 담당자는 이런 사실을 알고 있으므로 평소에 책과 매뉴얼을 읽으려고 노력한다. 책꽂이에 관련분야의 책이 꼽혀있는 이유 중 하나도 그것 때문이다. 하지만 지난 몇 십 년간 책꽂이가 전시용이라는 사실을 알고 있는가?


전문가로 키울 수 없는 회사 분위기
전산 담당자가 업무시간 중에 책을 읽으려고 하면 난리가 난다. 일은 안하고 책이나 본다는 것. 얼마나 무책임한 관리자인가? 회사를 위해 매뉴얼과 책을 읽는다는 생각은 하지 못하는 것일까? 평소에 지식을 충분히 습득하고 있으면, 장애가 발생했을 때 당황하지 않을뿐더러 장애 시간을 줄일 수 있다. 이런 것이 개인적인 일인가? 아니면 회사를 위한 일인가? 관리자는 전산담당자에게 매뉴얼과 책을 읽을 수 있는 분위기를 조성해야 한다.

 

혹시 인터넷을 금지하고 있는가? 이런 상황 또한 전문가가 만들어지기 힘든 환경이다. 많은 기업들이 제품매뉴얼을 책으로 배포하는 대신에 인터넷으로 대체하고 있다. 이런 상황에서 인터넷을 금지한다는 것은 시대착오적인 발상이다. 물론 책과 인터넷이 업무와 전혀 상관없는 일에 몰두하게 만든다면 방해가 될 수도 있다. 그런 경우까지 방치해야 한다고 주장하는 것은 아니다.

 

지식장려상을 만들어라

농담이라도업무시간 중에 책 보지 말고 시스템 모니터링을 하라라는 이야기는 하지 않아야 한다. 직원은 관리자의 눈치를 보게 마련이다. 또한 그 들은 바보가 아니다. 장애의 상황에서 시스템을 분석하지 않고 만화책을 보겠는가? 절대 그럴 일은 없다. 오히려 전문 지식의 습득을 장려하고, 정기적으로 세미나를 열어서 개인들이 공부한 것들을 조직원들에게 공유하는 것으로 회사문화를 바꾸기 바란다. 전산장애시 빠르고, 정확한 대응을 할 수 있는 전문가는 번쩍 하고 태어나는 것이 아니라, 천천히 만들어지는 것이므로.


3.
인과관계와 장기적 해법

원인의 인과관계를 끝까지 밝혀라
실제로 전산장애가 발생하면, 가정 먼저 해야 할 것은 원인 파악이다. 그 원인이라는 것이 발견하기 쉽다면 다행이지만 그렇지 않은 경우라면 시간이 많이 걸린다. 예를 들면, 단순히 Disk가 꽉 차서 서비스가 안 된다고 판단할 수 있다. 그렇다면 Disk만 추가하면 될까? 하지만 그런 단편적인 생각은 또 다른 재앙을 부를 수 있다. 좀더 면밀히 분석한 결과 Disk가 꽉 차는 현상은 Hacking에 의한 것으로 판명될 수 있다. 원인을 파악했다고 생각하지 말고 한번 더 생각하기 바란다. 즉 원인의 원인은 무엇인지 파악해야 한다.

해법인가 임시방편인가?
원인의 인과관계를 밝혔다면 근본적인 해결책을 생각해야 한다. Disk를 추가하고, Hacker IP를 잡아내어 접속하는 것을 막았다고 하자. 여기가 끝일까? 이런 일은 임시방편에 불과하다. Hacker IP를 바꿔서 공격해 온다면? 불과 몇 초 후에 시스템은 다시 뚫릴 수 있다. Hacker IP를 잡아내어 접속하는 것을 막았다고 안심하지 말고, 방화벽의 허점을 강화 할 것인지, 추가적인 보안 솔루션을 구매할 것인지를 고려하라는 것이다. 지금 당장 장애를 해결하기 위한 조치(임시방편)는 중요하다. 하지만 여기서 멈추면 안 된다. 근본적인 해결방법이 없는지 생각해 보아야 한다. 그렇지 않으면 비슷한 패턴의 장애를 또 맞을 수 있다.

 

결론
의도적이지 않은 장애는 두 가지로 구분할 수 있다. 인재(사람이 실수로 장애를 발생시킴)와 자연재해이다. 자연재해는 대비는 할 수 있지만 발생을 막을 수는 없다. 하지만, 인재는 발생을 최소화 할 수도 있고, 피해를 최소화 할 수도 있다. 그렇게 하기 위해서는 무엇보다 사람에 집중해야 한다. 즉 담당자에게 심리적 안정감을 주고 (1) 조직문화를 올바른 방향으로 유도(2)하는 것이 좋은 방법이다. 이와는 반대로 문제해결에만 집착하는 것은 발등에 덜어진 불을 끌 수는 있으나 장기적으로는 현명한 방법이 아니다. 하지만 안타깝게도 많은 기업들은 오직 문제해결의 방법(3 )에만 집중할 것이다. 1, 2, 3번을 평등하게 바라보아야 한다.

다시 한번 말하지만, 장애상황에서 담당자의 뒤를 받쳐야 하는 것은 병풍이 아니라 심리적 안정감과 풍부한 전문지식을 권장하는 조직문화이다. 이 두 가지가 장애상황을 더 빨리 해결할 수 있고, 장애를 예방할 수 있는 방법일 뿐만 아니라, 전산장애로 인한 개인과 기업의 피해를 최소화 할 수 있는 근본적인 해결책임은 물론이다. 

'IT' 카테고리의 다른 글

페이스북이 트위터보다 좋은 세가지 이유  (13) 2010.08.31
Posted by extremedb
,