앉아서 사과·스피커 2명·PPT 발표 등 문제로 꼽혀
자체 데이터센터 없고 다수 서버 한곳에…피해 구제 채널 마련도 ‘아직’

남궁훈·홍은택 카카오 대표가 서비스 장애에 대해 사과했다. (사진=카카오)
남궁훈·홍은택 카카오 대표가 서비스 장애에 대해 사과했다. (사진=카카오)
“형식도, 내용도 전부 문제…카카오다운 사과였다.”

10월 19일 남궁훈·홍은택 카카오 각자대표의 기자 회견을 본 경영 컨설팅업계 전문가의 평가다. 형식도 내용도 모두가 문제라는 지적이다. △앉아서 사과한 점 △현장에 2명의 스피커를 세웠다는 점 △기자 회견에서 데이터센터 투자 관련 발표 자료를 틀어 변명했다는 점 등이 주된 문제로 꼽힌다.

심지어 일각에서는 카카오에서 문제가 생겼을 때 ‘대표 사퇴’이라는 카드를 꺼내 돌파구를 찾는다는 비판까지 나온다. 실제 올 초 ‘주식 먹튀’ 논란이 나왔을 때도 카카오 공동대표로 내정된 류영준 전 카카오페이 대표가 ‘사퇴 결정’으로 종지부를 찍었다.사과 자리에서 PPT 발표를?남궁훈·홍은택 카카오 각자대표는 경기 성남시 분당구 카카오 판교 아지트에서 데이터센터 화재로 인한 장애 관련 기자 회견을 개최했다. 대표 명의의 사과문 발표와 질의응답 등을 포함해 약 1시간 30분 정도 진행됐다.

하지만 카카오의 발표에도 비판은 사그라들지 않고 있다. 진정성이 없다는 이유에서다.

형식부터 문제였다. 이들은 앉아서 기자 회견을 했다. 고개를 숙이기 위해 회견 도중 일어났을 때를 제외하면 1시간 30분 정도 줄곧 앉아 있었다. 통상 책임자가 나서 사과할 때 일어난 상태에서 사과문을 읽거나 질의응답에 응한다. 앞서 정지선 현대백화점그룹 회장은 현대아울렛 화재로 대전을 찾았을 당시 ‘스탠딩 데스크’를 설치하고 사과했다. 정몽규 HDC현대산업개발 회장 또한 올 초 서 있는 상태로 기자 회견을 진행했다.

또한 사과 자리에서 PPT 화면을 틀고 발표한 점도 사과 회견과 맞지 않았다는 지적이다. 홍은택 대표는 ‘데이터센터’ 관련 질문이 나오자 실무자에게 자료를 요청했고 회견장 뒤쪽에 발표 자료가 나타났다. 데이터센터를 준비하는 내용을 간략하게 설명하겠다는 이유로, △자체 데이터센터 구축 관련 내용 △자체 데이터센터의 특징과 장점 등에 대한 내용이다. 이 자료에는 ‘화재 발생으로 소방서 출동 시 비용 일체는 카카오가 부담’ 등이 적혀 있었다. 변명으로 느끼게 하는 대목이다.

두 명의 스피커가 선 것도 위기 관리 전문가들이 보기에는 합당하지 않았다. 위기 시 대부분 스피커를 한 명으로 통일해 혼선을 줄이고 메시지의 일관성을 확보하는 게 원칙이기 때문이다.

이날 남궁훈 대표는 사임을 결정했다. 대표직을 내려놓고 서비스 복구에만 주력하겠다는 이유에서다. 남궁훈 대표는 10월 19일 “그 어느 때보다 참담한 심정과 막중한 책임을 통감한다”며 “쇄신 의지를 다지기 위해 대표의사직을 내려놓고자 한다. 이번 사태를 끝까지 책임지기 위해 재난대책소위의 위원장을 맡아 부족한 부분을 채우는 일에만 전념하겠다”고 밝혔다.

불과 9개월 만에 또다시 카카오에서 ‘대표 사임’이 발생했다. 앞서 카카오페이 임원 8명이 스톡옵션으로 받은 44만993주를 한 번에 매각해 878억원의 차익을 챙기면서 ‘먹튀 논란’이 심화하자 카카오 공동대표 내정자에 선임된 류영준 전 카카오페이 대표가 사퇴를 결정했다.
"사과 자리에서 PPT 발표를?" 카카오, 논란 키우는 행보
‘예상하지 못한 상황’ 해명에 커지는 비판이날 기자 회견도 ‘종지부’를 찍기에는 역부족이었다는 평가다. 카카오 데이터센터 화재 논란은 1주일째 이어지고 있다. 카카오의 주요 계열사 전반에서 서비스 장애가 발생했고 이로 인해 사용자 불편이 발생했다. 남궁훈 대표의 사임 결정에도 비판은 사그라들지 않고 있다.
파장은 컸고 대응은 부실했다.

10월 15일 오후 3시 30분, 카카오 서비스 장애가 발생했다. 정보기술(IT) 서비스 사업을 영위하는 SK C&C 판교 데이터센터에서 화재가 발생하면서 전원 공급이 차단됐고 이곳에 서버를 둔 카카오 시스템에도 문제가 생겼다.

이로 인해 카카오톡·다음·카카오맵·카카오페이·카카오뱅크·카카오페이지·카카오T·카카오내비·카카오웹툰·멜론·카카오TV·카카오게임즈·카카오스타일(지그재그)·픽코마 등 카카오 서비스 대부분의 서비스가 일시 중단됐다.

그간 카카오 서비스 오류는 여러 차례 발생했지만 복구에 수일이 걸리면서 이른바 ‘먹통 사태’가 장기화된 것은 이번이 처음이다. 오류 발생 사흘 째인 10월 17일 오전 6시 기준 서비스 정상화가 완료된 것은 4개(카카오페이·카카오게임즈·카카오웹툰·지그재그)에 불과하다.

복구가 지연되자 남궁훈·홍은택 카카오 각자대표는 사과문을 발표하고 “다른 데이터센터를 이용하는 등 최선의 조치를 취하고 있다”며 “예상보다 오랜 시간이 소요되고 있다. 복구가 늦어지는 점을 사과드리며 최대한 빨리 서비스를 정상적으로 이용할 수 있도록 최선을 다하겠다”고 밝혔다.

카카오는 예상하지 못한 상황이라고 해명했다. 양현서 카카오 부사장은 과학기술정보통신부와의 간담회에서 “화재 현장이라 직접 진입해 시스템을 수리하거나 장애를 개선할 수 있는 부분에 물리적 한계가 있었다”며 “데이터센터를 안양·송도 등 나눠 운영하고 최대한으로 리스크 시나리오를 세웠다고 생각했지만 화재는 예상할 수 없었다”고 말했다.

카카오는 빠른 수습을 위해 원인조사소위·재난대책소위·보상대책소위 등 3개 분과로 구성된 ‘비상대책위원회’를 출범시켰다. 유사한 사건이 재발하지 않도록 강도 높은 대책을 마련하고 외부 전문가들의 자문을 거쳐 본질적인 문제점을 개선할 계획이다.
SK C&C 데이터센터 복구 준비 모습. (사진=연합뉴스)
SK C&C 데이터센터 복구 준비 모습. (사진=연합뉴스)
자체 데이터센터 ‘제로’…서버 집중·DR 시스템 미비 ‘문제’다만 카카오의 해명에도 시스템에 허점이 있다는 비판이 이어진다. 같은 피해가 발생한 네이버와 비교되기 때문이다. 네이버는 이번 화재로 포털·쇼핑·시리즈온·파파고 등 4개 서비스에 오류가 발생했고 포털을 제외한 모든 서비스가 완전 복구된 상태다.

이에 △자체 데이터센터 ‘0개’ △한 장소에 몰린 서버 대수 △재해 복구(DR : Disaster Recovery) 시스템 미비 등이 문제로 꼽힌다.

데이터센터는 서버·네트워크·스토리지·네트워크 기기 등을 제공하는 통합 관리 시설로 데이터를 수집하고 운영하기 위한 핵심 인프라지만 현재 카카오가 보유한 자체 데이터센터는 없다. 판교·안양·송도 등에서 4개의 데이터센터를 이용하고 있고 SK C&C는 카카오가 아웃소싱 계약한 곳 가운데 하나다.

카카오의 첫 자체 데이터센터는 안산시에 짓고 있고 내년 완공 예정이지만 구체적인 일정은 미정이다. 둘째 데이터센터는 2024년 착공하며 4년 뒤인 2026년에야 완공될 것으로 보인다. 반면 네이버는 이미 2013년에 자체 데이터센터 ‘각 춘천’을 운영하고 있고 한국 최대 규모로 알려진 ‘각 세종’은 내년 상반기 완공될 예정이다.

서버 분산화가 제대로 이뤄지지 않은 것도 문제다. 네이버는 비교적 이른 시간에 서비스를 복구했는데 SK C&C 외에 다른 곳으로 서버를 분산 배치한 결과다.

카카오는 SK C&C에 약 3만2000대의 서버를 두고 있다. 카카오 측에서 전체 서버 대수를 공개하고 있지 않아 데이터센터당 서버 비율은 확인할 수 없지만 SK C&C를 ‘메인 데이터센터’라고 언급할 정도로 핵심 서버가 대량으로 입주돼 있다. 이에 서버 분산화 작업을 하지 않아 문제가 커졌다는 지적이 나온다.

문제는 분산화의 중요성을 카카오 역시 인지하고 있었다는 점이다. 2012년 4월 카카오톡 오류로 4시간 정도 서비스가 중단됐을 당시도 ‘데이터센터’가 원인으로 꼽혔다. 당시 카카오는 LG CNS 데이터센터에 서버를 두고 있었는데 전력 공급 장치에 문제가 생기면서 전체 서버가 다운됐다고 해명했다.

카카오는 ‘4월 말 봄날의 장애 발생에 대해 사과드립니다’라는 제하의 사과문을 통해 “대륙별로 초절전 데이터센터를 분산 가동해 안전을 도모하겠다”고 약속했다. 하지만 10년이 지난 현재도 같은 문제가 되풀이되고 있다.

기업 규모에 비해 ‘DR 시스템’을 강화하지 않았다는 점도 논란이다. DR 시스템은 외부의 공격, 환경적 변화 등으로부터 데이터센터를 보호하기 위한 ‘시나리오 훈련’으로, △별도의 데이터센터에 서버를 복제하거나 △비상 시 대응할 수 있는 우회 작업 △데이터 미러링 등이 DR 시스템의 종류로 언급된다. 기업은 비즈니스 연속성을 확보하고 빠르게 시스템을 복구하기 위해 DR 시스템을 강화할 필요가 있다.

카카오는 데이터센터와 관련한 모의 훈련도 하지 않았다고 인정했다. 홍은택 대표는 10월 19일 “트래픽을 안정적으로 유지할 수 있도록 하는 훈련은 했지만 데이터센터 셧다운과 관련한 모의 훈련은 그동안 하지 않았다”고 밝혔다.

업계에서는 DR 시스템 구축과 관련해 카카오의 대응에 아쉬움이 있다는 의견이 제기된다. 한 업계 관계자는 “DR 시스템은 반드시 필요하다”며 “어떤 상황이 생길지 모르기 때문에 그런 상황을 충분히 대응할 능력을 길러야 한다. 카카오가 재해 복구 시나리오에 더 신경 썼다면 좋았을 것”이라고 말했다.

다만 양현서 부사장은 “데이터는 분산 저장돼 있고 시스템도 이원화돼 있다”고 밝혔고 카카오 관계자 역시 “재해 복구 시 DR센터 역할을 할 수 있는 복수의 데이터센터가 있고 데이터센터 여러 곳에 분산 백업을 진행하고 있다”고 설명했다.
남궁훈 카카오 대표가 사퇴를 결정했다. (사진=한국경제신문)
남궁훈 카카오 대표가 사퇴를 결정했다. (사진=한국경제신문)
길어지는 오류에 짐 싸는 고객들…소상공인 피해까지이번 사태로 카카오의 독과점 문제까지 지적되고 있다. 카카오톡 월간 활성 이용자 수(MAU)는 지난해 4분기 기준 4704만 명이고 모바일 메신저 시장점유율은 90%에 달한다. 카카오모빌리티가 운영하는 카카오T 역시 택시 호출 시장점유율이 90%에 육박한다.

독과점 상황에서 오류 사태가 길어지자 사용자 불만이 가중됐고 일각에선 ‘탈카카오’ 현상도 나타나고 있다. 실제 애플리케이션(앱)·리테일 분석 업체 와이즈앱 조사 결과 이번 논란으로 카카오톡 국내 사용자 약 200만 명이 이탈한 것으로 나타났다. 10월 16일 카카오톡 사용자 수는 3905만 명으로 10월 14일(4112만 명) 대비 207만 명 감소했다.

사용자들은 라인·텔레그램·페이스북 등 서비스로 넘어갔다. 라인 사용자는 10월 14일 43만 명에서 10월 16일 128만 명으로 85만 명 증가했다. 같은 기간 텔레그램은 106만 명에서 128만 명으로 늘었다.

와이즈앱 측은 “카카오톡 오류가 주말 동안 지속되며 대체 서비스를 찾는 사용자가 많아졌다”며 “라인·텔레그램·페이스북 등 메시지 앱의 사용자 수가 급증한 것”이라고 분석했다.

여기에 소상공인 피해까지 발생했다. 소상공인연합회는 성명문을 통해 “카카오 서비스 장애로 인해 소상공인들의 피해가 커지고 있다”며 “자체 소통 창구를 구축할 여력이 없어 플랫폼에 의존해야 하는 소상공인 매장은 이번 사태로 피해를 봤다. 톡 채널 예약을 이용 중인 소상공인은 서비스가 마비돼 예약 내역 파악도 불가능했다”고 지적했다.

이어 “주말 매출 상승 시간대에 매장을 찾아 기프티콘으로 결제하려던 손님이 결제 불능으로 그냥 되돌아가거나 카카오맵을 연동하는 배달 대행사의 프로그램 먹통에 따른 배달 불가로 주문 취소 등의 직간접적인 피해가 발생했다”며 “현재까지 재개되지 않고 있는 서비스의 공백이 커지면 소상공인의 피해는 눈덩이처럼 불어날 것으로 예상된다. 조속한 정상화를 촉구한다”고 덧붙였다.

피해 범위가 커지면서 카카오는 피해 접수 창구를 마련하기 위해 나서고 있다. 비상대책위원회의 보상 대책 소위에서 진행 중이고 이번 장애로 피해를 경험한 이용자들과 파트너 등 모든 이해관계인들에 대한 보상 정책을 수립할 예정이다. 피해 신고 채널에서 접수된 내용을 기반으로 보상 대상과 범위 등에 대한 논의를 진행한다.

카카오 관계자는 “구체적인 시점은 정해지지 않았지만 이번 주 중으로 피해 구제 소통 채널을 마련할 예정”이라고 말했다.

여파는 이어질 것으로 보인다. 김범수 카카오 이사회 의장은 10월 24일 국회 과학기술정보방송통신위원회(과방위) 국정감사 증인으로 채택됐다. 과방위는 카카오 서비스 먹통 사태의 구체적 원인과 향후 대책 등에 대해 질의할 계획이다.

최수진 기자 jinny0618@hankyung.com