데브옵스 알아가기(6) : 3Ways - 제3방법

Updated:

3Ways의 마지막 3원칙에 대해서 소개하는 글입니다. 이 글을 읽기 전에 다음의 글을 먼저 참고하여 보시기 바랍니다.

3rd WAY – The principles of Continual Learning and experimentation

세번째 방법은 “지속적인 학습과 실험 문화“를 생성하는 데 중점을 두는 원칙이다. 개인적으로 데브옵스의 원칙 중 가장 마음에 드는 부분이다.
IT조직에서 흔히 겪게 되는 안타까운 일 중 하나는 정보와 지식의 부족으로 누군가 삽질을 하게 될 때이다. 조직에는 소위 “청기와 장수” 정신으로 무장한 구성원들이 있기 마련이고, 이들은 자신들이 업무 진행 과정을 통해 획득한 지식은 오롯이 자신의 것이라고만 생각한다. 그러나 그러한 모습으로 되기까지 오직 자신의 힘과 노력으로만 성장해왔겠는가? 비록 당장 본인에게 도움을 구하는 바로 옆에 있는 사람은 아닐지라도 그동안 많은 선배들과 동료들이 쌓아 올린 빛나는 유산 위에서 도움을 얻고 지적 자양분을 취하며 성장해왔을 것이다.
조직은 암묵적 지식의 사유화를 막고 자신과 타인이 함께 성장할 수 있도록, 지적 생산 결과물이 팀과 조직 내 활용되는 것이 당연하게 여겨지는 문화와 환경을 조성해야 한다. 다음은 이러한 문화를 심기 위한 원칙들이다.

① 조직적 학습과 안전 문화를 활성화해야 한다

IT조직에서 “안전문화”란 무엇일까? 건설・제조 등의 산업 현장에서는 사고를 미연에 방지하는 안전 캠페인이 매우 중요한 활동이자 문화이다. 이러한 산업은 사고나 생명의 위협이 높기 때문에 안전에 대한 의식이 높으며, 위험 지역에 대해서는 강력한 통제 정책이 적용된다. IT에서도 업무와 연관된 사고 및 장애를 예방하기 위한 안전 문화 활동이 필요하다.
그러나 이 책에서 말하는 안전 문화라는 것은 강력한 통제와 억제보다는 “완벽한 예측이 불가능한 상황에서 사고 발생시 비난과 처벌은 지양하고, 재발방지를 위한 조치를 취하는 것”을 말한다. 이는 비난과 처벌에 대한 두려움 때문에, 개발자가 정보를 은닉하거나 소극적으로 행동하게 되는 것을 지양하는 것이다.
이 책에서 인용한 “비난하지 않으면 두려움을 제거할 수 있고, 두려움이 없어지면 정직해 질 수 있으며, 정직해지면 예방이 가능하다” (베타니 마크리)는 말처럼 무엇이든 정직하게 꺼내 놓을 수 있는 개방된 문화가 조직의 학습을 강화시킬 수 있으며 이러한 학습의 결과는 사고 발생과 장애를 예방할 수 있는 안전 문화로 이어지게 된다.
물론 이는 서로에 대한 신뢰가 바탕이 되어야 한다.

② 일상적인 업무의 개선을 제도화한다

저 유명한 열역학 제 2법칙에 따르면 자연적인 상태에서는 특별한 에너지가 공급되지 않으면 현 상태에서 이전 상태로의 복귀는 불가능하다. 다른 말로 자연 상태에서 시간이 지나면 엔트로피(무질서도)가 증가하게 되어 있다는 말로도 설명되기도 한다.
이 법칙은 거의 모든 자연 만물, 생명 현상 뿐 아니라 세상 현상에 적용되는 과학적 진리인데, 업무에 있어서도 마찬가지다. 특별한 에너지(=개선을 위한 활동)가 주어지지 않으면 동일한 상태가 유지되지 않고 피로도 누적과 누수에 의해서 정규화된 프로세스는 깨어지고 결과물의 질적 저하가 초래되기 마련이다. 엔트로피를 거슬러 이기기 위해서는 지속적인 개선이 필요하다. 책에서는 “일상업무의 개선은 일상 업무보다 훨씬 더 중요하다”고 말하며 기술부채의 청산, 결함수정, 리팩토링 등의 활동을 장려해야 한다고 이야기하고 있다.

③ 지역적인 발견을 조직 전체의 개선으로 전환한다.

과거 20~30년전만 하더라도 직장 생활을 시작하는 초년병에게는 선배의 노하우 전수가 매우 중요했었다. 선배들은 자신의 소중한 지식을 맘에 드는 후배, 또는 후배가 맘에 들 때에만 조금씩 조금씩 자신만의 내공을 전수해주었고 그 암묵지를 얻은다는 것은 일종의 상패 또는 전리품을 확보한 것처럼 여겨졌다. “라떼”같은 너무 오래전 이야기이다.
오늘날은 업무를 통해 알게 된 지식은 더 이상 내것의 전유물이 아닌 조직의 소유로 여겨지는 시대이다. 그럼에도 불구하고 지식 전달과 공유 체계에 있어서 모든 지식이 전체의 것으로 승화되지는 못하고 지역적 활용에 그치는 경우가 많다.
데브옵스 월드에서는 이러한 암묵적 지식이 조직 내 활용되도록 명시적이고 체계화된 지식으로 변환되도록 해야 한다.

④ 일상업무에 탄력성 패턴을 적용한다.

탄력성 패턴이란 스스로 안주하지 않도록 조직내 적절한 긴장을 유지하는 것이다. 예를 들어, 넷플릭스에서는 시스템에 카오스 몽키를 심어 인위적으로 프로세스를 Down시키곤 하였는데, 이는 개발팀이 장애 상황에서도 프로세스가 자동으로 복구되도록 하는 보다 안전한 시스템을 코딩하도록 만들었다.

※ 카오스 몽키(Chaos Monkey)란?
시스템이 격동의 예측치 못한 상황을 견딜 수 있도록 신뢰성을 쌓기 위해 운영 중인 소프트웨어 시스템에 실험을 하는 방법을 카오스 엔지니어링(chaos engineering)이라 한다. 넷플릭스에서는 프로덕션 환경에서 인스턴스를 임의로 종료시키는 프로그램을 카오스 몽키라 명명하였으며, 이를 통해 엔지니어가 인스턴스 장애에 탄력적으로 서비스를 구현할 수 있도록 하였다.


⑤ 리더가 학습 문화를 강화한다.

리더의 역할은 여러가지가 있겠지만, 특별히 학습 문화 측면에서는 팀이 일상업무에서 위대함을 창출하기 위한 조건을 만드는 것이다. 학습을 위한 조건이란 간단히 말해 노트, 연필같은 것을 주는 것만이 아니라 학습을 위한 목표 선정, 학습에 대한 장애물 인식 등 학습에 대한 성취 욕구를 장려하고 진행을 독려하는 것을 의미한다.

자고로 새로운 지식의 탄생은 기존 것에 대한 재고 및 찬성을 포함하여 비판하는 시각에 대해서도 열려 있을 때에 가능하다. 그렇게 되려면 무엇보다 내가 알고 있는 것, 가지고 있는 것을 전체가 접근 가능한 오픈된 공간이 필요하다.
오늘날 Digital Transformation이라는 새로운 혁명의 물결이 도래하게 된 것도 정보통신 기술의 발달 그 자체에도 있지만 학습된 기술과 지식을 나만의 것이 아닌, 모두의 것으로 개방하고 공유를 통해 더 나은 지혜로 발전시키고자 한, 선구자들의 노력과 열린 마음이 있었기에 가능한 게 아니었을까?

지속적 학습과 탐험을 위한 기술적 실천 방법

지속적 학습과 탐험의 원칙과 기술적 실천 방법의 차이는 별반 다를 것이 없다. 학습과 탐험을 환영하고 장려하는 원칙을 갖고 있는 조직이라면 특별히 회사의 시스템이나 기술적인 체계를 구비하지 않아도 저절로 돌아가게 될 것이다. 즉, 위에서 제시한 원칙들이 그대로 일상의 업무에서 실천이 되면, 선순환의 고리를 일으키며 학습은 더 나은 개선을 위한 학습으로 연결이 된다.
단, 학습 문화의 중요한 전제 조건 중 하나는, 사고에 대한 대응 체계에서 “공정하고 투명하게” 보여야 한다는 것이다.
사소한 오류도 발생하고 치명적인 사고도 발생했는데 각각을 어떻게 공정하게 다룰 수 있을까? 피해의 영향 범위에 따라 담당자에게 책임을 물리고 합당한 처벌을 내림이 공정하다는 것이 보편적 견해일 것이다. 그러나 책에서는 사고의 원인은 “썩은 사과”를 만들어낸 그 사람의 문제가 아니라, 썩은 사과가 생겨나게 한 배경에 보다 근원적 문제가 있다는 데에 촛점을 둔다. 즉 오래되고 지나치게 복잡한 시스템, 잘못된 설계 및 급박한 출시일자 등이 이유가 될 수 있다. 따라서 썩은 사과를 도려내는 것만이 해결책이 아니며, 해당 사건에서 조직은 무엇을 배울 수 있는지, 어떻게 하면 썩은 사과를 만들어내지 않을지 더 깊이 고민하고 탐구할 것을 제안한다.

비록 정답을 찾을 수는 없을지 몰라도 이 과정 속에서 조직은 원인과 결과에 대한 요인들을 학습하게 되며, 이전보다는 개선된 방향으로 나아갈 수 있게 될 것이다.

또한 누군가의 실수, 잘못을 공격하는 것이 아니기 때문에 사고의 발생 내용과 원인, 해결 과정을 투명하게 모두에게 공개할 수 있을 것이다. 사실 조직이 투명하게 공과를 공개한다는 것은 예기치 않은 상황에 대해서 내부적으로 감당하려고 하는 탄력적인 사고와 그 어떤 결과라도 탐험의 과정으로써 수용하려는 용기가 필요하다. 즉, 결과보다 과정을 중시하고 과정을 통해 무언가를 배울 수 있다는 신뢰와 실험 정신이야말로 지속적인 성장의 토대가 된다.

마지막으로, 조직은 학습과 개선을 위한 시간을 할당해야 한다. 이 부분에서의 학습은 특히 “기술부채”를 해결하기 위한 기술 학습을 의미한다. Digital Transformation이 화두가 되면서 이제는 많은 IT기업이 구성원의 역량 향상을 위해 정규 교육과 각종 학습 도구를 장려하고 있지만, 불과 얼마전까지만 하더라도 현재 운영하고 있는 업무와 별로 연관이 없는 신기술을 배우기 위해서는 큰 맘을 먹고 상사에게 허락을 구했어야 했던 시절이 있다. (필자도 그 중 하나다!) 또한 현재 하고 있는 운영업무에 분명히 개선해야 할 점이 보이는 데도 밀려오는 요청사항을 처리하다 보면, 도저히 업무 개선에 힘을 쓸 여력이 없어 기술부채는 점점 쌓이게 된다. 도요타는 카이젠 블리츠라는 조직을 만들어 프로세스를 지속적으로 개선하는 것을 주 업무로 하였다. 사실 제조공정에서는 높은 생산성, 불량률 감소를 위해 지속적 개선은 당연한 업무일 수 있다.

정리

3 Ways의 원칙에 대해 처음에 쓱 한번 보았을 때에는 내용이 어려웠는데, 이번에 포스팅 하면서 다시 정독을 하게 되니 새삼 심오한 철학이 느껴진다. 애석하게도 좋은 이론들은 현장에서는 환영받지 못한다. 아마도 원칙과 실천 사이에는 여전히 현실적 간극이 크기 때문이리라.
다행스럽게도? 데브옵스는 원칙에 충실하기 보다는 프랙티스 위주, 실행 위주의 방법들이 더 많이 알려지고 실현되고 있는 상황이다. 그러나, 이제 이러한 것들을 왜 하는지, 어떻게 해야 제대로 할 수 있는지에 대한 깊이 있는 고민과 자각이 없다면, 그 성찰 속에서 자신과 조직을 위한 원칙과 정책을 합의하고 지속적 개선을 위해 노력하지 않는다면 데브옵스 또한 그저 스쳐가는 단기적인 Trend에 불과하게 될 것이다.

SK 행복 경영론이 대두된지 올해로 벌써 2년째이다. 이제 행복은 당연히 누려야 하는 것, 내 자신과 모두의 행복을 위해서는 내가 먼저 그것을 찾기 위해 스스로 노력해야 하는 것임을 자연스럽게 받아들이고 있다. WLB도 더이상 눈치볼 필요가 없는 당연한 일상이 되었다. 데브옵스 실현과 정착 역시도 IT 운영/개발 구성원 모두의 변화 의지와 스폰서십이 꾸준히 지속된다면 자연스럽고 당연한 일상처럼 받아들여질 날이 오지 않을까 싶다.

이상으로 데브옵스 핸드북에 소개된 3Ways에 대한 글을 마친다.

본 블로그의 주된 내용은 다음을 참고하여 작성하였음을 밝힙니다.

< EOF >