책 커버 표지
일경컴퓨터_2022/02/17(2)_​옵저버빌리티 (Observability) -- 시스템 모니터링의 새로운 사고방식
  • 저자 : 日経BP社
  • 발행일 : 20220217
  • 페이지수/크기 : 90page/28cm

요약

Nikkei Computer_2022.2.17 키워드 (p65)

옵저버빌리티 (Observability)

시스템 모니터링의 새로운 사고방식으로 주목

옵저버빌리티는 복잡한 시스템이나 어플리케이션의 상태 및 움직임의 전모를 실시간으로 파악할 수 있는 것, 또한 이를 위한 대응을 가리킨다. 일본어로는 관측 가능성이다.

최근 마이크로서비스 아키텍처(MSA), 컨테이너, 클라우드 등 새로운 기술을 이용한 서비스들이 보급되면서 시스템이 복잡해져 장애 시 비즈니스에 미치는 영향도 예전보다 추측하기 어려워지고 있다. 이러한 정보 시스템을 둘러싼 환경 변화에 따라 시스템 모니터링에 대한 새로운 사고방식으로 옵저버빌리티가 주목을 받고 있다.

기존에는 웹서버/애플리케이션 서버/데이터베이스라는 웹 3층 시스템을 채택하는 것이 주류였다. 구성이 단순하기 때문에 장애가 발생할 경우에도 원인 추측이나 특정이 비교적 용이했다. 기존의 모니터링은 상정한 범위 내의 장애에 대해 감시하고, 이상 시 경고를 발하는 구조이다.

그러나 최근에는 다수의 하부 시스템이나 컴퍼넌트를 조합해 1개의 서비스를 운용하는 케이스가 증가하고 있다. 대규모 시스템의 어느 곳에서 어떤 장애가 발생할지 상정할 수 없어 기존의 모니터링만으로는 장애에 대한 대응이 어려워지고 있었다. 이를 해결하기 위해 복잡한 시스템을 횡단적으로 보는 모니터링의 사고방식으로 옵저버빌리티가 탄생했다.

옵저버빌리티를 갖춘 시스템에서는 상정 범위 외의 장애도 예측하고, 시스템 전체가 어떻게 움직이고 있는지를 상세하게 파악한다. 즉, ‘무슨 일이 일어났는가?’를 아는 모니터링과 비교해, 옵저버빌리티는 ‘왜 일어났는가?’까지 파악할 수 있다는 차이가 있다.

-- 3종류의 데이터로 시스템 내부를 가시화 --
옵저버빌리티를 실현하기 위해서는 매트릭스, 로그, 트레이스라는 3종류의 데이터를 갖추어야 한다 .이 3종류의 데이터를 총칭해 텔레메트리(Telemetry)라고 부른다.

매트릭스는 정기적으로 수집한 측정치 집합이다. 기존에는 CPU의 사용률, 메모리의 사용량 등을 수집했지만, 최근에는 외형감시라고 불리는 리퀘스트에 대한 응답시간 등이 추가되었다. 로그는 특정 코드를 실행했을 때 생성되는 텍스트 데이터이다. 언제, 무엇을 했는지 등, 시스템 전체의 움직임을 확인할 수 있다.

트레이스는 독립된 컴퍼넌트 간의 데이터 송수신을 가시화한 것이다. 예를 들면 유저가 특정 웹 사이트에 접속하는 경우, 접속 요구가 어느 컴포넌트에 도착했는지, 어느 컴포넌트로부터 데이터를 모아 웹페이지의 화면을 생성하는지 등을 트레이스를 통해 파악할 수 있다. 정보시스템의 옵저버빌리티를 높이기 위해서는 각 컴포넌트에서 텔레메트리를 출력시키는 설계 및 구현이 필요하다.

최근 주요 기업들의 모니터링 툴에서는 각 컴포넌트로부터 집약한 텔레메트리를 차트 등에 정리한 대시보드를 갖추고 있다. 규모가 크고 복잡한 시스템도 상태를 일원적으로 관리할 수 있어 이상도 파악하기 쉽다. 또한 기존의 임계값을 이용한 알람 기능뿐 아니라, 기계학습을 이용해 시스템의 이상을 자동 검지하는 알람 기능도 갖추었다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

목차