IT 운영을 위한 인공지능
AIOps는 정보시스템의 운용에 AI(인공지능)를 활용하는 방법을 가리킨다. 복수의 데이터 소스에 대해, 기계학습이나 자연언어 처리 기술, 분석 알고리즘 등을 적용한다. 시스템 장애나 멀웨어 감염 등의 이상을 감지하고, 즉시 관리자에게 통지하거나 자동 대응함으로써 시스템 운용의 효율이나 민첩성을 높인다.
AIOps는 기존의 시스템 운용 관리 툴 등과 AI를 조합한다. 데이터 소스는 네트워크, 서버, OS, 미들웨어, 애플리케이션 등 다양한 레이어가 대상이다. 우선 시스템을 감시하고, 로그나 CPU 사용률을 관리한다.
장애나 그 징후를 검출하면, 장애의 원인 및 긴급 정도를 분석한다. 필요에 따라서 담당자에게 경계 메일을 보내거나, 로그의 채취와 같은 일차 대응을 자동으로 처리한다. AI가 과거의 유사 사태 등을 바탕으로 장해 복구 방법을 검토해서, 운용 담당자에게 추천한다.
기존에는 사람이 아니면 어려웠던 작업도 AI가 지원한다. 예를 들면, 사전에 설정한 임계치의 범위 내라도, 움직임이 통상과 다르면 장해의 전조라고 판정한다. 평상시에는 가동 상황의 분석 리포트를 월차나 주차로 자동 작성한다.
|