책 커버 표지
일경컴퓨터_2022/02/03(2)_MLOps(Machine Learning Operations)
  • 저자 : 日経BP社
  • 발행일 : 20220203
  • 페이지수/크기 : 106page/28cm

요약

Nikkei Computer_2022.2.3 키워드 (p77)

MLOps(Machine Learning Operations)
예측 모델의 개발과 운용을 통합한 기반 구축

MLOps란 기계학습의 예측 모델을 신속하게 개발하거나 실제 환경에서 높은 정확도의 예측 모델을 지속적으로 운용하기 위해, 예측 모델의 개발과 운용을 통합한 기반을 구축하는 것을 말한다. 애플리케이션 개발에서의 DevOps의 개념을 기계학습에 응용한 것이다.

“DevOps에서는 소프트웨어의 소스 코드를 관리하지만, MLOps에서는 소스 코드와 학습 데이터의 양쪽 모두를 관리한다는 점이 다르다”(DataRobot Japan의 오가와(小川) 데이터 사이언스 디렉터).

일반적으로 예측 모델의 개발은 ‘학습 데이터의 준비’ ‘모델의 구축’ ‘운용∙보수’의 3개 공정으로 대별된다. 예측 모델은 시간과 함께 예측 정확도가 떨어지기 때문에 ‘만들면 끝’이 아니라 개발을 끝내고 실전 환경에서 운용을 시작한 후에도 정기적으로 최신의 학습 데이터를 준비해 예측 모델을 다시 개발하는 재학습이 필요하다. 재학습에는 구축할 때 사용한 학습 데이터의 일부를 제외하거나 반대로 새로운 학습 데이터를 추가하기도 한다.

예측 모델을 적절하게 재학습시키기 위해서는 사용자가 사전에 ‘정확도가 0% 밑으로 떨어지면 모델을 재학습한다’는 등 임계치를 설정해 둘 필요가 있다. 운용 중인 예측 모델의 정확도를 계속적으로 감시하고, 임계치를 밑돌면 재학습시켜 재차 예측 정확도를 산출한다.

재학습을 시작하는 조건의 임계치를 높게 설정하면 예측 정확도가 높은 상태에서 모델을 계속 운용할 수 있지만 보수 비용이 높아진다. 그 때문에 예측 모델을 적용하는 업무의 요건을 숙지한 엔지니어와 협조해 필요 최저 한도의 정확도를 파악해 두는 것이 바람직하다.

예측 모델의 정확도가 저하되는 주된 요인은 예측 모델을 개발할 때 사용한 데이터의 경향과, 운용 중의 예측 모델이 취급하는 데이터의 경향이 바뀌는 ‘데이터 드리프트’다. 한편으로 예측 모델의 정확도가 떨어지면 재학습이 필요해지지만, 재학습에 사용하는 데이터의 질이 나쁘면 오히려 예측 모델의 정확도가 떨어질 가능성이 있다.

학습 데이터의 질을 확인하려면 실제로 데이터를 학습시켜 보고 정확도를 평가하는 것이 빠르다. 그 때문에라도 예측 모델의 MLOps 환경을 정비하는 의미는 크다.

-- 재학습을 자동으로 실행 --
예측 모델을 적절히 운용하는데 있어서 재학습이 담당하는 역할은 크다. 그러나 정기적으로 정확도를 감시해 필요에 따라서 재학습을 하게 되면 손이 많이 간다. 그래서 미국의 DataRobot은 기계학습 모델의 개발 지원 플랫폼 신판 ‘Data Robot AI Cloud’에 재학습을 자동화하는 기능을 구현했다. DataRobot은 이 신판 플랫폼을 21년 11월부터 일본에서 제공하고 있다.

운용 중의 예측 모델에서 유저가 설정한 정확도의 임계치를 밑돌면 자동으로 재학습을 시작해, 운용 중의 예측 모델과는 다른 예측 모델을 자동으로 구축한다. 유저는 운용 중의 예측 모델과 자동 생성된 새로운 예측 모델의 정확도를 비교해, 어느 쪽을 사용할지 선택하면 재학습이 완료되는 구조다. 기계학습에 충분한 지식이 없는 유저도 예측 모델의 개발∙운용을 쉽게 할 수 있는 환경이 갖추어지고 있다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

목차