책 커버 표지
일경컴퓨터_2022/05/26(1)_ML옵스(MLOps)로 AI를 육성
  • 저자 : 日経BP社
  • 발행일 : 20220526
  • 페이지수/크기 : 122page/28cm

요약

Nikkei Computer_2022.5.26 (p26~39)

ML옵스(MLOps)로 AI를 육성
실전 가동 후 정밀도 향상, 닛폰유센(日本郵船)의 모델 개량

기계학습(ML) 모델은 실제로 가동시킨 후에 정확도가 떨어지는 경우가 있다. 닛폰유센은 모델을 지속적으로 개량하는 ‘MLOps(ML옵스, Machine Learning Operations)’의 구조를 정비했다. 인공지능(AI)을 비즈니스에 활용하는데 있어서 MLOps는 필수다.

현재 DX(디지털 트랜스포메이션)에서 사용하는 핵심기술 중 하나가 된 것이 기계학습(ML) 모델이다. 닛폰유센은 연구개발 자회사인 MTI와 공동으로 항행 중의 선박 이상을 각종 센서의 정보들로부터 검지하는 ML 모델을 개발. 2020년 8월부터 약 200척의 컨테이너선 등에서 본격적으로 가동하고 있다. 실제로 일어난 기관 이상(異常)의 70% 이상에 대해 빠른 타이밍으로 경보를 내릴 수 있다고 한다.

닛폰유센의 야마다(山田) 대리 기관장은 “24시간 동안 감시를 할 수 없는 인간을 대신해 ML(머신러닝) 모델로 이상을 검지하도록 함으로써 지상 센터를 경유한 대상 선박으로의 통지는 연간 약 300건에 달해 안전 운항에 도움이 되고 있다”라고 말한다.

닛폰유센에서의 ML 모델 활용에 대한 특징은 모델의 실전 운용을 시작한 후에도 지속적으로 개량을 하고 있다는 점이다. 실제로 ML 모델을 실전에 도입했을 때, 이상(異常) 검지율은 더 낮았다.

MTI에서 선박물류기술그룹 기관솔루션팀 유닛장을 맡고 있는 프라요가 씨는 "운용을 시작한 시점에서는 실제 일어난 기관 이상 중에, ML 모델이 조기에 경보를 내릴 수 있었던 것은 약 50%였다"라고 말한다. ML 모델은 24시간 작업을 한다는 장점이 있다. 50%의 정밀도라도 업무에 도움이 된다고 판단했기 때문에 실전 도입을 단행했다.

실제 업무에서는 ML 모델이 이상을 간과하더라도 지상센터의 기관사가 찾아냄으로써 치명적인 문제가 되지 않도록 하고 있다. ML 모델은 선박에 부착한 각종 계기로부터 얻을 수 있는 배기가스의 온도나 연료 압력 등의 데이터에 관한 변동의 방법(행동)을 감시해, 그 이상(異常)을 ‘이상 스코어’로서 산출한다.

미리 설정한 임계치를 초과할 경우 지상 센터의 베테랑 기관사에게 통지한다. 기관사로서는 이상의 절반이라도 자동 검지할 수 있게 되면 그만큼 업무 부담이 줄어들게 된다.

실제로 ML 모델을 실전 도입한 후에는 기관사의 협력을 통해 정확도를 높이고 있다. 모델 추론 결과를 기관사가 체크하고 틀렸을 경우에는 올바른 결과를 학습 데이터로 만들어 재훈련한다. 이를 통해 지속적으로 모델을 개량해 약 70%의 정확도까지 높였다.

-- MLOps를 추진하는 기업이 증가 --
2021년경부터 DX 선진 기업들 사이에서 MLOps가 키워드로 급부상하고 있다. MLOps는 ‘실제 가동 후에도 ML 모델을 육성해 나가는 구조’이다. DevOps의 ML 모델판으로 모델의 개발·개량 프로세스를 자동화하는 CI(지속적 인테그레이션)/CD(지속적 딜리버리)를 포함한다.

서두에서 소개한 닛폰유센을 비롯해 MLOps를 추진하는 기업들이 늘어나고 있다. 예를 들어 야마토운수는 배송센터별 화물량을 예측하는 ML 모델을 개발해 2021년 1월부터 실전에 운용하고 있다.

운용 보수 단계에서도 지속적인 개량을 이어가고 있어, 매월 초에 버전을 업그레이드 하는 것뿐 아니라, 월 중에는 필요에 따라서 최신 데이터를 통한 재트레이닝을 실시해, 정밀도를 유지·향상시키고 있다.

미쓰비시(三菱)가스화학은 AI 스타트업 ABEJA와 협력해 화학 플랜트의 배관 촬영 화상을 기반으로, 표면의 부식 부분이나 부식 정도를 해석하는 모델을 개발. 2022년 1월부터 미쓰비시가스화학의 니가타(新潟)공장에서 실전 가동시키고 있다.

모델의 추론 결과를 베테랑 보수 담당자가 수시로 체크하고 오류가 있을 경우에는 올바른 학습 데이터를 작성해 재(再)트레이닝 함으로써 모델을 지속적으로 개량하고 있다. 그 외, 쿡패드나 야후 등 MLOps에 임하는 기업은 일일이 셀 수 없을 정도이다.

MLOps를 추진하는 기업은 모두 “ML 모델을 업무에서 활용하는데 있어서 필수적이다”(야마토운수의 나카바야시(中林) 집행임원 디지털전략 담당)라고 생각하고 있다. 왜냐하면 ML 모델의 상당수는 쓰다 보면 정확도가 떨어지기 때문이다.

정확도가 떨어지는 원인에는 여러 가지가 있지만, 상징적인 것은 코로나19 사태의 영향을 들 수 있다. 야마토운수의 나카바야시 집행임원은 “확진자 수의 증감에 따라 화물량이 크게 영향을 받는다. 정밀도 유지를 위해서는 모델의 지속적인 개량이 불가결하다”라고 말한다.

사소한 환경 변화도 정밀도를 떨어뜨리는 원인이 될 수 있다. 화상을 바탕으로 추론하는 모델일 경우는 ‘계절이 바뀌면서 창문으로부터 햇빛이 들어오는 방향이 달라졌다’, ‘제조 라인을 재편성했을 때 카메라의 화각이 미묘하게 어긋났다’와 같은 현상으로 정밀도가 떨어지는 것은 드물지 않다.

이처럼 ML 모델은 쓰다 보면 정확도가 떨어진다는 전제를 세우게 되면, 개발 단계에만 예산과 인력을 집중 투입해 ‘한번 만들면 그만’이라는 개발 스타일은 적합하지 않다. 힘을 쏟아야 할 것은 오히려 실전에 도입한 후의 모델 개량이다.

MLOps는 이를 위한 대처이다. 개발 단계뿐만 아니라, 운용 보수 단계에 대해서도 인원과 예산을 확보하고 모델을 실전 도입한 후에도 새로운 학습 데이터에 의해 재트레이닝하거나, 모델 구조를 결정하는 알고리즘 및 하이퍼파라미터를 변경해 지속적으로 개량해 나간다.

이를 위해서는 모델 개량 프로세스를 자동화하는 기능을 갖춘 ‘파이프라인’으로 불리는 기반이 필요하다. 파이프라인에 의해서, 모델의 정밀도 감시나 학습 데이터의 작성, 재트레이닝, 개량한 모델의 배치 등을 자동화함으로써, 엔지니어의 부담을 경감하면서 개량의 빈도를 높일 수 있다.

다음의 Part2에서는 MLOps의 선행 사례를, Part3에서는 MLOps를 실천하는데 있어서의 포인트를 제시한다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

목차