책 커버 표지
일경시스템즈_2018/04_AI도입, 첫 한걸음
  • 저자 : 日経BP社
  • 발행일 : 20180326
  • 페이지수/크기 : 105page/28cm

요약

Nikkei Systems_2018.4 인사이트 요약 (p56~61)

AI도입, 첫 한걸음
무턱대고 높은 정밀도는 추구하지 않는다

AI를 사내업무나 신규 비즈니스에 도입하려는 유저기업이 증가하고 있다. AI를 활용하는 시스템을 개발하는 프로세스는 지금까지의 업무시스템과 다른 것인가? 구축 방법에는 어떤 것이 있는가? AI시스템을 실제로 구축한 유저나 AI시스템을 구축하는 IT기업에 대한 취재를 바탕으로 개발의 핵심을 살펴보자.

불량품의 검출, 수요예측, 매장의 도선(導線)분석, 고객대응의 대행 등 다양한 장면에서 AI를 도입하는 움직임이 활발해졌다. 특히, 기계학습 방법을 채용한 시스템을 개발하려는 시도가 눈에 띈다. AI시스템을 구축하는 IT기업에는 많은 문의가 쇄도하고 있는 상태다.

AI시스템의 컨설팅이나 AI시스템을 개발하는 Brainpad의 애널리틱스 서비스본부의 오타(太田) AI개발부장이 지적하듯이 시스템을 만들어 성과를 창출하는 기업은 아직 일부다. AI에 과도한 기대를 걸었다가 제대로 되지 않거나, 기존 업무시스템과 다른 개발 프로세스의 도중에 실패하는 경우가 적지 않다고 한다. 업무시스템을 개발하는 추진 방식과는 차이가 있다는 것을 확실하게 인식하고, 첫 한걸음을 내디딜 필요가 있다.

-- 6개의 스텝을 밟다 --
AI도입의 스텝은 크게 6개로 나뉜다. (1)테마설정, (2)데이터수집∙가공, (3)학습, (4)파일럿 적용, (5)시스템구축, (6)활용이다.

(1)테마설정은 업무시스템 개발에 종사하는 IT엔지니어라면 요건정의라고 생각하면 알기 쉽다. AI의 용도를 검토하거나 그 용도를 충족하기 위해 요구되는 효과를 KPI(핵심성과지표)로 설정한다.

업무시스템의 요건정의만큼 엄밀하지 않아도 상관없다. 왜냐하면 AI를 활용하는 시스템에서는 PoC(개념검증)를 실시하여 용도에 필요한 정밀도가 충분히 나오는지 여부를 확인하고 나서 본격적으로 개발하기 때문이다. 그러나 ‘스코프는 지나치게 넓히지 않는 편이 좋다”(브레인패드의 오타 씨)라고 말한다. 예를 들면 모든 불량품을 검출하는 AI시스템을 만들 경우, 불량 종류를 AI에 학습시키기 위한 교사데이터를 작성하는 것이 어려워지기 때문이다. Tecnos Data Science Engineering(TDSE)의 쇼지(庄司) 운영책임자는 “무턱대고 높은 정밀도를 요구하며 KPI를 설정하는 것은 좋지 않다”라고 지적하며 KPI의 설정에도 주의해야 한다고 말한다.

(2)데이터수집∙가공에서는 필요한 데이터를 수집하거나 교사데이터를 작성하거나 한다. 교사데이터의 작성은 데이터의 ‘특징’을 AI가 쉽게 이해할 수 있도록 데이터에 어노테이션(태그정보)을 설정하는 작업이다.

(3)학습은 기계학습을 위한 환경을 정비하여 기계학습 모델을 작성하는 스텝이다. 모델 작성에서는 회귀분석, 뉴럴 네트워크와 같은 통계해석의 알고리즘을 선택하여 코딩하는 작업이 동반된다. 또한 작성한 모델의 정밀도를 높이기 위해 파라미터를 조정하는 튜닝작업이 발생한다. 기계학습 모델을 내장한 경험이 있는 IT엔지니어는 많지 않다. 허들이 높은 단계라고 할 수 있다.

모델을 작성했다면 (4)파일럿 적용 스텝을 밟는다. 작성한 모델이 실제 업무에 유효한지 어떤지 실제 환경에서 사용되는 데이터를 이용하여 검증한다.

(5)시스템구축은 지금까지의 업무시스템 개발에 해당한다. 이 스텝에서 주의하고 싶은 것은 재학습이 용이한 구조를 실장하는 것이다. 브레인패드의 오타 씨는 “AI를 활용하는 시스템은 한번 만든 후에 같은 결과를 계속 유지한다는 보장은 없다. 정밀도가 떨어지는 경우도 있다”라고 말한다. 분석대상 데이터의 ‘특징’이 바뀌는 경우가 있기 때문이다. 정밀도를 모니터링하여 정기적으로 모델을 재학습시키기 위한 구조를 실장해 둔다.

(6)활용은 문자 그대로 업무에서 활용하는 것과 동시에 시스템구축 스텝에서 실장한 구조를 사용하여 정기적으로 재학습한다.

여기부터는 선행 유저가 첫 한걸음을 내디뎠을 때의 시행착오나 아이디어를 보고, 도입할 때의 중요한 요소를 찾자. 또한, 최근에는 AI시스템의 구축을 지원하는 클라우드 서비스의 폭이 확대되고 있다. 그들의 특징도 살펴보자.

● 부담 없이 시험할 수 있는 AI기반을 자작(自作): Retty
미식가사이트 ‘Retty’를 운영하는 Retty는 2016년부터 기계학습을 활용하는 시스템 개발에 주력하고 있다. 처음에 만든 것은 미식가사이트의 유저가 투고한 사진데이터에 이미지인식 AI를 적용하여 요리, 매장외관, 매장내관, 메뉴의 4종류로 자동 분류하는 시스템이다. 외주를 줬던 작업을 자동화함으로써 비용 삭감으로 이어졌다. 그 후에도 거의 매월 1건의 페이스로 업무개선에 도움이 되는 AI시스템을 개발하였다.

또한 2017년 12월에는 ‘맛있어 보이는 사진’이라는 감성적인 데이터를 AI로 자동 추출하는 시스템을 개발하였다. Retty의 사이트에서 매장정보를 열람한 유저가 사진을 볼 수 있도록 하여 게재한 매장으로 방문을 유도하는 목적이다. 다루이시(樽石) CTO는 “AI에 관한 지식을 축적하여 수익으로 이어지는 시스템을 개발할 수 있게 되었다”라고 말한다.

지금은 AI를 적재적소에 활용하는 Retty도 “처음에는 기계학습, 특히 심층학습이 어떤 용도에 효과적인지 알지 못했다”(다루이시 CTO). AI활용의 최초 스텝인 (1)테마설정에서 고민했었다.

효과적인 테마를 설정하기 위해서는 심층학습에 대한 이해를 깊게 할 필요가 있다. 그를 위해서는 IT엔지니어가 스스럼없이 시행착오를 할 수 있는 환경을 정비할 필요가 있었다. 그래서 학습환경의 정비에 대해 많은 연구를 하였다.

학습환경의 정비에 대해서는 하드웨어에서 직접 선택하여 기반을 구축하였다. 미식가사이트 본체는 서비스 기반에 퍼블릭 클라우드를 채용하고 있으며, AI의 학습환경을 정비할 때도 퍼블릭 클라우드는 후보로 올랐지만 보류하였다.

심층학습에 GPU(Graphic Processing Unit)를 탑재한 머신을 사용하는 일이 많다. 그러나 클라우드가 제공하는 GPU의 가상머신의 이용요금은 다소 비싼 편이다. 요금이 비싸면 사내의 IT엔지니어가 부담 없이 시행착오를 하기 어렵다.

그래서 미국의 NVIDIA의 GPU를 탑재한 머신을 조달하여 클러스터 구성으로 한 후에 컨테이너형 가상머신을 가동. 용도에 맞게 유연하게 GPU 등의 자원을 확장하기 쉬운 기반을 구축하였다. 기계학습 프레임워크에는 구글의 ‘TensorFlow’나 Preferred Networks의 ‘Chainer’를 채용하였다.

기반 구축 비용은 50만엔 정도. AI에 의한 자동화로 삭감한 외주비로 구축 비용을 바로 회수할 수 있었다고 한다.

● KPI의 연구로 AI개발 추진: 도쿄전력 파워그리드
위에서 살펴본 바와 같이 Retty는 스텝(1)의 테마설정의 용도검토에서 많은 아이디어를 짜냈다. 한편, 송변전설비의 운용을 전개하는 도쿄전력 파워그리드는 학습모델의 정밀도를 좌우하는 KPI의 설정에 관한 아이디어가 빛난다.

도쿄전력 파워그리드의 이상을 심층학습으로 검출하는 시스템을 TDSE와 공동으로 개발하였다. 2018년 4월에 가동시킨다.

심층학습의 대상으로 한 작업은 헬리콥터 등에서 촬영한 동영상 데이터를 기반으로 경미한 손상이나 이물질의 부착과 같은 이상을 발견해내는 것이다. 숙련된 작업자가 동영상을 10분의 1의 속도로 슬로우 재생하여 연간 약 1,330시간(2016년도 실적)을 들여 실시하였다.

이상을 간과하면 장기적으로는 사고로 이어지는 내용인 만큼, 가령 사람이 하는 작업을 모두 대체하려고 하면 높은 정밀도를 요구하고 싶어진다.

그러나 도쿄전력 파워그리드의 사카모토(坂本) 과장은 그렇게 생각하지 않았다. 이상을 발견하는 작업 시간의 대부분은 정상적인 곳을 보고 있는 시간이다. 다소 정밀도가 떨어져도 정상적인 곳을 보는 시간을 크게 단축할 수 있다면 이용가치가 있다고 판단한 것이다.

-- 업무시간 삭감을 KPI에 설정 --
그래서 사카모토 씨는 “처음에는 업무시간의 50% 감소, 장기적으로는 80% 감소”라는 비즈니스 상의 효과를 바탕으로 한 KPI를 설정하였다. 이 KPI라면 학습 스텝에서 무턱대고 높은 정밀도를 추구하는 실수를 회피할 수 있다. 목적과 대조하여, 이상한 점을 간과하는 실수를 5% 이내로 한다는 목표를 설정하였다. 한편, 정상적인 송전선을 이상으로 진단하는 오판은 어느 정도 허용하였다. “오판을 체크하는데 다소 사람의 수고를 들이더라도 충분한 업무시간의 단축 효과를 얻을 수 있다”(사카모토 씨).

시스템 기반은 TDSE의 제안을 채용하여, 마이크로소프트의 ‘Microsoft Azure’에 구축하였다. 가상머신 서비스 ‘Azure Virtual Machines’과 기계학습 프레임워크 등을 조합하여 실현하고 있다.

Azure라면 기계학습 환경을 제공하는 클라우드 서비스 ‘Azure Machine Learning(Azure ML)’을 이용하는 방법 등도 생각되었지만 보류하였다. TDSE의 쇼지 운영책임자는 주로 2개의 이유를 든다.

하나는, 기반의 투명성을 가능한 확보하고 싶었기 때문이다. 다른 하나는 비용이다. “이번 구성이 Azure ML을 이용하는 것보다 싸게 든다”(TDSE의 쇼지 씨). GPU를 탑재한 가상머신은 비용이 들지만, Azure의 배치(Batch) 실행서비스에서 기계학습을 실시할 때만 가동하도록 설계하는 등의 아이디어로 비용을 억제하였다고 한다.

● 모델 작성에 드는 수고를 툴로 해소: 미쓰이·스미토모카드
AI활용에 있어서 큰 과제가 되기 쉬운 것이 (3)학습 스텝이다. 특히 모델 작성에서 적절한 알고리즘을 선택하여 정밀도를 확인하는 작업에 전문지식이 요구된다. 미쓰이·스미토모카드는 이 과제를 툴로 채용하여 해소하였다.

미쓰이·스미토모카드는 2017년 4월부터 회원고객에 대한 판촉 활동 등에 AI를 활용하고 있다. 예를 들면 지금까지의 카드 이용실적이나 웹사이트에 대한 액세스 이력 등을 바탕으로, 골드카드로 바꿀 가능성이 높은 회원고객 모델을 작성. 안내 다이렉트 메일을 송부하는 등의 방식이다.

미쓰이스·미토모카드에서는 이전부터 여신관리나 판촉 부문에서 분석 알고리즘에 대해 잘 아는 사원이 SAS Institute Japan의 BI(비즈니스 인텔리전스) 툴 ‘SAS’를 사용하여 데이터 분석을 했었다. 그러나 판촉을 예로 들면 업무를 이해하고 최적의 분석 모델을 설계할 수 있는 인재가 한정적이기 때문에 각 부서로부터의 작업 의뢰가 집중되어 의뢰에 회답하기까지 시간이 걸렸다. 또한, 정밀도가 높은 모델을 사람이 작성하는데 1년이 걸리는 일도 있어, 여신관리 이외에서는 다루기 어려웠다.

-- 학습 작업을 툴이 자동화 --

● 선택의 폭이 넓어지다: AI용 클라우드 서비스
지금까지 살펴본 3사는 자력으로 혹은 IT기업과 공동으로 자사 전용의 기계학습의 학습 환경을 준비하여 모델을 작성하고 있다. 한편으로 기계학습 환경의 정비나 모델 작성 등의 작업을 위탁할 수 있는 클라우드 서비스가 늘고 있다. 미국 아마존닷컴, 구글, 마이크로소프트와 같은 거대 클라우드 기업이 제공하고 있다. 또한 ‘ABEJA Insight’ 등을 전개하는 ABEJA와 같은 벤처기업의 서비스도 있다. 목적에 맞는 서비스를 선택하면 모든 것을 제작하는 것보다도 부담 없이 AI시스템을 만들기 쉽다.

클라우드 서비스는 유저가 위탁할 수 있는 작업의 범위에 따라 크게 ‘학습이 끝난 클라우드 AI’ ‘기계학습기반 클라우드’ ‘중간형’의 3종류로 분류할 수 있다.

학습이 끝난 클라우드 AI는 클라우드 기업이 범용적인 기계학습 모델을 API로 제공하는 서비스다. 유저기업은 교사데이터의 작성, 모델 작성, 기계학습의 환경정비와 같은 수고를 줄이고 AI를 활용한 시스템을 개발할 수 있다. ABEJA의 오카다(岡田) 대표는 “기계학습에 정통한 엔지니어를 확보하기 어려운 유저에 적합하다”라고 말한다.

이미지인식 학습이 끝난 클라우드 AI를 예로 들면, 유저가 입력한 사진데이터에 어떤 사물이 비치고 있는지를 인식하거나 이미지 내의 인원수를 셀 수도 있다.

유통업에서는 방문고객의 속성 정보를 파악하는 등의 목적으로 학습이 끝난 클라우드 AI를 활용하는 기업이 나왔다. PARCO는 도쿄에 있는 매장 ‘PARCO_ya’에 ABEJA Insight를 채용. 각 임차인의 방문객수나 방문고객의 속성(연령, 성별)의 데이터를 취득하여 임차인에게 매장 개량 제안 등을 할 때 활용하고 있다.

학습이 끝난 클라우드 AI는 일반적인 공개 데이터로 학습시킨 범용적인 서비스가 많다. 특정 유저기업의 업무에 특화된 내용에는 그다지 적합하지 않다. 이미지인식을 예로 들면, 어느 기업이 자사에서만 보유하는 피사체 등은 인식하지 못한다.

학습이 끝난 클라우드 AI의 기능에서 요건을 충족시키지 못하는 경우는 다른 서비스가 선택지가 된다. 후보의 하나인 기계학습기반 클라우드는 기계학습의 학습환경을 제공한다. 학습환경을 구축하기 위해 서버 환경을 구축∙운용하는 수고를 줄일 수 있다.

한편, 교사데이터의 작성이나 모델 작성 등은 자사 내에서 실시한다. 많은 유저가 이용하는 알고리즘을 적용한 표준모델을 준비하는 서비스도 있다. 그러나 기본적으로는 기계학습에 관한 전문 지식이 필요해진다.

-- 모델을 자동 작성하는 클라우드 --

  -- 끝 --

목차