책 커버 표지
일경비즈니스_2018/12/17_데이터 사이언스 최전선 (상)
  • 저자 : 日経BP社
  • 발행일 : 20181217
  • 페이지수/크기 : 114page/28cm

요약

Nikkei Business_2018.12.17 스페셜 리포트 요약 (p50~54)

데이터 사이언스 최전선 (상)
잠들어 있는 ‘데이터’를 ‘돈’으로

사내에 잠들어 있는 ‘데이터’를 분석해 업무에 유용하게 쓰이게 하는 ‘데이터 사이언스’가 각광을 받고 있다. 다만 무작정 데이터를 사용하는 것만으로 가치가 생기지는 않는다. 그렇다면 요체는 어디에 있을까? 최신 사례를 중심으로 데이터 사이언스의 활용법을 이번 호와 다음 호에서 소개한다.

“원피스 5벌은(도쿄 이케부쿠로(池袋)) 썬샤인시티 매장으로 보내 주세요” “스커트가 물류 창고로부터 3장 도착합니다”---. 여성에게 인기 있는 의류매장인 ‘어스뮤직앤에콜로지(earth, music and ecology)의 PC에는 본사로부터 매일 아침 이런 통지가 전송된다. 매장 안의 제고를 다른 매장으로 보내도록 지시하거나 새로운 상품이 물류 창고로부터 도착하는 것을 알리는 등의 내용이다.

재고가 부족할 것 같은 매장에는 미리 상품을 물류 창고로부터 배송해 놓으면 재고 부족으로 판매를 못하게 되는 일은 없다. 어느 매장에서는 생각보다 잘 팔리지 않는 상품이 다른 매장에서는 인기 상품인 경우도 있기 때문에 매장간의 상품 교류는 반드시 필요하다. EC(전자상거래) 사이트에 출품하는 상품의 확보에도 신경을 써야 한다.

어스뮤직앤에콜로지를 운영하는 스트라이프 인터내셔널은 그런 세심한 재고관리로 부족한 상품이나 팔고 남은 재고 등에 대응하고 있다. 그렇다면, 상품을 물류 창고나 매장, 또는 EC 사이트 간에 어떤 방식으로 로테이션 시키고 있는 것일까? 전국에서 290개 매장을 갖추고 있는 어스뮤직앤에콜로지의 경우에는 그 난이도가 더욱 높다. 이동하는 아이템 수는 하루에 1만점이 넘는다고 한다.

-- 이익률이 15% 상승 --
이런 방대하고 복잡한 처리를 해내는 것이 바로 데이터 사이언스이다. 스트라이프 인터내셔널이 개발한 프로그램은 각 매장의 판매 실적 및 재고량의 데이터를 수집해 과거의 판매 데이터 등을 가미하면서 매장마다 다음날의 판매량을 예측한다. 뿐만 아니라, 각 매장 및 EC 사이트에 상품의 이동을 지시하는 구조이다. 2018년 1월부터 시험 운용을 시작해 4월부터 각 매장에 도입하자 그 효과는 컸다. 어느 트렌치코트의 경우에는 잘 팔리는 매장에 재고를 집중시킴으로써 재고 할인 판매를 실시할 필요가 없어졌다고 한다. 이것으로 이익률이 15%나 상승했다.

개발을 주도하고 있는 스프라이프 인터내셔널의 야마자키(山崎) 디지털 트렌스포메이션 본부장은 “지금까지도 재고를 최적화하기 위해 물류 창고와 매장과 매장 간의 상품을 교환해 왔다. 그러나 계획을 세우는 것은 하루치 업무. 상품의 양과 매장이 많아 모든 재고를 세밀하게 관리하기에는 역부족이었다”라고 회상한다.

그러나 데이터 사이언스를 활용하고부터는 프로그램이 산출해 낸 원안을 머천다이저(MD)로 불리는 책임자가 최종 판단을 하기만 하면 된다. 사람 손을 거치지 않고 재고를 컨트롤하는 기술을 습득한 스트라이프 인터내셔널은 앞으로 어스뮤직앤에콜로지 이외의 브랜드 매장에도 개발한 프로그램을 전개할 계획이다.

모든 업무가 디지털 정보와 연결되어 있는 시대. 매일같이 생성되고 있는 방대한 양의 데이터를 잘 활용한다면, 비용 절감의 도구와 매출 증대의 재료로 이용할 수 있다. 스프라이프 인터내셔널의 사례가 그것을 말해 준다.

무엇보다, 데이터를 능숙하게 사용한다고 해도 전문적인 지식과 노하우가 필요하다. 그런 데이터 사이언스를 담당하는 것이 바로 데이터 사이언티스트라고 불리는 전문가이다. 스트라이프 인터내셔널에서도 3명의 데이터 사이언티스트가 프로그램을 개발했다고 한다.

그렇다면 데이터 사이언티스트는 어떤 역할을 하고 있는 것일까? 데이터 사이언티스트에게는 크게 3가지 능력이 요구된다고 한다. 사업을 제대로 이해한 다음, 어디에 과제가 있고 어떻게 데이터를 활용해야 해결될 지를 생각하는 ‘①비즈니스 능력’, 과제 해결에 필요한 데이터를 구체적으로 판별해 수집하는 프로세스를 시스템화하는 ‘②데이터 엔지니어링 능력’, 그리고 AI(인공지능) 및 예측 모델 등을 구사해 데이터를 해석하는 수단을 만들어 내는 ‘③데이터 사이언스 능력’이 그것이다.

일본에서는 앞에서 말한 3가지 요소를 모두 가진 인재는 거의 없다. 외부로부터 고용할 경우에도 3가지 요소 중에서 각 영역에 뛰어난 인재를 채용해 팀으로 과제를 해결하도록 하는 것이 현재의 대응 방법이다. 물론 단순히 데이터에 능숙한 전문가를 모아 놓는다고 해서 가치를 창출해 낸다고는 할 수 없다. “데이터 사이언티스트는 마법사가 아니다”라고 데이터 사이언티스트협회 이사인 시바타 아키라 씨는 강조한다.

그렇다면 업무 개선에 그들의 기술을 어떻게 활용하면 좋을까? 먼저, 필요한 것은 해결하고자 하는 과제를 확실히 하는 것이다. 스트라이프 인터내셔널에서도 ‘재고 관리를 철저히 해 결품이나 재고를 방지한다’는 과제를 명확하게 했다. 실제로는 현장의 종업원의 의견을 경청하면서 ‘비즈니스 능력’을 갖춘 데이터 사이언티스트가 과제를 축약한다.

또한 과제 해결을 위한 관련 데이터를 특정한다. “사내에 흘러 넘치는 데이터 중에서 목적에 맞는 데이터를 수집하는 것이 중요하다. 암암리에 데이터를 수집한다고 해도 의미가 없다”라고 시가(滋賀)대학 데이터 사이언스 학부의 가와모토(河本) 교수는 지적한다.

또한 실제로 데이터를 수집해 그것을 가공 및 분석함으로써 업무의 개선에 유용하게 쓰일 수 있는 프로그램을 구축해 나간다.

-- 50만 종류의 데이터 처리 --
스트라이프 인터내셔널의 각 점포에서 취급하는 상품 수는 1,600~1,700 종류에 달한다. 전국에서 전개하는 290개 점포를 감안하면 대략 50만 종류에 상응하는 데이터를 처리한다는 계산이 나온다.

그런 방대한 양의 데이터를 잘 가공해 과제를 해결할 수 있는 프로그램을 만들어 낸다. 이것이야말로 ‘데이터 엔지니어링 능력’과 ‘데이터 사이언스 능력’에 탁월한 데이터 사이언티스트의 실력이 발휘되는 부분이라고 할 수 있다.

지금부터는 스트라이프 인터내셔널 이외의 기업으로부터 데이터 사이언스의 활용법에 대해 알아보도록 하겠다.

쓰레기 소각 시설 등 다양한 플랜트 건설에 관련된 일을 하며 시설 운영도 함께 하는 JFE 엔지니어링. 당사는 플랜트의 긴급 정지의 예방으로 데이터를 활용했다. 지금까지는 현장의 엔지니어가 플랜트의 가동 데이터를 보면서 이변을 감지해 사전에 유지 보수를 실시, 긴급 정지를 방지하도록 해왔다는 JFE 엔지. 그러나 이상을 미리 예측할 수 있는 인재는 그리 많지 않다. 경험이 풍부한 일부 베테랑만이 알 수 있는 ‘장인의 기술’인 것이다.

그런 기술을 ‘장인’이 아닌 일반 엔지니어도 구사할 수 있는 구조로 만들겠다는 명제(命題)가 주어져, 2018년 4월에 발족된 것이 ‘AI∙빅데이터 활용추진부’이다. 추진부의 멤버는 처음에는 자사에서 운영하는 발전소에서 시도해 보는 것으로 했다. 우선은 현장의 엔지니어로부터 상황 설명을 듣는 조사부터 시행. 연료가 탈 때 발생하는 가스가 연소로의 일부를 막는 것이 긴급 정지의 원인이라는 것을 파악했다. 온도가 과다 상승되어 압력이 높아지거나 하기 때문에 긴급 정지가 되는 것이라고 한다.

현장에서도 이런 메커니즘은 알고 있지만, 고온의 연소로 안을 카메라로 감시하는 것은 불가능하다. 언제, 어느 타이밍으로 연소가스가 문제를 일으킬지에 관한 판단이야말로 지금까지는 ‘장인의 기술’이었던 것이다.

추진부는 과거에 긴급 정지한 경우의 온도 및 압력, 발전량 등의 데이터를 철저히 분석. 각각의 데이터로부터 일정한 법칙이 없는 지를 살펴보았다. 복수의 데이터를 조합해 통계 처리함으로써 수십 개의 분석 모델을 작성. 이상 시의 데이터를 투입해 결과를 보는 것을 반복했다.

그런 작업을 통해 이상 시에 크게 수치가 바뀌는 한 종류의 데이터가 있다는 사실을 알게 되었다. 그 데이터의 변화를 사전에 읽어낼 수 있다면 이상 정지의 조짐을 알아낼 수 있다. 해당 추진부의 오야마(小山) 부장은 “모델을 조정해 개선함으로써 시간으로 치면 긴급 정지가 발생하는 4일 전에 미리 감지할 수 있게 되었다”라며 뿌듯해 했다.

여기까지 사전에 미리 예후를 알 수 있다면 이상이 있는지 여부와 상관없이 실시하고 있는 정기 검사의 회수를 줄여 가동시간을 늘릴 수 있게 된다. 발전(發電)한 전력을 판매하고 있는 당사로서는 고객에게 약속한 전력을 보다 정확하게 공급할 수 있게 된다. 추진부는 향후에 다른 플랜트에서도 이번에 만들어 낸 ‘법칙’이 통용될 지를 검증함으로써 폭 넓은 현장에서 사용할 수 있도록 해나갈 방침이다.

JFE엔지의 시도와 같이 플랜트의 온도 및 압력과 같은 종류를 어느 정도 축약시킨 후, 가동 데이터를 분석함으로써 긴급 정지를 방지할 수 있었으나, 분석 대상의 데이터가 방대한 양일 경우에는 ‘목적에 맞는 데이터’를 특정하는 작업이 반드시 필요하다.

브리지스톤(Bridgestone)이 시도하는 것은 항공기용 타이어의 내구성 향상이다. 항공기용은 승용차의 타이어와는 달리, 표면이 마모되면 마모 부분을 벗겨내어 새로운 표면 부분의 타이어를 새로 붙여서 사용한다. 그것을 리트레드(재생)이라고 부르며 200회 정도의 이착륙 시에 표면 부분을 교환, 일반적으로 6회 정도를 새로 붙인다고 한다.

-- 제조 현장에서 히어링 --
리트레드에서 과제로 떠오른 것은 표면 부분과는 달리, 6회 연속으로 사용하게 되는 타이어의 중심 부분이다. “타이어 중심부는 교환 가능 회수까지 견디지 못하고 금이 가는 등으로 교환해야 하는 경우가 있다. 이것을 해결하고 싶었다”고 디지털솔루션본부 데이터솔루션개발부의 모리타(森田) 씨는 설명한다.

내구성 향성을 위해 제조 현장에서도 개선 활동을 이어갔으나, 발본적인 대책을 내놓기에는 역부족이었다. 이런 상황에서 주목한 것이 바로 데이터이다. 중심 부분을 사용하지 못하게 된 타이어의 데이터와 제조 시의 데이터를 대조함으로써 원인을 찾도록 했다.

대상이 될 수 있는 데이터 양은 방대하다. 타이어의 원재료에 관한 데이터는 물론이며, 제조 공장의 어느 라인에서 만들었는지, 온도 및 습도, 가동 시간, 제조 담당자 등 셀 수 없을 정도로 많았다.

모리타 씨 팀은 제조 현장의 엔지니어에게 도움을 요청했다. 제품을 지속적으로 품질 개선 하고 있는 담당자로부터 내구성이 낮은 제품이 발생하기 쉬운 경우의 원인을 타진함으로써 “수 종류까지 데이터를 압축시킬 수 있었다”(모리타 씨).

그렇게 축약한 데이터를 분석한 결과, 온도 및 습도와 같은 일정의 제조 조건이 겹쳤을 경우에 오류가 발생되기 쉽다는 것이 판명되었다. 원인을 알게 되면 제조 현장에서 대처할 수 있게 된다. 이 노하우를 항공기 이외의 광산용 등 초대형 트럭의 타이어 등에서도 채택하는 것을 검토하고 있다고 한다.

지금까지 소개한 JFE엔지 및 브리지스톤에서는 회사 오너의 방침으로 수백 명 규모의 데이터 사이언티스트의 확보를 내걸고 우수한 인재를 회사 내외로부터 불러들였다. 그러나 기업에 따라서는 그렇게 하는 것이 불가능한 경우도 있을 것이다. 그럴 때 유용하게 쓰이는 툴이 있다. 데이터 사이언티스트의 업무의 일부를 대행하는 로봇(전용 소프트웨어)이 그 주인공이다.

미쓰이스미토모(三井住友)카드의 사례를 참고하겠다. 당사는 전문적인 지식이 요구되는 데이터 사이언스의 능력을 ‘로봇’으로 보완해 일반적인 사원도 데이터 사이언티스트와 같이 업무를 수행할 수 있게 하고 있다.

-- 로봇이 예측하는 모델 만들기 --
미쓰이스미토모카드가 채택한 것은 미국 보스턴에 본사를 두고 있는 스타트업인 데이터로봇이 개발한 소프트웨어이다. 2016년 여름에 시험운행을 시작해 작년 4월부터 본격적으로 도입했다. 용도는 여신 및 마케팅 등 다양하지만, 도입으로부터 1년반만에 이미 큰 효과를 내고 있으며 기존 고객의 카드 이용을 활성화 시키거나 카드의 업그레이드를 권장하는 등, 고객 1명당 매출을 늘리는 활동이다.

“카드 회사의 숙명은 라이벌 회사와 비즈니스 모델이 똑같다는 것이다”. 이렇게 설명하는 것은 미쓰이스미토모카드의 총합마케팅부 그룹매니저인 시라이시(白石) 씨이다. 제공하고 있는 서비스가 다소 차이가 있다고 해도, 하고 있는 것은 개인용 금융 서비스이다. 타사와의 차이를 두기 위해서는 신규 고객에게 자사의 서비스를 알리는 것은 물론, 기존의 고객에게도 편리하게 사용할 수 있게 서비스 질을 높이는 것이 중요하다.

예를 들어, 카드의 업그레이드를 촉구하는 다이렉트 메일을 송부. 업그레이드에 관심이 있는 고객이라면 만족해 하지만, 그렇지 않은 고객에게는 성가시게 하거나 불쾌감을 갖게 할 수 있다. 이런 불쾌감을 미연에 방지하기 위해 미쓰이스미토모카드에서는 카드의 업그레이드에 관심을 가질 만한 고객을 예측해 개별적으로 메일을 전송하고 있다.

지금까지는 베테랑 직원이 ‘촉이나 직감’을 통해 해오던 일이다. ‘공항에서 카드를 자주 사용하는 사람이라면 라운지 서비스를 받을 수 있는 골드카드에 관심이 있을 것이다’ ‘고액 결재가 많으며 일시불 결재가 많은 사람이라면 카드의 업그레이드에 관심을 보일 것이다’ 등이다. 이와 같이 예측 가능한 범위 안에서 누구에게 전송할 지를 결정해야만 했다.

이것을 로봇으로 실행하면 단시간에 PDCA(계획∙실행∙평가∙개선) 사이클을 회전시킬 수 있다. 따라서 지금까지 사람에 의해 검토하려고 시도하지 못했던 ‘날씨’나 ‘카드 이용의 지역 및 시간’과 같은 바로미터를 예측 모델에 넣어 검증할 수 있다. 관련성이 높을 경우에는 예측 모델의 정밀도가 올라가 고객의 만족도가 높아짐으로써 결국에는 고객 한 명당 매출이 증가하는 것으로 이어졌다. 베테랑이 아니더라도 사용할 수 있다는 장점이 있다.

데이터 사이언스에 대한 니즈는 계속해서 증가세이다. 경제산업성에 따르면, “데이터 사이언티스트 등 고급 IT 인재는 2020년에 5만명이 부족하다”고 한다. NTT데이터가 데이터 사이언티스트 등 고급 인재에 연봉 3,000만엔을 지급한다는 인사제도를 발표하는 등, 인재를 둘러싼 쟁탈전은 더욱 심화되고 있다. 다음 호에서는 데이터 사이언티스트를 자사에서 육성하는 방법과 데이터 사이언스를 새로운 비즈니스로 연결시키는 활동에 대해 소개하겠다.

 -- 끝 --

목차