책 커버 표지
일경 모노즈쿠리_2019/10_제조(모노즈쿠리) 데이터 사이언티스트
  • 저자 : 日経BP社
  • 발행일 : 20191001
  • 페이지수/크기 : 154page/28cm

요약

Nikkei Monozukuri_2019.10. 특집 (1) (p37~61)

제조의 데이터 사이언티스트
그 실상과 육성 현장

IoT(Internet of Things)의 확산으로 획득할 수 있는 데이터의 종류가 폭넓게 되고, 수집할 수 있는 데이터 양도 방대해 졌다. 이러한 상황 속에 데이터를 기반으로 제조업이 안고 있는 과제를 해결할 수 있는 데이터 사이언티스트의 중요성이 높아지고 있다. 그러나 데이터를 기반으로 제조 현장을 바꿔 나가기 위해서는 단순한 수학적∙통계적인 분석 능력뿐만 아니라 현장 능력도 필요하다. ‘제조(모노즈쿠리) 데이터 사이언티스트’의 실상과 그 육성 현장을 살펴보겠다.

Part 1. 총론
현장의 기술자에게 데이터 과학을, 새로운 접근 방법의 주역 육성

빅데이터가 주목 받기 시작한 2010년대 초반, 한 베테랑 제조 기술자는 이렇게 단언했다. “제조 현장의 데이터는 안목이 있는 사람에게는 분석 따윈 하지 않아도 그 의미를 알 수 있다. 제조 현장을 잘 알지 못하는 데이터 사이언티스트는 필요 없다”. 시간을 들여 데이터를 분석한 결과가 대략 짐작했던 결과와 크게 다르지 않는다면 데이터 사이언티스트 따윈 필요 없다고 느낄 수도 있을 것이다.

하지만 그 이후부터 상황은 달라진다. 빅데이터의 배후에 있는 모델을 얻는 기술 중 하나로 기계학습이 급부상. 기계학습은 데이터에서 통계적 모델을 얻는 기술로써 이용할 수 있다. 데이터를 통해 지식을 얻는다는 의미에서 오늘날 데이터 사이언티스트와 AI 인재는 같은 카테고리의 인재로 인식되어 전세계 기업들이 쟁탈전을 펼치고 있는 상황이다.

기계학습 등 데이터 사이언스의 최첨단 분야에서는 새로운 알고리즘 개발이 하루가 다르게 진전되고 있다. 그 성과가 제조업에서 발휘되지 않는 것은 애석한 일이다. 제조 현장을 모르는 데이터 사이언티스트가 도움이 되지 않는다면 현장을 잘 아는 사람, 데이터를 보고 한 눈에 아는 사람이 데이터 사이언티스트가 되면 좋지 않을까? 그것이 바로 ‘제조(모노즈쿠리) 데이터 사이언티스트’이다.

-- ‘개(個)’의 데이터를 활용 가능하도록 --
“수 년 전과 비교할 때 데이터의 활용 상황이 바뀌었다”라고 덴소 생산기술부 Factory IoT실 데이터분석과 담당팀의 요시노(吉野) 차장은 지적한다. ‘계(系)보다는 개(個)’, 즉 공장 IoT의 경우, 공정 상태를 나타내는 데이터(계)보다 각각의 작업이 어떻게 이루어지고 있는지를 나타내는 데이터(개)로 중점이 전환되고 있다고 한다.

세밀한 데이터 취득 기술의 발전과 방대한 데이터(빅데이터)를 축적 및 처리하는 기술의 발전이 그 배경에 있다. 개별 작업, 개별 설비 등 ID(개체 식별 번호)에 연결된 데이터는 그 수가 방대해 질 뿐만 아니라 변수(특징량)의 종류도 방대해(고차원적) 진다. 사람이 직감적으로 파악할 수 있는 것은 최대 3~4차원 정도. 하지만 지금의 컴퓨터 기술이라면 방대한 수의 다차원 데이터를 고속으로 취급할 수 있다. 이를 통해 기존에는 수집할 수 없었던 지식을 데이터를 통해 얻을 수 있게 되었다.

이것은 이른바 ‘데이터 드리븐(Data Driven)’이라고 불리는 사고방식으로, 대량으로 관측된 데이터에서 지식을 귀납적으로 이끌어 내는 것을 말한다. 지금까지 축적해 온 이론을 통해 현상을 설명하는 것과는 전혀 다른 접근이다. 연구개발, 생산, 구매처에서의 제품 가동 관리 등 제조업의 각 분야에서 “기존의 한계를 극복하는 방법으로서 신선하게 받아들여지고 있는 것 같다”(미쓰비시케미컬홀딩스의 이소무라(磯村) 데이터 사이언티스트 겸 머티리얼ㆍ인포메틱스 CoE팀리더).

닛케이(日経) 모노즈쿠리가 올 8월에 실시한 ‘모노즈쿠리 데이터 사이언티스트’에 관한 설문조사에서도 전혀 새로운 지식 획득 및 성과를 데이터 사이언티스트에게 기대하는 의견이 많았다. ‘지금까지의 경험치를 뛰어넘는 것이 제조업의 데이터 사이언티스트에게 무엇보다 요구된다’, ‘데이터를 어떻게 활용할 것인지가 매우 중요하며 이것이 경쟁력을 좌우하게 될 것으로 예상된다’ 등의 의견이 있었다.

-- 과제 인식, 그 해결도 현장에 근거 --
모노즈쿠리 데이터 사이언티스트에게는 다양한 능력이 요구된다. 현장의 과제를 데이터 사이언스로 해결하는 프로세스를 살펴보겠다.

우선 제조 현장 업무의 과제를 추출하는 능력이 필요하다. 이 능력은 현장에서 활약하는 인재는 일반적으로 가지고 있지만, 데이터 사이언티스트의 소양도 더해 진다면 적용 대상으로 추출할 수 있는 과제의 종류 및 폭은 확대될 것이다. 그리고 데이터 사이언스를 바탕으로 과제를 표현하고, 어떤 데이터를 선택해 축적해야 하는지 등의 방향성을 결정하는 능력도 필요하다.

그 다음 요구되는 것은 데이터를 적절한 방법으로 분석하는 능력이다. 기초적 분석 방법 등을 올바르게 이해해 습득하고 있는 것이 바람직하다. 하지만 고도의 분석 방법이나 최신 기계학습 기술 등을 반드시 스스로 구사해야 할 필요가 있는 것은 아니다. 이러한 기술을 가진 사내∙외 전문가에게 의뢰할 수 있을 만큼의 지식만 있으면 충분하다고 할 수 있다.

이렇게 해서 얻은 분석 결과를 해석하는 능력도 필요하다. 데이터의 의미를 이해해 대응 방법을 결정하기 위해서는 제조 현장 업무 및 현장에서 일어나는 현상에 대한 통찰이 요구된다.

마지막으로 과제의 해결책을 현장 업무로서 실현하는 능력도 중요하다. 탁상 공론이 아닌 경영과 현장 사람들을 움직여 실제로 운용을 시작할 수 있어야 비로서 모노즈쿠리 데이터 사이언티스트의 존재 의미가 있다.

데이터 사이언티스트 협회는 2014년에 데이터 사이언티스트에 요구되는 스킬을 아래와 같이 정의했다. 크게 나눠 업무 지식에 바탕을 두고 과제를 인식 및 해결하는 ‘비즈니스 능력’과 데이터의 취득∙축적 가공 등을 구사할 수 있는 ‘데이터 엔지니어링 능력’, 적절한 분석이 가능한 ‘데이터 사이언스 능력’ 등 3가지이다.

제조업의 현장 업무에 관한 지식 및 기술은 대부분 ‘비즈니스 능력’으로 분류되고 있어 모노즈쿠리 데이터 사이언티스트는 3가지 중 비즈니스 능력을 특징으로 한 데이터 사이언티스트라고 말할 수 있다.

-- 현장 인재에 데이터 사이언스를 교육 --
모노즈쿠리 데이터 사이언티스트는 앞에서 살펴본 것처럼 현장의 모노즈쿠리의 실무에 관련된 사람부터 육성하는 것이 바람직하다.

NEC, 히타치제작소와 같은 대형 IT밴더는 대형 제조업이기도 하다. 2018년경부터 데이터 사이언티스트의 대량 육성을 추진하고 있다. 육성된 요원이 배치되는 곳은 본사의 데이터 사이언스 부문보다는 현장의 사업 부문이 더 많다. 그 사업 부문에는 공장이나 연구 개발의 현장도 포함된다.

최근 데이터 기술의 진보와 함께 저렴한 센서, 마이컴 보드, 클라우드 서비스 등이 갖춰지게 되면서 실제로 데이터를 가시화하거나 간단한 분석을 실시해 얻은 정보를 기반으로 과제를 해결하기까지 대략적인 과정을 실습하는 것이다.

학생을 대상으로 한 활동도 시작되고 있다. 시가(滋賀)대학 데이터 사이언스 학부와 다이하쓰공업은 2019년 5월부터 7월에 걸쳐 ‘시가대학 TNP 그랑프리’를 개최했다. 자동차를 주행시켜 데이터를 취득 및 분석해 가장 연비가 좋은 주행 방법을 가리는 수업으로, 1~3년생 29명이 참여. 무엇을 파라미터로 간주하는가, 과제의 분석 단계부터 주행 방법을 구사하기 까지를 실습했다.

앞으로 데이터 사이언티스트로서의 소양은 많은 기술자가 기본적인 스킬로서 갖춰나가야 할 것이다. 현재 데이터 사이언스에서의 데이터 드리븐으로 불리는 접근 방식은 이론을 쌓아 올리는 기존 설계 생산 기술자의 사고 방식과는 질적으로 다르기 때문에 특별히 공부해야 할 필요가 있다. 그렇기에 2가지 어프로치를 모두 사용할 수 있는 기술자가 강하다고 할 수 있다.

Part 2. 기업 사례


■ 덴소
‘개(個)’의 데이터가 경쟁력의 원천, 기초를 배우는 가이드북 배포

“지금까지는 ‘계(系)의 데이터를 취급해 왔으나, 앞으로는 ‘개(個)’의 데이터를 측정해 ‘계(系)’를 알게 되는 데이터 리터러시가 요구될 것이다”. 이렇게 말하는 것은 덴소 생산기술부 Factory IoT실 데이터해석과 담당차장기사인 요시노(吉野) 씨. 덴소에서 데이터 사이언스의 1인자이며 사내·사외에서 데이터 사이언티스트의 육성에 힘써 온 인물이다.

그가 말하는 데이터 리터러시는 ‘눈 앞의 데이터를 파악해 다음 분석 활동으로 연결시키는 능력’이다. 덴소에서는 빅데이터 및 IoT의 확산에 따라 기존의 SQC(통계적 품질관리)와는 전혀 다른 기술자용 데이터 사이언스 교육을 추진해 왔다. 현재, 더욱 한발 앞선 데이터 사이언스 교육을 시작하려 하고 있다.

그 포인트가 되는 것이 앞에서 말한 ‘개(個)’의 시점이다. 덴소에서는 2019년 11월부터 기술자용 스킬 업 연수에 이 시점을 도입해 나갈 계획이다. ‘ID가 있는 개(個)의 데이터는 무엇인가? 무엇을 위해 그런 데이터를 활용하는가? 어떻게 해석하는가? 와 같은 것을 가르쳐 나간다”(요시노 씨). 덴소의 ‘단도츠(최선두) 공장’의 동기(同期) 일관 라인의 실현에도 데이터 사이언스는 중요한 요소가 되고 있다.

-- 수비에서 공격의 데이터 활용으로 --
-- 개별 데이터 수집으로 발생되는 프레임 문제 --
-- 투토리얼(Tutorial) 실전으로 베이스 업 --


■ 미쓰비시(三菱)케미칼 홀딩스, 브리지스톤
복잡한 현상을 파헤쳐 신제품 개발의 한계를 타파

“당사 그룹의 연구 개발에 있어서는 시뮬레이션 계산의 레벨이 높아 지금까지 할 수 있는 것은 상당한 부분 실행해 왔다. 그럼에도 알지 못했던 것을 알게 된 점에서 데이터 사이언스에 신선함을 느끼는 사람이 많을 것이다”라고 말하는 것은 미쓰비시케미칼 HD의 디지털 트렌스포메이션 Gr 치프 컨설턴트인 이소무라(磯村) 씨. 그가 소속되어 있는 부서는 데이터 사이언스, 인공지능(AI)과 같은 최신 디지털 기술의 응용 보급을 통해 미쓰비시케미칼 HD 그룹 전체의 변혁을 추진하는 역할을 담당한다. 2017년 4월에 발족해 일본 국내에서도 유수의 데이터 사이언티스트가 모인다.

대기업 제조업체는 데이터 사이언스를 지금까지 없었던 신제품이나 새로운 서비스를 창출해 내는 수단으로 보고 있다. 기존이 개발 수법으로는 얻을 수 없는 지식을 얻을 수 있다고 기대하고 있다.

브리지스톤은 상급의 데이터 사이언티스트가 결집하는 디지털 솔루션 본부를 2017년 1월에 발족시켰다. ‘데이터 사이언스 및 AI를 사용해 새로운 솔루션 비즈니스에 공헌하는 것이 미션’(디지털 트렌스포메이션 솔루션 AI개발부장 하나즈카(花塚) 씨). 주력제품인 타이어의 데이터를 분석하는 알고리즘을 개발해 유저 대신 타이어를 관리하는 등 새로운 서비스를 뒷받침하는 역할이다.

-- 계산이 어려운 복잡한 계(系)를 취급 --
-- 계산 화학을 데이터 사이언스로 강화 --
-- 수리 타이밍을 데이터로부터 판단 --
-- 데이터 드리븐의 풍토를 양성 --
-- 한 사람 한 사람이 데이터의 발생원 --


■ NEC, 히타치(日立)제작소
현장용 교육 프로그램을 확충, IT 대기업이 대량 육성에 필사적인 이유

NEC는 2020년까지 데이터 사이언티스트를 포함한 AI인재를 1,000명으로 늘린다는 계획을 세우고 있다. 히타치제작소는 2021년도까지 그룹 전체에서 데이터 사이언티스트를 3,000명까지 늘린다고 한다. IT밴더로서 서비스를 제공하기 위해, 또는 제조 현장의 강화를 위해 사업 부문에 데이터 사이언티스트를 충분히 공급할 수 있도록 대량 육성으로 전환하고 있다.

-- 현장 부문에 데이터 사이언티스트 증가 --
그 데이터 사이언티스트에게 어떤 스킬을 요구하는 지는 양 사가 참여하고 있는 데이터 사이언티스트 협회의 정의에 나와 있다. 데이터를 취득∙분석하는 능력과 함께 데이터 사이언스의 적용 대상이 되는 비즈니스의 이해 및 현장의 사람들과의 커뮤니케이션 능력이 필요하게 된다. 협회는 스킬의 수준을 단계별로 분류하고 있으며 ‘견습 수준’의 어시스턴트 데이터 사이언티스트일지라도 육성하는데 3개월에서 1년이 걸리며 ‘자립 수준’의 어소시에이트 데이터 사이언티스트는 1~3년이 걸린다.

IT업계를 중심으로 특히 부족한 것은 ‘전문가 수준’의 데이터 사이언티스트이지만, 이 레벨의 인재를 ‘수백 명이나 회사 외부로부터 채용하는 것은 불가능’(NEC AI 아날리스틱 사업부 AI인재육성센터 센터장)하며 기본적으로는 내부에서 육성할 수 밖에 없다.

NEC그룹의 데이터 사이언티스트는 3~4년 전까지는 회사 전체의 횡단적인 조직에 많이 소속되어 있었으나, 최근에는 사업부문에서 늘어나고 있으며 앞으로도 사업부문에서 활약하는 데이터 사이언티스트 육성에 힘을 쏟을 방침이다.

-- 1년만에 자립 수준으로 --
-- 스킬 요건을 정해 육성 프로그램을 준비 --
-- 전문가의 커뮤니티 강화 --


Part 3. 육성 합숙
중소 공장에 ‘최초 1인’을, 사장을 설득할 수 있는 스킬이 목표

“입사 3년째부터 9년째 정도의, 공장 현장에 대해 상당히 잘 알고 있는 젊은 사원이 강좌 수강자의 이미지이다. 실제로 그와 비슷한 사람들이 모였다”(게이오기주쿠(慶應義塾)대학 환경정보학부교수 다나카(田中) 씨). 게기오기주쿠대학 SGC연구소 소셜 퍼블리케이션 랩은 해당 대학의 캠퍼스에서 ‘제1회 팩토리 사이언티스트 육성 강좌’를 2019년 8월 하순에 4박 5일간의 합숙 형식으로 실시했다. 수강자가 직장에서 안고 있는 문제점과 비슷한 테마를 설정해 그것에 따라 센서로 진동 등의 데이터를 취득해 표시·분석해 대응책을 검토하기까지의 일련의 작업을 체험한다는 내용이다.

강좌는 센서, 마이컴 보드, 3D 프린터, BI 툴, 클라우드 서비스 등을 사용한 실습을 포함한다. 목적은 툴의 사용방법의 습득뿐만 아니라, 작업을 통해 IoT의 도움이 되는 방법을 체감하는 것. 성과에 대해 프로젝트 추진 그룹의 한 명인 Roland Berger(도쿄)의 나가시마(長島) 대표 이사장은 “수강자는 모노즈쿠리의 비용을 낮추거나 품질을 향상시키는 등 경영에 직결하는 테마를 설정해 실습을 추진하고 있으며 경영자에게 제안할 수 있는 감각을 갖춘다”라고 설명한다.

-- 현장에 1명이라도 IoT를 다루는 인재가 있다면 --
-- 조형 중의 3D프린터로 진동 측정도 --


Part 4. 콜라보 수업
시가(滋賀)대학과 다이하쓰가 연대, 실제 자동차 데이터를 수집·분석·검증

시가대학 데이터 사이언스 학부와 다이하쓰공업은 2019년 5월에서 7월에 걸쳐 ‘시가대학 TNP 그랑프리’라는 콜라보(협업) 수업을 개최했다. 실제 자동차를 주행시켜 데이터를 취득 및 분석해 가장 연비가 좋은 주행 방식을 도출해 내 실제 주행에서의 연비를 경합하는 팀 대항전이다.

-- 무기질이 아닌 데이터를 학생에게 체험시킨다 --
“다이하쓰와의 콜라보 수업은 데이터 사이언스 학부의 학생이 사물에 관심을 갖길 바라는(가르치는 측의) 마음에서 시작되었다”라고 시가대학 데이터 사이언스 학부교수인 가와모토(河本) 씨는 말한다. 가와모토 씨는 오사카 가스정보통신부 비즈니스 아날리시스 센터 소장이며 일본을 대표하는 데이터 사이언티스트로 잘 알려져 있다. 2017년에 창설한지 얼마 한 된 시가대학 데이터 사이언스 학부의 교수에 취임한 것은 2018년 4월. 당시에는 인공지능(AI)과 IoT가 세계적으로 붐이었던 시기였다.

그러나 가와모토 씨는 AI나 IoT의 과도한 붐에 불안감을 느꼈다고 한다. “데이터를 받아서 분석하는 것만으로는 무기질 등 숫자 세계의 공부로 끝날 가능성이 높다. 그렇게 되면 비즈니스 세계에서 경쟁할 수 있는 사고력을 갖출 수 없다”(가와모토 씨).

특히 IoT는 “물건을 만지고 그것을 느끼며 그것을 이해할 필요가 있다. 데이터를 분석하기 전에 사물에 대한 감성을 연마해야 비로소 분석력이 살아난다”.

중요시한 것은 분석에 필요한 데이터의 수집에 스스로 관여하는 것이다. 이것은 데이터 사이언티스트의 중요한 역할이다. 가와모토 씨는 “데이터는 누군가에게 주는 것이 아니다. 자신이 계측해 수집하는 것이 기본이다”라고 강조한다.

그러나, 대학의 교육현장에서는 비즈니스로 이어지는 실제 데이터를 수집할 수 있는 기회가 거의 없다. 그런 고민을 오사카 가스 시절부터 알고 있던 다이하쓰의 파워트레인 제어개발부 유닛제어 개발실의 다이코(太古) 씨에게 털어놓자, “다이하쓰라면 자동차를 사용한 데이터 예측에 협력할 수 있다”라고 제안을 받았다.

-- 주행 플랜을 팀 별로 결정 --
콜라보 수업은 2019년 5월 16일부터 7월 25일까지 총 7회로 구성. 참가자로서는 통계해석 등을 자세히 배우지 못한 1~2년생을 중심으로 꼭 듣고 싶어하는 3년생을 포함해 총 29명이 모였다.  업에서는 데이터의 계측∙수집과, 데이터의 비교에 의한 연비로의 영향 요인을 추정하는데 중점을 두었다. 우선 강의실에서 자동차의 기본 구조 및 연비 메커니즘, 엑셀 및 브레이크 등이 연비에 미치는 영향 등을 이해한다.

또한, 저(低)연비를 실현하는 운전방법에 대해 가설을 세워 그것을 검증하기 위한 주행 플랜을 팀 별로 결정한다. ‘안전 제일’이라는 생각으로부터 주행 루트에서 어떤 위험이 일어날 수 있는지에 대해서도 사전에 검토했다.

-- 실전에서는 예상 밖의 정체 및 사건이 발생 --

 -- 끝 --

목차