일본산업뉴스요약

[머티리얼즈 인포매틱스] 재료 개발의 고속화에 불가결한 ‘DMP’ -- 대형 화학제조사들 정비 서둘러
  • 카테고리화학/ 신소재/ 환경·에너지
  • 기사일자 2022.6.24
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2022-07-04 21:09:16
  • 조회수412

Nikkei X-TECH_2022.6.24

제조업 DX의 유력 주자, 머티리얼즈 인포매틱스
재료 개발의 고속화에 불가결한 ‘DMP’
대형 화학제조사들 정비 서둘러

머티리얼즈 인포매틱스(Materials Informatics, MI)를 추진하는 일본의 대형 화학제조사들이 MI용 데이터 매니지먼트 플랫폼(DMP) 정비를 서두르고 있다. MI용 DMP란 사내에서 실시한 실험 데이터 등을 기계학습 모델 개발에 활용할 수 있는 형태로 저장·축적하는 소프트웨어 플랫폼을 말한다.

인공지능(AI)을 활용해 재료 개발 효율을 높이는 MI의 성패는 정밀도가 높은 기계학습 모델을 개발할 수 있느냐에 달려 있다. 기계학습 모델 개발에는 교사 데이터로 활용하기 위한 대량의 실험 데이터가 필요하다. 하지만 본 특집 제1회에서 살펴본 바와 같이 많은 일본 제조사들은 지금까지 실험 데이터를 별로 축적해오지 않았다.

이에 현재 MI를 추진하는 일본의 제조업체들은 DMP 정비를 서두르고 있다. DMP를 정보시스템적인 관점에서 설명하면, 실험결과 등 수치화된 데이터를 축적하는 데이터베이스(DB)와 논문이나 실험노트 등 비정형 데이터를 축적해 검색이 가능하도록 한 검색엔진을 조합한 시스템이다.

예를 들면, 아사히카세이(旭化成)는 과거의 실험 데이터와 함께 사내·사외로부터 수집한 논문, 특허문서, 제품 카탈로그와 같은 기술문서, 과거의 실험노트 등을 DMP에 축적해 필요에 따라 검색, 추출할 수 있도록 하고 있다.

또한 아사히카세이는 DMP에 축적한 실험 데이터를 사용해 기계학습 모델 개발을 위한 툴인 'IFX-Hub'도 정비. 사내 연구자가 웹 브라우저 등을 사용해 AI로 재료 후보군을 좁히는 등을 실행할 수 있도록 하고 있다.

-- 사람이 읽는 실험 노트를 구조화된 데이터로 --
물론 실험 데이터를 단지 축적하는 것만으로는 기계학습 모델 개발 등에 활용할 수 없다. 컴퓨터가 실험 내용을 이해할 수 있도록 구조화해 축적할 필요가 있다.

양자컴퓨터를 사용한 화학 실험 시뮬레이션 방법과 MI용 DMP 등을 개발하는 스타트업 기업, QunaSys의 마쓰오카(松岡) COO(최고집행책임자)는 실험 데이터의 구조화를 “요리의 레시피를 컴퓨터가 이해할 수 있도록 변환하는 것과 같다”라고 비유한다.

일본 제조사들의 연구진은 지금까지 실험 절차 및 그 결과를 실험노트에 기록해 왔다. 사람이 읽을 것을 상정해 기술된 실험노트는 말하자면 요리 레시피와 같은 것이다. 이것을 컴퓨터가 이해할 수 있도록 작업의 순서를 분해하거나 재료의 명칭 및 단위를 통일한 다음 표 형식의 데이터로 정리해 줄 필요가 있다.

지금까지는 같은 기업 내에서도 부서 등에 따라 실험에서 사용하는 물질의 호칭이 다르거나 사용하는 단위가 달랐다. 아사히카세이가 구축한 DMP는 이러한 양식이나 용어의 차이를 변환·흡수하는 사전 기능 등도 갖추고 있다.

데이터를 구조화할 때 MI 분야에서는 '기술자(記述子)'라고 불리는 기계학습 모델의 특징량을 의식할 필요가 있다. 일본제온의 다카하시(高橋) 디지털연구개발추진실장은 “MI를 추진해나갈 때 새로운 특징량 및 ‘기술자’가 계속해서 필요해진다. 축적되는 데이터의 구조는 항상 수정할 필요가 있으며, 이러한 작업은 기술자에 대한 지식을 가진 현장의 연구진이 진행할 수 밖에 없다”라고 말한다. DMP는 한번 정비하면 끝나는 것이 아니라 데이터 구조 등을 항상 개선하고 유지보수를 할 필요가 있는 것이다.

-- 실험 노트를 웹 어플리케이션으로 전환 --
AGC가 개발한 MI용 DMP인 ARDIS는 연구자가 실험 데이터 입력에 사용하는 웹 기반의 사용자 인터페이스(UI)인 ‘전자실험 노트 기능’을 가지고 있다. AGC가 사내에서 실시하는 다양한 종류의 실험에 대응할 수 있도록 이 웹 어플리케이션을 사내에서 제작했다.

실험에서 사용하는 샘플 조성이나 작성 조건, 물성값 등은 전자실험 노트 기능에 구비된 표 형식의 UI을 통해 입력한다. AGC는 데이터의 품질을 높이기 위해 입력 포맷의 통일 및 팀 내에서의 용어·업무 룰의 통일 등도 철저히 추진해왔다. ARDIS에 입력된 실험 데이터는 사내 다른 부서와 공유할 수 있다.

AGC는 실험 데이터를 축적하는 ARDIS뿐만 아니라 축적한 데이터를 분석하는 도구인 'AMIBA'도 사내에서 개발했다. ARDIS에 축적된 데이터를 가시화하는 툴과 회귀 모델이나 분류 모델 등을 개발하는 툴, 과거의 실험 데이터 등을 ‘데이터베이즈 최적화’를 통해 분석함으로써 다음에 우선적으로 실시해야 할 실험 조건을 제안하는 툴 등을 탑재하고 있다.

-- MI용 DMP의 SaaS를 사용하는 방법도--
DMP를 구축하는 방법으로는 아사히카세이나 AGC와 같이 자체적으로 개발하는 방법과 히타치제작소 등 MI 솔루션을 제공하는 IT 벤더에 DMP 개발을 의뢰하는 방법, MI용 패키지로서 제공되는 SaaS(Software as a Service)를 채택하는 방법이 있다.

일본제온은 DMP의 정비를 위해 먼저 미국의 스타트업 기업 언카운터블(Uncountable)의 MI 플랫폼을 사용했다. 언카운터블 MI 플랫폼은 실험 데이터를 구조화해 축적하는 웹 애플리케이션 및 축적된 데이터를 통해 기계학습 모델을 개발하는 툴 등을 구비하고 있다. 일본제온은 SaaS를 사용해 DMP의 PoC(개념 실증)를 실시하고, 그 후 자사의 DMP 정비를 시작했다.

스미토모화학은 DMP 구축에 오픈 소스 소프트웨어(OSS)의 데이터분석 플랫폼인 'KNIME Analytics Platform'과 미국 박스(Box)의 콘텐츠 관리 SaaS, 마이크로소프트의 데이터 가시화 툴 'Power BI' 등을 채택. 기존 툴과 조합해 확장성과 유연성이 높은 DMP를 구현했다.

새롭게 등장한 DMP 서비스로는 도요타자동차의 'WAVE BASE'가 있다. 도요타자동차는 자사용으로 개발한 MI용 DMP의 외부 판매를 검토하고 있으며, 올해부터 사외용 정보 발신 및 타사로의 서비스 제공 등을 시작했다. 실험 데이터를 축적하는 기능과 축적한 데이터에서 특징량을 자동으로 추출하는 기능 등을 구비하고 있다.

DMP의 구축 및 도입은 지금까지 속인화(屬人化)되어온 R&D(연구개발)에 관련된 업무 프로세스를 IT툴을 이용해 표준화하는 것과 같다. DX(디지털 트랜스포메이션) 이전에 필요한 기본적인 시스템화, IT화를 위한 대응이라고 할 수 있다.

한 화학 제조사의 MI 책임자는 “실제로 당사에서도 1980년대에 당시의 오피스 컴퓨터를 사용해 실험 데이터 축적을 시작했다. 그러나 1990년대에 그 구조가 형해화(形骸化) 되어 실험 데이터가 축적되지 않는 상태가 되었다”라고 말한다. MI라는 흑선(黒船)의 도래로 R&D에 있어서의 IT화가 40년 만에 진전을 보이고 있다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록