일본산업뉴스요약

일본의 머티리얼스 인포매틱스에 공통의 과제 -- 실험 데이터의 축적이 부실
  • 카테고리화학/ 신소재/ 환경·에너지
  • 기사일자 2022.6.22
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2022-06-30 22:40:35
  • 조회수240

Nikkei X-TECH_2022.6.22

제조업 DX의 핵심, 머티리얼스 인포매틱스
일본의 머티리얼스 인포매틱스에 공통의 과제
실험 데이터의 축적이 부실

화학업체 등 일본의 대형 제조업이 인공지능(AI)을 비롯한 정보과학 기법을 응용해 재료 개발 효율을 높이는 머티리얼스 인포매틱스(Materials Informatics, MI)를 가속화하고 있다. 제조업 DX(디지털 트랜스포메이션)의 핵심으로서, 회사 전체가 MI에 착수하기 시작했다.

예를 들어 아사히카세이는 19년에 'MI 추진 센터'를 설립해 지금까지 600명 이상의 MI 인재를 육성해왔다. 그리고 MI에 필요한 데이터를 축적하기 위해 데이터 관리 기반 구축 등을 추진하고 있다.

미쓰비시케미칼홀딩스가 MI를 추진하는 머티리얼스 인포매틱스 CoE(Center of Excellence)를 출범시킨 것은 18년 6월이다. 스미토모화학은 19년 4월에 DX 부문으로서 ‘디지털 혁신부’를 신설. 사내 데이터 사이언티스트를 디지털 혁신부에 집결시켜 MI에 대한 대응을 가속화하고 있다.

AGC는 19년 7월 MI에 대응하는 '스마트 R&D'를 시작했다. 닛폰제온도 21년 6월에 '디지털 연구개발추진실'을 만들어 MI 추진을 시작했다.

MI란 기계학습 등을 활용해 재료 개발의 효율을 높이는 대응을 말한다. 과거의 실험 데이터를 바탕으로 기계 학습 모델을 개발해, 재료 후보의 구조나 조성에서 그 기능이나 특성을 예측하거나, 어떤 기능이나 특성을 만족시키는 재료의 분자 구조나 조성 등을 예측하기도 한다. 전자의 기능이나 특성의 예측은 ‘순해석’, 후자의 분자 구조 등의 예측은 ‘역해석’이라고 부른다.

-- 고무를 가공하는 '레시피'를 AI가 제안 --
자동차용 타이어 등에 사용하는 합성고무를 제조하는 닛폰제온은 타이어 제조업체 등 고객을 대상으로 제공하는 고무 가공 '레시피' 개발에 MI를 응용했다.

닛폰제온이 고객에게 판매하는 것은 어디까지나 소재이며, 그것을 자동차용 타이어 등으로 가공하기 위해서는 가소제라고 하는 고무를 부드럽게 하는 기름을 섞거나 고무를 튼튼하게 하는 노화방지제나 보강재, 유황 등의 가교재를 배합할 필요가 있다. 소재에 대해 무엇을 섞어야 어떤 기능이 나타나는지를 고객에게 보여주는 것이 레시피의 역할이다.

닛폰제온은 19년에 사내에 축적한 약 200만건의 실험 데이터와 약 10만건의 레시피 데이터를 활용해, 고객이 타이어 등에 요구하는 특성에서 레시피를 역해석하는 기계학습 모델을 개발했다. 이 기계학습 모델을 사용함으로써 “고객으로부터 레시피의 요구가 있으면, 거기에 대한 퍼스트 리플라이(최초의 대답)로 레시피를 제공할 수 있게 되었다”(닛폰제온 디지털연구개발추진실의 다카하시(高橋) 실장).

기존에는 고객이 어떠한 레시피를 요구하면, 기술자가 1주일 정도의 시간을 들여 레시피를 개발했었다. 최종적인 레시피는 닛폰제온과 고객이 다양한 테스트를 반복하면서 만들지만, MI를 활용함으로써 비즈니스 속도를 크게 개선할 수 있었다.

이러한 비즈니스의 스피드 향상이야말로 대형 업체가 MI에 착수하는 최대 동기다. 내발적인 동기만이 아니다. 경쟁사가 MI를 통해서 비즈니스의 속도를 올린다면, 자사도 대항책으로서 MI에 착수하지 않을 수 없다. 스미토모화학 디지털혁신부의 가네코(金子) 부장은 “사업을 둘러싼 환경 변화는 가속되고 있다. 기존처럼 시간을 들여 재료 개발을 하기에는 어려운 상황이다”라고 위기감을 나타낸다.

-- 일본 기업에 공통적인 MI 과제는? --
대형 업체가 주력하고 있는 MI. 그러나 각 사의 MI 대응을 취재하다 보면 공통의 과제가 눈에 들어온다. 그것은 실험 데이터에 관한 문제이다.

MI에서 사용하는 기계학습 모델을 개발하기 위해서는 대량의 실험 데이터가 필요하다. 또한 실험 데이터는 실험 프로세스나 결과 등을 기계가 이해할 수 있는 형태로 구조화해 축적할 필요가 있다. 그런데 많은 일본 업체에서는 애초에 과거의 실험 데이터가 축적되어 있지 않았던 것이다.

-- 실험 데이터는 수기 실험 노트나 엑셀로 기록 --
일본 업체에서는 대부분의 경우 연구개발(R&D) 과정은 각 부문이나 연구자 개인의 재량에 맡기는 경향이 크다. 실험 데이터를 기록하는 것은 손으로 쓴 실험 노트나 엑셀뿐이라는 연구자도 적지 않다. 엑셀에 실험 데이터가 저장돼 있었다고 해도 기록으로서 남길 데이터 항목 등은 개인에게 귀속되어 있다.

반면 미국이나 유럽의 기업에서는 R&D 프로세스는 회사 전체적으로 통일된 경우가 많다. 이들 기업에서는 인력 유동성이 높기 때문에 실험 절차나 데이터를 기록하는 절차를 표준화하여 업무 인계를 원활하게 할 필요가 있었기 때문이다. 그 결과 미국이나 유럽의 기업에서는 실험 데이터가 축적되었고, 이를 기반으로 MI도 앞서게 되었다.

앞에서 말한 닛폰제온에서도 레시피를 제안하는 기계학습 모델을 처음 개발했을 때에는 미국의 자회사가 축적하고 있던 실험 데이터나 레시피 데이터를 사용했다. 일본 본사도 미국 자회사 이상으로 실험을 하거나 레시피를 개발했지만 그 데이터를 활용할 수 있는 형식으로 축적하지 않았다.

“미국의 자회사에서는 종업원에 따른 분업이 진행되고 있어, 실험 데이터는 개인에게 귀속되어 있지 않았다. 그에 반해 일본의 연구자는 실험 데이터를 스스로 안고 있는 경향이 있었다”(닛폰제온 디지털연구개발추진실의 다카하시 실장). 그래서 닛폰제온은 일본 본사에서도 실험 데이터를 축적하기 시작했다. 현재는 일본 각 연구소에서 축적한 실험 데이터도 활용하여 기계학습 모델을 개선해 나가고 있다.

실험 데이터는 축적돼 있어도 기계학습 모델을 개발하기엔 양이 부족하다는 과제도 있었다. 아사히카세이 인포매틱스추진센터의 고노(河野) 센터장은 “MI에서는 실패 데이터도 중요한데, 축적정리되어 있지 않았다”라고 말한다. 많은 연구원들은 성공한 실험 데이터만 기록하고 있었고, 성공의 이면에 있는 대량의 시행착오 데이터는 축적되어 있지 않았다.

-- 실험 데이터를 늘리는 3개의 방법 --
이러한 사정이 있기에 MI에 착수하는 일본 기업들은 실험 데이터를 늘리는 것부터 시작하고 있다.

MI에서 활용하는 실험 데이터를 늘리는 방법은 크게 3가지다. (1) 과거를 포함한 실제 실험 데이터를 수집하고 축적하는 방법, (2) 실험 횟수를 크게 늘리는 방법, (3) 고성능 컴퓨팅(HPC)이나 양자컴퓨터 등에 의해 물리 실험을 시뮬레이션해 가상적인 실험 데이터를 늘리는 방법이다.

(1)의 실험 데이터의 수집 및 축적은 지금까지 속인적이었던 실험 프로세스를 IT 툴 등의 도입을 통해 표준화하고, 실험 기록이 데이터로서 자동적으로 축적되는 시스템을 만들어내는 것을 가리킨다.

(2)와 (3)은 실험 데이터 자체를 늘리는 대응이다. 그 중에서도 물리적인 실험 데이터를 늘리는 것이 (2)번이다. 노동력에 의지하고 있던 기존의 실험 프로세스를 재검토하고, 실험 로봇이나 자동 계측기 등을 도입함으로써 실험의 자동화를 도모하는 것 등이 포함된다.

(3)은 가상적인 실험 데이터를 늘리는 대응으로, 최근에 특히 주목을 받고 있다. 기존에는 화학 실험을 분자 레벨에서 시뮬레이션하기 위해서는 양자화학계산이라 불리는 계산 부하가 높은 처리를 실행해야 했기 때문에 대규모 가상 실험은 좀처럼 어려웠다.

그러나 최근에는 후가쿠(富岳)와 같은 수백 페타 FLOPS(플롭스, 초당 부동소수점 연산 횟수)의 연산 성능을 갖춘 슈퍼컴퓨터가 등장했다. 또한 심층학습을 활용함으로써 시뮬레이션에 필요한 연산 횟수를 줄이는 '뉴럴 네트워크 포텐셜'이나 '기계학습 포텐셜'이라는 새로운 방법이 등장. 가상 실험에 대응하기 쉬워졌다.

다음에는 일본 기업들이 실제로 진행하고 있는, 실험 데이터를 늘리는 대응을 살펴보자.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록