책 커버 표지
일경컴퓨터_2022/07/21(1)_머티리얼즈 인포매틱스 (MI)
  • 저자 : 日経BP社
  • 발행일 : 20220721
  • 페이지수/크기 : 106page/28cm

요약

Nikkei Computer_2022.7.21 특집 요약 (p40~47)

머티리얼즈 인포매틱스 (MI)

제조업 DX(디지털 전환)의 핵심

일본의 화학 메이커가 머티리얼즈 인포매틱스(Materials Informatics, MI)의 도입을 가속화하고 있다. MI는 인공지능(AI) 등을 응용하여 재료 개발의 효율을 높이기 위한 대응이다. AI가 재료 후보의 기능 등을 예측 가능하다면, 신규 재료의 탐색을 큰 폭으로 고속화 할 수 있다. MI는 연구개발(R & D)의 DX(디지털 트랜스포메이션, 디지털 전환)이다.

그러나 일본 메이커들의 MI에는 공통적인 과제가 있다. 뛰어난 기계학습 모델의 개발에 불가결한 실험데이터가 부족한 것이다. MI에 도전하는 일본메이커의 실상과 MI의 미래상을 알아본다.

일본의 대형 화학 제조사 및 재료 업체들이 DX의 핵심으로서 전 그룹 차원에서 머티리얼즈 인포매틱스(Materials Informatics, MI)를 추진하기 시작하고 있다.

구체적으로는 아사히카세이(旭化成), 스미토모화학(住友化学), 일본제온, 미쓰이화학(三井化学), 미쓰비시(三菱)케미칼홀딩스, AGC 등이 MI를 추진하는 부문을 설립하고, MI 인재 육성 등에 나서고 있다.

MI는 기계학습 등을 활용해 재료 개발의 효율성을 높이는 연구 활동이다. 과거의 실험 데이터를 바탕으로 훈련된 기계학습 모델을 사용하여 재료 후보의 구조나 생성 프로세스 등을 통해 재료의 기능 및 특성을 예측하거나, 어떤 기능이나 특성을 만족시키는 재료의 분자 구조 및 생성 프로세스 등을 예측하기도 한다.

전자의 기능 및 특성에 대한 예측을 ‘순(順)해석’, 후자의 분자 구조 등의 예측을 ‘역(逆)해석’이라고 부른다.

-- 고무 가공 '레시피'를 AI가 제안 --
차량용 타이어 등에 사용되는 합성고무를 제조하는 일본제온은 타이어 제조사 등 고객을 대상으로 제공하는 고무 가공 '레시피' 개발에 MI를 응용했다.

일본제온이 고객에게 판매하는 고무를 차량용 타이어 등으로 가공할 때에는 가소제(可塑劑)라고 불리는 고무를 부드럽게 하는 기름을 섞거나, 고무를 튼튼하게 하는 노화방지제나 보강재, 황 등의 가교재(架橋材)를 배합하기도 한다. 소재에 무엇을 섞으면 어떤 기능이 나타나는지를 고객에게 보여주는 것이 레시피의 역할이다.

일본제온은 2019년 사내에 축적해온 약 200만건의 실험 데이터와 약 10만건의 레시피 데이터를 활용해 고객이 타이어 등에 요구하는 특성을 역 해석하여 레시피를 생성하는 기계학습 모델을 개발했다.

이 기계학습 모델을 사용함으로써 “고객으로부터 (특정의 기능을 실현할 수 있는) 레시피의 요구가 있으면, 이에 대한 퍼스트 리플라이로 레시피를 제공할 수 있게 되었다”(일본 제온의 다카하시(高橋) 디지털연구개발 추진실장)

기존에는 고객으로부터 레시피를 요구받으면 기술자가 1주일 정도의 시간을 들여 레시피를 개발해왔다. MI를 활용함으로써 비즈니스의 스피드를 크게 개선할 수 있게 되었다고 한다.

이러한 비즈니스의 스피드 업이야말로 대형 제조사들이 MI를 추진하는 최대 동기이다.스미토모화학의 가네코(金子) 디지털혁신부장은 “사업을 둘러싼 환경 변화는 가속화되고 있다. 기존과 같이 시간이 소요되는 재료 개발로는 어려운 상황이다”라고 말한다.

그러나 일본 제조사들의 MI에는 공통된 과제가 있었다. MI용 기계학습모델을 개발하려면 대량의 실험 데이터가 필요하지만, 많은 일본 제조사들에겐 축적된 과거의 실험 데이터가 없었던 것이다.

일본 제조사들은 대부분의 경우 연구개발(R&D) 과정이 각 부문이나 연구자 개인의 재량에 크게 의존하고 있다. 실험 데이터를 기록하는 방법은 손으로 작성한 실험노트나 엑셀뿐이라는 연구자도 적지 않다. 엑셀에 실험 데이터가 저장되어 있다고 해도 데이터 항목 등은 속인화(屬人化)되어 있다.

앞에서 소개한 일본제온에서도 레시피를 제안하는 기계학습 모델을 처음 개발했을 때에는 미국의 자회사가 축적해온 실험 데이터나 레시피 데이터를 사용했다. 일본 본사에서도 미국 자회사 이상으로 실험을 실시해 레시피를 개발하고 있었지만, 활용될 수 있는 형식으로 데이터를 축적하지 않았던 것이다.

“미국의 자회사에서는 직원들의 분업이 추진되어 실험 데이터는 개인에게 귀속되어 있지 않았다. 이에 비해 당시 일본의 연구자들은 실험 데이터를 개인적으로 보유하는 경향이 있었다”(일본제온의 다카하시 디지털 연구개발추진실장)라고 한다.

이러한 문제를 해결하기 위해 일본제온은 일본 본사에서도 실험 데이터를 축적하기 시작. 현재는 일본 내 각 연구소에서 수집한 실험 데이터도 기계학습 모델의 개선에 활용하고 있다.

또한 실험 데이터가 축적되어 있다고 해도 기계학습 모델을 개발하기에는 부족하다는 과제도 있었다. 아사히카세이의 고노(河野) 인포매틱스 추진 센터장은 “MI에서는 실패 데이터도 중요하지만 대부분 축적이나 정리되지 않았다”라고 말한다.

많은 연구원들이 기록하고 있었던 것은 성공한 실험 데이터뿐으로, 성공의 이면에 있는 대량의 시행착오 데이터는 축적되지 않았던 것이다.

-- 실험 데이터를 늘리는 3가지 방법 --
이에 일본 제조사들은 실험 데이터를 늘리는 것에서부터 MI를 시작하고 있다. 그 방법으로는 세 가지가 있다. ①실험 데이터를 올바르게 수집·축적한다 ②실험 횟수를 크게 늘린다 ③가상 실험을 통해 데이터를 늘린다.

①의 실험 데이터의 수집·축적 위해 일본 제조사들이 추진하고 있는 것은 MI용 데이터·매니지먼트·플랫폼(DMP) 정비이다.
DMP란 실험 결과 등 수치 데이터를 축적하는 데이터베이스(DB)와 논문이나 실험노트 등 비구조화되어 있는 데이터를 축적해 검색이 가능하도록 하는 검색엔진을 결합한 시스템이다.

예를 들어, 아사히카세이는 과거의 실험 데이터와 함께 사내·외에서 수집한 논문, 특허문서, 제품 카탈로그 등의 기술문서와 과거의 실험노트 등을 DMP에 축적해 필요에 따라 검색 및 추출할 수 있도록 했다.

또한 DMP에 축적한 실험 데이터를 사용해 기계학습모델을 개발하기 위한 툴인 'IFX-Hub'도 정비. 사내 연구자가 웹 브라우저 등을 사용해 AI를 이용한 재료 후보 압축 등을 실행할 수 있도록 했다.

실험 데이터는 단지 축적하는 것만으로는 기계학습모델 개발 등에 활용할 수 없다. 컴퓨터가 실험 내용을 이해할 수 있도록 구조화해 축적할 필요가 있다.

양자컴퓨터를 사용한 화학 실험 시뮬레이션 방법 및 MI용 DMP 등을 개발하는 스타트업기업 큐나시스(QunaSys)의 마쓰오카(松岡) COO(최고집행책임자)는 실험 데이터의 구조화를 “요리의 레시피를 컴퓨터가 이해할 수 있도록 변환하는 것이다”라고 비유한다.

MI 분야에서는 데이터를 구조화할 때 '기술자'라고 불리는 기계학습 모델의 특징을 의식할 필요가 있다. 일본제온의 다카하시 디지털연구개발 추진실장은 “MI를 추진해나가는 과정에서 새로운 특징이나 '기술자'가 계속해서 필요하게 된다.

축적되는 데이터의 구조는 항상 수정할 필요가 있으며, 이러한 작업은 '기술자'를 이해하는 현장의 연구원이 할 수 밖에 없다”라고 말한다.

AGC가 개발한 MI용 DMP인 ARDIS는 연구자가 실험 데이터를 입력하는 데 사용하는 웹 베이스의 사용자 인터페이스(UI)인 전자 실험 노트 기능이 구비되어 있다. AGC가 사내에서 실시하는 다양한 종류의 실험에 대응할 수 있도록 이 웹 어플리케이션은 사내에서 자체적으로 제작했다.

ARDIS는 실험에서 사용한 샘플 조성이나 작성 조건, 물성값 등을 전자 실험 노트 기능에 구비된 표 형식의 UI를 통해 입력한다. AGC는 데이터의 품질을 높이기 위해 입력 포맷의 통일과 팀 내에서의 용어·업무 룰의 통일 등도 철저히 실시했다. ARDIS에 입력된 실험 데이터는 사내 다른 부서와도 공유할 수 있도록 했다.

-- MI용 DMP의 SaaS를 채택하는 방법도 있어 --
DMP는 자사에서 개발하는 것 외에도 히타치제작소 등 MI 솔루션을 제공하는 IT 벤더에 개발을 의뢰하거나, MI용 SaaS(Software as a Seivice)를 채택하는 방법이 있다.

일본제온은 미국의 스타트업 기업 언카운터블의 MI 플랫폼을 사용했다. 여기에는 실험 데이터를 구조화해 축적하는 웹 애플리케이션과 축적한 데이터를 통해 기계학습 모델을 개발하는 툴 등이 구비되어 있다. 일본제온은 먼저 SaaS를 사용해 DMP의 PoC(개념 실증)를 실시한 다음 자사의 DMP 정비를 시작했다.

스미토모화학은 DMP 구축에 오픈소스 소프트웨어(OSS)의 데이터 분석 플랫폼 ‘KNIME Analytics Platform’과 미국 박스의 콘텐츠 관리 SaaS, 마이크로소프트의 데이터 가시화 툴인 ‘Power BI’ 등을 채택. 기존 툴과 조합해 확장성과 유연성이 높은 DMP를 구현했다.

-- 로보틱스로 실험 자동화 --
이어서 실험 데이터를 늘리는 방법을 살펴보자. ②의 실험 횟수를 늘리는 방법으로는 사람이 담당해 온 실험 프로세스를 기계로 자동화해 단위 시간당 실험 횟수를 늘리는 '하이스루풋 실험', '자동 실험'이 진행되고 있는 중이다.

재료 후보가 되는 시약의 합성이나 합성한 시약의 여과·정제, 재료 후보의 물성 측정 등의 실험 프로세스를 로보틱스 기술을 도입한 실험장치를 통해 자동화하는 실험이다.

일본 제조사들이 우선적으로 추진하고 있는 것은 자동 측정기 도입과 같은 측정 프로세스의 자동화로, DMP에 자동 측정기를 연결해 실험 데이터를 자동으로 DB에 축적하는 것이다.

미쓰비시케미칼은 진일보한 자동화를 목표로 연구를 추진하고 있다. 2019년부터 2년간 MI 연구로 저명한 캐나다 토론토대학 아스풀 구직 교수 연구실에 연구원을 파견해 자동 실험 연구에 참여시키기도 했다.

미쓰비시케미칼의 머티리얼즈·디자인·래버러토리에 소속된 호리타(堀田) 선임연구원이 연구하고 있는 것은 유기반도체 레이저의 재료 후보를 압축하는 실험을 재료의 합성부터 정제, 물성 평가까지 전자동화하는 연구이다.

연구에서 그는 우선 규슈대학의 아다치(安達) 교수가 개발한 유기반도체 레이저 재료의 일부를 재구성해 40개의 재료 후보를 만들어냈다. 이어서 이 재료 후보들의 시약을 스위스 켐스피드테크놀로지스의 시약 합성 로봇이 합성했다.

합성한 시약에는 불순물이 많이 들어 있어 미국 써모피셔사이언티픽(TMO)의 고성능 액체/고속 액체 크로마토그래피 질량분석(HPLC-MS) 장치 등을 사용해 자동으로 여과 및 정제했다.

이렇게 만들어 낸 유기 반도체 레이저 재료의 발광 성능 등도 계측했다고 한다. 연구에 참여한 호리타(堀田) 주임연구원은 주로 광학 평가를 실시하는 장치나 장치를 제어하는 소프트웨어를 개발했다.

이 연구에서 실제로 40개의 재료 후보를 평가한 결과, 유력한 재료 후보 8개를 발견했다. 자동 실험에 소요된 시간은 이틀이었다. 호리타 주임연구원은 "기존과 같이 재료 후보를 하나하나 수동으로 합성해 실험했다면 1~2개월은 소요되었을 것이다”라고 말한다.

미쓰비시케미칼은 현재 시약 합성 자동화 및 시약 온도 변화 자동화 등을 시행하는 장치 활용을 검토하고 있다.

-- 슈퍼컴퓨터와 AI로 가상 실험 실시 --
이어서 ③의 가상 실험으로 실험 데이터를 늘리는 대응을 살펴보자. 가상 실험이란 물리적인 실험을 슈퍼컴퓨터를 이용해 분자 레벨로 시뮬레이션하는 것이다. 이것은 1990년대부터 실행되어왔지만, 최근의 포인트는 시뮬레이션과 기계학습을 조합하는 것에 있다.

화학실험을 분자 수준에서 시뮬레이션하기 위해서는 분자 안에서 작용하는 양자역학의 물리현상을 컴퓨터 상에 재현할 필요가 있다. 이러한 계산은 양자화학계산이나 제1원리계산이라 불리며, 방대한 계산량을 필요로 한다.

슈퍼컴퓨터를 사용해도 수 일이 걸리거나 아무리 시간을 소비해도 계산이 끝나지 않을 수 있다. 이 때문에 슈퍼컴퓨터를 이용한 가상 실험에는 물리적인 실험과 비슷하거나 그 이상의 시간과 비용이 소요되어 왔다.

하지만 최근 들어 슈퍼컴퓨터를 이용한 실험 시뮬레이션 결과를 교사 데이터로 이용함으로써 실험 결과를 예측하는 기계학습모델을 개발하는 방법이 대두되고 있다. 원자 사이에 작용하는 위치에너지(포텐셜에너지) 예측에 기계학습이나 뉴럴네트워크를 적용하기 때문에 '기계학습 포텐셜'이나 '뉴럴네트워크 포텐셜'이라고 불린다.

제1원리 계산에 근거한 시뮬레이션에 비해 기계학습모델에 의한 결과 예측은 압도적으로 빨리 완료된다. 이 때문에 가상 실험에서 재료 후보 압축 등에 걸리는 시간을 큰 폭으로 단축할 수 있을 가능성이 있다.

-- 차세대 유기EL 재료의 수명 늘려 --
유기EL 재료를 개발하는 스타트업인 큐럭스(Kyulux)는 가상 실험과 기계학습을 결합시킨 MI를 통해 효율적인 재료 개발을 추진하고 있다.

큐럭스는 규슈대학 발 스타트업 기업으로, 규슈대학 아다치(安達) 교수가 발명한 유기EL용의 새로운 발광재료인 열활성화 지연형광(TADF)과 TADF를 사용한 유기EL '하이퍼플루오레센스(Hyperfluorescence)'의 상용화를 추진하고 있다.

현재의 유기EL은 빨간색과 녹색 발광에는 인광 재료를, 파란색 발광에는 형광 재료를 사용하고 있다. 인광 재료에는 레어 메탈인 이리듐을 이용해야 한다는 과제가, 형광 재료에는 발광 효율이 낮다는 과제가 있다. 반면 TADF와 형광재료를 조합해 발광재료를 만드는 하이퍼플루오레센스는 레어메탈을 사용하지 않고 발광효율도 높다.

하지만 하이퍼플루오레센스에는 수명이 짧다는 과제가 있었다. 이와 관련해 큐럭스는 2020년 11월, MI를 활용함으로써 기존보다 100배 이상의 수명을 실현한 하이퍼플루오레센스 기술을 개발했다고 발표했다.

큐럭스는 양자화학 계산과 기계학습, 실험을 통합한 MI를 실행하기 위한 소프트웨어 플랫폼인 큐매틱(Kyumatic)을 자체 개발해 사용하고 있다. 큐매틱은 미국 하버드대학으로부터 MI 기술 라이선스를 받아 개발했다. 이 MI 기술은 앞서 언급한 토론토대학 소속 아스풀 구직 교수가 하버드대학 재직 시절 개발한 것이다.

양자화학 계산과 기계 학습을 결합한 MI의 채택은 앞으로 점점 늘어날 전망이다. 큐럭스의 고야마 CTO(최고기술책임자)는 “3년 전에는 1,000분자의 스크리닝(선별) 계산에 22일이나 걸렸다. 하지만 지금은 하루밖에 걸리지 않는다”라고 말한다. 기계학습 기술과 하드웨어의 발달로 계산에 걸리는 시간은 계속 단축되고 있다.

-- 후가쿠(富岳)로 대량의 가상 실험 --
미쓰비시케미칼의 고다마(樹神) 머티리얼즈·디자인·래버러토리 소장은 “슈퍼컴퓨터 후가쿠를 사용한 고분자 재료(폴리머)의 물성 시뮬레이션에 기대를 걸고 있다”라고 말한다. 그가 말하는 것은 통계수리연구소가 중심이 되어 진행하는 '데이터 구동형 고분자 재료 연구를 변혁하는 데이터 기반 창출' 프로젝트이다.

이 프로젝트는 후가쿠를 사용해 폴리머 물성 시뮬레이션을 대량으로 수행하고 10만종 이상의 폴리머에 관련된 가상실험 데이터베이스를 구축. 이 데이터베이스를 기계학습 모델 개발에 이용하는 것을 목표로 한다. 이 프로젝트에는 미쓰비시케미칼 외에 JSR, 미쓰이화학 아사히카세이 덴소 등 14개 민간기업도 참여하고 있다.

-- 누구나 기계학습 포텐셜 이용--
누구나 손쉽게 뉴럴 네트워크 포텐셜을 이용할 수 있는 클라우드 서비스도 등장했다. 프리퍼드네트웍스(Preferred Networks)와 ENEOS의 공동출자회사 PFCC(Computational Chemistry)가 2021년 7월에 개시한 재료 탐색 클라우드 서비스인 '매틀란티스(Matlantis)'이다.

매틀란티스의 핵심은 가상 실험을 유저 기업이 직접 하지 않아도 뉴럴 네트워크 포텐셜을 이용할 수 있다는 점이다. 기존에는 탐색하고 싶은 재료 후보를 정하고 그 후보에 대해 양자화학 계산을 실시해 교사 데이터를 만들 필요가 있었다.

반면 매틀란티스의 경우에는 미리 PFCC가 55가지 원소에 관한 양자화학 계산을 대량으로 실시해 기계학습 모델을 개발. 유저 기업은 PFCC가 만든 기계학습 모델을 사용해 재료 탐색을 할 수 있다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

목차