책 커버 표지
일경일렉트로닉스_2018/10_AI로 재료 개발 (MI)
  • 저자 : 日経BP社
  • 발행일 : 20180920
  • 페이지수/크기 : 130page/28cm

요약

Nikkei Electronics_2018.10. 특집 요약 (p32-57)

Breakthrough
재료개발에 혁명 'Materials Infomatics'
더 이상 미룰 수 없는 AI로 재료 개발

재료 개발에 혁명이 일어나기 시작했다. 대량의 데이터와 인공지능(AI) 기술을 이용하는 ‘Materials Informatics (MI)’에서 구체적인 성과가 속속 나오고 있기 때문이다. NEC처럼 성능이 수백 배 향상된 사례도 있다. NEC를 포함한 대부분의 기업이 본격적으로 MI를 시작한 지 1년 남짓한 기간의 성과다. MI 시작 3년째인 규슈대학발 벤처기업 Kyulux는 2020년 본격 출하를 앞두고 있다.

개발 속도도 이전의 몇 배로 빨라진 사례가 많다. 속도 향상뿐 아니라 연구자와 AI의 ‘협업’을 통해 기존 방법에서는 생각지도 못했던 재료나 지식을 얻은 경우도 있다.

Part 1. 동향
세계 규모로 데이터 수집 가속, 최선의 실험 조건을 AI가 제안

‘재료기술 x 정보기술 = MI’가 세계를 석권하고 있다. 재료 개발 속도를 수배에서 수십 배로 높일 가능성이 있으며 이미 성과도 나오기 시작하였다. 신재료 개발은 일본이 강하지만 MI에서 뒤쳐지게 되면 그 우위성을 단번에 잃게 된다. MI는 무엇일까? 무엇을 할 수 있을까? MI에 대한 세계의 움직임을 소개한다.

“기존의 재료 개발에서 사용했던 툴을 자전거나 자동차라고 한다면 MI에 기초한 개발은 비행기에 타는 것과 같다. 빠를 뿐 아니라 지금까지는 불가능했던 멀리까지 갈 수 있다. 볼 수 없었던 경치를 볼 수 있다. 우리들은 최근 1~2년 새 이러한 체험을 충분히 해 왔다”.

이렇게 말하는 사람은 물질∙재료연구기구(NIMS) 통합형재료개발∙정보기반부문(MaDIS) 데무라(出村) 부장이다. “정보기술의 속도감은 지금까지의 재료 개발에서 없었던 것이다. 그 속도에 타지 않으면 앞으로 치열한 개발 경쟁에서 이길 수 없다”라고 말한다.

-- 유전자 해독 움직임에 촉발 --
MI는 실험이나 계산 결과 데이터 속의 파라미터 사이에 있는 상관관계를 기계학습 등의 AI기술로 발견하여, 그것을 바탕으로 최적의 파라미터 값이나 그 재료를 예측하는 재료 개발 방법이다.

그 발단은 1990년대에 추진된 인간의 DNA 염기 배열을 해독하여 데이터베이스화하는 프로젝트 ‘Human Genome Project(인간 게놈 프로젝트)’에서, 당시 미국 MIT에서 배터리 재료를 개발하고 있던 Gerbrand Ceder 씨가 촉발하였다. Ceder 씨는 재료의 특성을 데이터베이스화하는 ‘Materials Genome Project’를 2005년에 시작. 이것이 2011년의 미국 오바마 정권에서 국가프로젝트 ‘Materials Genome Initiative(MGI)’의 발표로 이어졌다.

2013년에는 미국에서 축전지의 전해질에 포커스를 맞춘 ‘Electrolyte(전해질) Genome Project’도 개시. 이들을 뒤쫓듯이 일본을 포함한 세계에서 MGI와 같은 방향성의 국가프로젝트를 발족하기 시작하였다.

-- 40년 이상의 축적데이터가 활약 --
일본의 프로젝트 가운데 최초로 결과를 낸 것이 NIMS다. NIMS는 합금 재료의 결함이나 수명에 대한 연구를 40년 이상 전부터 계속하고 있으며, 결함 상태나 ‘크리프’라는 장기적인 금속 피로에 대한 데이터가 축적되어 있었다. 그것을 바탕으로 재료의 구조 등으로 수명이나 내열성을 높은 정밀도로 예측하는 프로그램을 작성. 그것을 이용하여 내열온도가 1,120℃로 상당히 높은 제트엔진 블레이드용 니켈(Ni) 베이스 단결정 재료를 개발하였다. 현재는 그 블레이드가 미국 보잉의 여객기 ‘보잉 787’의 터빈에 이용되고 있다고 한다.

NIMS는 이 성공 체험을 바탕으로 연구체제를 크게 MI로 시프트하였다. 현재는 임기제를 포함하여 약 1,600명의 연구자 중 약 16%인 261명이 MI에 중점을 둔 조직에 속해있다. 게다가 계속 급증하고 있다고 한다.

-- 복수 요인이 MI를 필연으로 --
MI가 필요해진 배경에는 인간 게놈 프로젝트 등의 영향 이외에도 (1)재료의 다원화, (2)국제적인 재료 개발 경쟁의 격화, (3)심층학습 등 AI 기술의 급속한 발전, (4)제1원리 계산과 같은 이론 계산 방법의 보급 등이 있다.

(1)은 예를 들면, 최근의 Li이온 2차전지의 정극재료는 니켈(Ni), 코발트(Co), 망간(Mn)의 3종류의 원소로 구성되는 3원계 산화물재료가 점점 주류가 되고 있다는 점이다. 고체전해질인 LGPS는 4원계다. 원소가 하나 증가하면 조사해야 할 조성 조합이 대폭 증가한다. 축전지 이외에도 경향은 마찬가지다. 유기재료의 경우는 더욱 개발이 복잡해진다.

최근에는 실험이나 계산 방법도 고도화되어 한번의 실험으로 대량의 데이터를 얻을 수 있게 되었다. 그러나 중노동인 전체 탐색을 하려면 역시 시간과 노동력, 비용이 따라가지 못한다. 대량 데이터의 해석 능력과 같은 측면도 포함하여 기존의 ‘인력’에 의존하는 연구로는 상대할 수 없는 상황이 되었다.

(2)의 국제경쟁의 격화는 예전에는 고려하지 않았던 중국의 연구개발력의 급격한 향상이 크다. MI와 관련된 일본의 재료연구자의 대부분이 중국의 AI기술이나 재료 개발 기술의 발전을 위협적으로 보고 있다. MI를 전업으로 하는 벤처기업인 MI-6의 창업자 기자키(木嵜) 씨도 한 때 중국기업에서 일했을 때 중국기업의 신재료 개발에 대한 열정을 피부로 느끼고 MI-6를 창업했다고 한다

-- AI기술은 MI에 있어서 제2파(波) --
최근에 MI로 새로운 재료가 개발되기 시작된 것은 (3)의 AI 기술의 발전이 크다. 심층학습이 재발견된 것이 2012년. 실은 2011년에 시작된 미국의 MGI 등에서는 계통적인 실험이나 계산 결과를 바탕으로 한 데이터베이스 정비에 중점을 두었다. 기계학습 등은 그 다음 과제로 취급하였다.

그러나 AI 기술의 연구나 응용이 다양한 성과를 올리고 바둑 AI ‘알파GO’가 최고 바둑 기사를 물리치는 등의 성과를 내면서 AI기술 인재가 급증. 그러한 인재가 MI에 참가하기 시작하였다. 결과적으로 반드시 데이터베이스가 충실하지 않아도 적은 데이터를 바탕으로 고정밀 해석과 예측이 가능해졌다. 해외는 데이터베이스 구축에서는 앞서고 있지만 일본은 데이터베이스가 약한 만큼 AI기술의 도입이 빠르다. 결과적으로 신재료 개발에서는 한발 리드하고 있다.

-- 가상실험이라면 결과는 순식간에 판명 --
-- 개발기간 1/20을 목표하는 사례도 --
-- MI/AI로 연구가 강해진다 --
-- 불완전한 이론을 바이패스 --
-- 서비스를 통해 인재 육성 --
-- 우선은 데이터 구축부터 시작 --
-- 데이터를 제어하는 것이 세계를 제어한다 --


Part 2. 개발 사례
데이터 별로 AI기술을 선택, 새로운 이론의 실마리 발견

현시점에서는 데이터가 풍부한 경우는 드물다. 때문에 성공사례의 대부분은 적절한 AI 기술을 선택함으로써 적은 데이터, 적은 실험/계산으로 결과를 내고 있다. 이론의 공백 지대에 MI로 도전하여 지금까지 알려지지 않았던 상관관계를 발견한 사례도 나왔다. 대기업의 출자도 이어져 1~2년 내에 재료의 양산을 전망하는 벤처기업도 있다.

MI를 이용한 신재료 개발 사례를 보면 성공의 열쇠는 크게 2개다. (1)이용할 수 있는 데이터의 양이나 타입에 따라서 적절한 AI기술을 선택한다, (2)예측모델을 구축하는데 있어서 지배적인 파라미터가 되는 ‘서술자’를 적절하게 선택하는 것이다.

(1)의 경우는, 한마디로 AI기술 또는 기계학습 기술이라고 해도 실제로는 다양한 종류, 방법이 있으며 무엇을 선택하는지에 따라 얻어지는 결과가 달라진다.

AI기술의 적절한 사용에는 크게 2개의 포인트가 있다. 첫 번째는 이용할 수 있는 데이터의 양이다.

데이터가 많으면 선택할 수 있는 AI기술은 많지만 반대로 적으면 선택지는 한정된다. 예를 들면 주목을 받고 있는 심층학습은 특징량, MI에서 말하는 서술자를 자동 추출할 수 있는 뛰어난 기술이지만 데이터가 대량으로 필요하다. MI를 이용하기 시작한 지 얼마 되지 않는 현단계에서 그러한 대량의 데이터를 이용할 수 있는 경우는 많지 않다.

처음에는 데이터가 적어도 실험이나 계산이 비교적 용이하며, 데이터를 양산하면서 MI를 적용하고 있는 개발 사례가 있다. 한편으로, 신재료 개발의 경우는 한번의 실험, 한번의 계산에 방대한 시간이나 비용이 드는 경우가 자주 있다. 그 경우 고정밀 예측 모델을 구축하는 것을 지향하기 보다는 원하는 특성을 갖춘 재료를 찾기까지 필요한 실험이나 계산 횟수를 줄이는 것을 목적으로 한 AI 기술을 선택하는 편이 좋은 경우도 있다. 예를 들면 ‘베이지안 최적화’다. 개발 사례도 베이지안 최적화를 적용한 사례가 많다.

두 번째 포인트는 서술자의 수다. 서술자가 많은, 즉 모델의 차원 수가 많은 경우는 심층학습 등 복잡한 모델을 표현할 수 있는 AI기술을 선택하게 된다. 베이지안 최적화는 차원 수가 많으면 계산이 무겁고 수렴도 나빠지기 때문에 선택하기 어려워진다. 차원 수가 적은 경우는 ‘Sparse modeling’을 선택하면 학습시키는 데이터도 비교적 적어도 된다.

-- 서술자의 선택 방법에서 차이가 난다 --
-- ‘인간의 이론’이 수정된 사례도 --

베이즈 최적화 (Bayessian Optimaization)
실험의 지침을 나타내는 컴퍼스로

지금부터는 몇 개의 AI기술과 그것을 채용한 구체적인 개발 사례를 소개한다. 현시점에서 MI에 채용된 사례가 많은 AI기술의 하나가 베이지안 최적화다. 그 자체는 기계학습이지만 ‘가우시안 프로세스’ 등의 다른 모델화 기술과 세트로 이용되는 경우가 많다.

MI에 있어서 베이지안 최적화의 이점은 구하고 싶은 특성치와 그 경우의 서술자 값을 아는데 있어서 실험/계산이 나아가야할 방향성을 결정해 주는 컴퍼스가 된다는 점이다. 결과적으로 실험/계산의 횟수를 크게 줄일 수 있다.

-- 전고체 배터리의 전해질 탐색에 채용 --
-- 미탐색 재료계에서 유력 후보를 선정 --
-- 서술자를 그룹화하여 차원을 줄인다 --


● 전이 학습
사전 학습 후에 ‘본방’에 도전

NIMS 에너지∙환경재료연구거점 계면계산과학그룹의 연구원 할렘 씨는 계산 횟수를 크게 줄이는 기술을 채용하였다. 그것이 ‘전이학습’이다.

전이학습은 대상 데이터의 양이 많지 않은 경우에, 양은 풍부하지만 본래의 학습 대상이 아닌 다른 데이터로 기계학습을 하여 잠정적인 모델을 구축한 후에, 대상 데이터를 학습시켜 모델의 정밀도를 효율적으로 높이는 방법이다. 지금까지는 주로 이미지 속에서 물체를 인식하는데 뛰어난 CNN(Convolutional Neural Network)에서 이용되고 있었다. 인터넷에 대량 있는 일반 이미지로 CNN 학습을 진행한 후에 결정 단면의 전자현미경 사진 등을 학습시키면, 처음부터 결정 단면 사진 만을 사용하는 것 보다 적은 데이터 양으로 정밀도를 높일 수 있다.

-- 전이학습을 ‘전이’ --
-- 오차가 없는 경우에 유효 --
-- 표면장력은 모델에 효과가 없다 --


● 게임 트리와 텍스트 마이닝
기존 방법을 응용하는 것이 위력

차원이 낮은 경우에 적합한 베이지안 최적화와는 반대로 현상이 복잡하고 서술자 수와 차원 수가 많은 경우의 효율적인 탐색에 적합한 AI기술의 하나가 ‘게임트리 탐색’이다. 이를 채용한 것은 NEC. NEC와 도호쿠대학이 이전부터 연구하고 있는 “스핀류 열전변환 소자’의 개발에 이용하였다.

스핀류 열전변환 소자의 주재료는 자성체 박막. 소자는 이것에 금속막을 붙이면, 소자 구조가 단순하고 게다가 기존의 열전변환소자에 있는 원리적인 한계에 영향을 받지 않기 때문에 잠재적으로는 기존의 열전변환소자를 크게 초월하는 변환효율을 실현할 가능성이 있다.

한편 실제로 제작한 소자의 성능은, 2016년 말까지 4년 동안에 기존의 열전변환소자의 10억분의 1~10만분의 1로 침체했었다. 이유는 현상이 상당히 복잡하고 이론적으로도 실험적으로 개선 포인트를 찾기 어려웠기 때문이다.

-- 문장의 일괄 해석 기술을 응용 --

● 회귀 트리
높은 범용성, 심층학습에도 활용

NEC는 독자성이 높고 게다가 적용 범위가 넓은 기계학습법도 개발하여 MI의 중요 기술에 내장하였다. ‘이종(異種)혼합학습’이다.

일반적으로 AI기술은 데이터 양이나 타입에 따라 구분 사용하는 것이 중요하지만 이종혼합학습은 기존에는 양립이 어렵다고 했던 3개의 특성, 즉 (1)결정트리의 높은 모델 해석성, (2)심층학습의 비선형 데이터에 대한 대응 능력, (3) Sparse modeling으로 대표되는 데이터의 Sparse성, 즉 실질적인 차원 수가 상당히 적은 경우에 적응하는 성질을 겸비하고 있다.

다양한 강점을 보유한 이종혼합학습의 정체는 ‘회귀트리’ 또는 ‘회귀 포레스트’라고 불리는 트리 모양의 분류기의 일종이라고 할 수 있다. 그 외에도 회귀트리를 바탕으로 ‘랜덤 포레스트’, ‘Gradient Boosting Tree(GBT)’와 같은 다양한 확장 기술이 개발되고 있다. 그 일부는 심흥학습과의 유사성도 강하다

-- Pt 스핀 분극에 스포트라이트 --
-- 무기재료에서는 최고 수준의 단열성 실현 --
-- 이론의 공백 지대를 공격하였다 --
-- 상정 외의 발견이 2개 --
-- 오차가 없는 데이터가 필수 --
-- 용광로 안을 ‘투시’하여 실험을 파악 --
-- 유기EL 발광재료 개발에서 성공 --
-- MI는 벤처기업의 ‘무기’ --
-- 3년의 데이터 축적이 강점으로 --


  -- 끝 --

목차