일본산업뉴스요약

재료연구 데이터의 활용, ‘요람에서 무덤까지’ -- AI∙데이터를 과학에 도입
  • Category사물인터넷/ ICT/ 제조·4.0
  • 기사일자 2019.1.7
  • 신문사 일간공업신문
  • 게재면 21면
  • Writerhjtic
  • Date2019-01-13 22:03:57
  • Pageview443

재료연구 데이터의 활용, ‘요람에서 무덤까지’
AI∙데이터를 과학에 도입
재료연구 분야에서 데이터를 ‘요람에서 무덤까지’ 100% 활용하는 시스템 구축이 추진되고 있다. 인공지능(AI) 기술 및 데이터 과학을 유효하게 사용하기 위해서는 계측기기와 학술논문 등, 연구개발 환경을 재구축할 필요가 있었다. 재료 업계에서는 학술계와 산업계가 연계하면서 데이터 활용을 모색한다. 이 도전은 다양한 연구 영역의 모델이 된다.

-- 브레이크 스루 --
재료개발에 AI 및 데이터 과학을 도입하는 머티리얼즈 인포매틱스(MI)가 급속도로 확대되고 있다. 재료 데이터를 축적하고 분석해 유망한 재료 조성을 짜내거나 제조 조건을 최적화하는 시도가 성공했기 때문이다. 그리고 수학은 특히 근본적인 브레이크 스루를 일으킨다. 도호쿠대학의 후쿠야스(福安) 교수는 중성자선 회절 산란 데이터에서 물질의 자기구조 및 원자점유율을 요구하는 수리 수법을 개발했다.

물질의 자기구조는 자기성 재료의 설계, 원자점유율은 개체 전해질의 이온 전도성 등을 이해하는 중요 지표다. 이것이 수학의 방정식을 푸듯 올바른 답이 구해진다. 후쿠야스 교수는 “지금까지의 데이터를 계산하여 고치면 연구자 마다 다른 학설로 답을 낼 수 있다.”고 강조한다. 기존에는 가장 확실한 것 같은 후보를 선택해왔지만 정답이라고 보증할 수 없었다. 수학적으로 답을 보증할 수 있는 임팩트는 크다.

데이터가 보관되어 있다면 재점검은 가능하다. 다만 현 상태로는 대부분의 실험 데이터가 사장되어 있다. 과학논문에 게재되는 데이터는 연구실에서 탄생하는 데이터의 극히 일부분이다. 그 논문조차 발행되면 역할을 끝내는 것이 대부분이며 다른 연구자에게 읽혀 재검증되는 논문은 적다. 그러한 상황에서 물질∙재료연구기구는 계측기에서 데이터를 직접 수집하는 시스템과 거의 사장되어 있던 논문에서 데이터를 재취득하는 기술을 개발한다. 요람에서 무덤까지 데이터를 재활용한다.

계측기 데이터에서는 업체의 협력을 얻어 장치 내부 데이터(이진 데이터)의 서식을 수집했다. 이 서식은 계측기의 종류 및 품번에 따라 다르다. 전압 변화와 흡광 스펙트럼 등의 계측 조건 및 계측치가 어떻게 격납되어 있는지가 장치에 따라 다르다. 물재기구는 2개 사로부터 서식 정보를 받아 내부 데이터를 AI 등이 읽을 수 있도록 고치는 자동번역 툴을 정비 중이다.

-- 유저가 열망 --
계측기 업체에 따라서는 데이터는 자사의 분석 소프트웨어로 하길 바란다. 장치와 분석 소프트웨어 두 측면에서 유저의 독점이 진행되고 있다. 다만 물재기구의 하시모토(橋本) 이사장은 “화학회사 등의 계측기 유저로부터는 더욱 강력하게 진행해주길 바란다며 독촉 받고 있다.”며 쓴 웃음을 짓는다. 물재기구 재료데이터 분석그룹의 요시카와(吉川) 팀장은 “협력하는 장치 업체는 독점은 불가능하다고 생각하고 있다. 데이터를 자유롭게 두어 그 너머의 솔루션을 신속하게 취하는 전략을 그리고 있다.”고 설명한다.

때문에 중요한 것이 데이터의 수명이다. 현재는 장치의 품번이 폐지된다면 내부 데이터는 읽을 수 없게 된다. 번역 툴을 사용해 축적한다면 재활용할 수 있다. 요시카와 팀장은 “검색 및 라이선스를 갖추어 AI처럼 신기술에도 대응하는 등 수명을 늘리는 데이터 관리가 필요하다.”고 강조한다.

논문에 게재된 실험 데이터의 재활용도 중요하다. 물재기구 재료데이터베이스그룹의 이시이(石井) 팀장은 자연 언어 처리 기술로 과거의 방대한 논문에서 물성치를 수집하고 있다. 고분자 재료에서는 6만 보의 문헌에서 100종의 물성치를 수집했다.

이시이 팀장은 “물재기구의 전문가가 논문을 읽고 수집해 온 데이터의 12년 분을 AI는 1~2주 동안 수집한다.”고 말한다. 정확도는 90% 이상으로 빅데이터 분석에는 충분한 질과 양이다. 이 문헌 데이터를 토대로 계측기의 데이터를 분석하는 기술을 개발 중이다. 재료구조의 추정 등 연구자가 데이터를 해석하기 쉽게 된다.

물재기구는 이러한 데이터 수집 및 처리, 분석, 축적, 관리, 공개의 기능을 갖춘 통합 데이터 플랫폼을 구축 중이다. 2020년에 기구 내부에서 운용을 시작해 2021년에는 기구 외부에서 이용 개시를 목표로 한다. 데이터 시스템 그룹의 가도히라(門平) 팀장은 “과제는 데이터 공유를 연구자와 기업이 수용할 지 여부다.”고 지적한다.

물재기구의 나가노(長野) 이사는 “기업의 경영진으로부터는 ‘같은 그룹의 회사라도 데이터 공유는 하고 싶지 않다. 하지만 데이터는 연계시켜 더욱 광범위하고 다이내믹하게 분석하고 싶다.’라는 모순된 요망을 받는다.”고 밝힌다. 경쟁에 맡기면 연계가 추진되지 않기 때문에 선도자 역할로써 기대가 모인다.

-- 끝 --

List