일본산업뉴스요약

AI 신약개발에 대규모 모델 -- 신약 후보를 고정밀도로 예측
  • 카테고리바이오/ 농생명/ 의료·헬스케어
  • 기사일자 2024.1.18
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2024-01-25 23:33:14
  • 조회수162

Nikkei X-TECH_2024.1.18

AI 신약개발에 대규모 모델
신약 후보를 고정밀도로 예측

‘대규모 언어 모델(LLM)의 화합물 버전을 만들겠다’. 이러한 목표를 내걸고 AI(인공 지능)를 활용한 신약개발(AI 신약 개발)을 추진하고 있는 스타트업 ‘신세틱게슈탈트’(SyntheticGestalt, 도쿄). 우크라이나의 에나민(Enamine)이 보유한 화합물 데이터베이스를 이용해 신약으로 이어지는 저분자 화합물 발견을 위한 대규모 AI 모델 구축을 진행하고 있다.

기존 대비 20배 이상의 화합물 데이터로 학습시켜 AI 모델 성능을 크게 높였으며, 이 모델을 2024년 3월부터 외부에 제공할 예정이다.

신세틱게슈탈트가 제공하는 것은 ‘사전 학습 모델’이라고 불리는 것. 그 이름과 같이 대량의 데이터를 이용해 사전에 학습시킨 기계학습 모델이다. 이것을 기반으로 해 특정 태스크용으로 ‘파인 튜닝’을 실시해서 이용할 수 있다.

신세틱게슈탈트는 의약품의 재료가 되는 저분자 화합물을 발견하기 위한 사전 학습 모델을 개발하고 있다. 이 사전 학습 모델을 외부 기업에 제공하는 것 외에도 자사에서 이용해 독자적인 기계학습 모델을 구축할 방침이다.

AI 신약 개발에서는 기계학습 모델을 이용해 다양한 종류의 화합물이 저장된 데이터베이스에서 신약 후보가 되는 화합물을 도출. 그 다음, 도출한 화합물들을 실제로 시험·검증한다. 그 결과를 바탕으로 최적화를 도모하고 신약 실현으로 연결한다.

-- 3차원 구조도 추가 --
신약 후보 화합물들을 도출해도 실제 시험에서 효과가 없으면 의미가 없다. 신세틱게슈탈트의 창업자이자 대표이사 겸 사장인 시마다(島田) 씨에 따르면, 지금까지 AI 신약 개발 분야에서는 기계학습 모델의 예측 정밀도가 충분하지 않아 선별한 화합물의 데이터상의 성능은 높지만 실제로 시험해 보면 성능이 낮다는 문제에 어려움을 겪어왔다고 한다.

후보가 된 화합물의 시험·검증 등에는 약 18개월이나 걸린다. 실제 성능이 낮을 경우 그 기간은 낭비가 되기 때문에 예측 정밀도가 높은 신약 AI가 강하게 요구되어왔다.

이를 해결하기 위해 신세틱게슈탈트는 화합물의 3차원(3D) 구조 데이터도 추가해 학습시킨 고정밀 기계학습 모델을 개발해왔다. 대부분의 경쟁사들은 그래프 구조라 불리는 평면적인 정보만을 이용한다. 3D 데이터는 정보량이 많기 때문에 정밀도 향상을 도모할 수 있다고 한다.

또한 신세틱게슈탈트는 학습에서 이용하는 화합물의 종류를 대폭 늘려 기계학습 모델의 정밀도를 높이고 있다. 이 학습에 이용하는 것이 에너민이 보유하고 있는 저분자 화합물의 데이터베이스이다. 지금까지 약 40억 가지 종류에 이르는 저분자 화합물 가운데 4,000만 가지 종류를 선별해 학습에 이용하여 사전학습 모델을 구축했다.

향후에는 한층 더 학습을 진전시켜나갈 방침이다. 약 380억 가지 종류의 저분자 화합물의 데이터에서 약 10억 가지 종류를 선별해 사전 학습 모델의 학습에 이용. 이를 통해 사전 학습 모델의 예측 정밀도를 대폭 높여나갈 것이라고 한다.

학습에 이용하는 화합물의 데이터가 늘어나는 만큼 더 많은 계산 자원이 필요하게 된다. 그래서 신세틱게슈탈트는 반도체 상사인 맥니카(MACNICA, 요코하마 시)가 제공하는 계산 자원 서비스를 이용했다. 이 서비스에서는 엔비디아의 GPU 및 소프트웨어 등을 이용할 수 있다.

화합물을 선별하는 데이터베이스도 에너민의 것을 이용하고 있다. 지금까지 약 40억 가지 종류의 화합물에서 선별해왔지만, 향후에는 약 380억 가지 종류로 확대할 계획이다. 그만큼 신약으로 이어지는 화합물을 발견할 가능성이 높아진다.

-- 자사의 신약 개발도 추진 --
2018년에 설립된 신세틱게슈타르트는 누적 1,400만 달러(약 20억 엔)를 조달했다. 신세틱게슈타르트는 주로 솔루션 사업과 신약 개발 사업을 전개하고 있다. 솔루션 사업에서는 이산화탄소 및 플라스틱쓰레기 저감 등 환경 부하 저감을 위한 새로운 물질이나 새로운 합성 생물 개발 프로젝트를 기획 단계부터 구현까지 지원한다.

신세틱게슈탈트는 신약 개발에서 세 가지 사업을 전개하고 있다. ①자사의 기계학습 모델을 통해 신약으로 이어지는 저분자 화합물을 개발하는 ‘자사 AI 신약 개발 사업’, ②자사의 기계학습 모델의 일부를 SaaS(서비스형 소프트웨어)로서 외부 기업에 제공하는 ‘AI 신약 개발 SaaS 사업’,

③사전 학습 모델 개발 등을 실시하는 ‘화합물 생성 AI 사업’ 등이다. ③에서 개발한 사전 학습 모델을 ①이나 ②에 활용. 또한 본격적으로 AI 신약 개발을 추진하는 제약회사를 대상으로 사전 학습 모델을 이용한 공동 연구를 실시하는 것도 상정하고 있다.

신세틱게슈탈트는 솔루션 사업을 전개하고 있으며, 고바야시제약(小林製藥)과 도쿄가스 등이 고객이다. 신약 개발 사업 중 ①과 ②를 개시했다. SaaS 사업은 안정적인 성장이 전망된다고 한다. ①의 자사 AI 신약개발 사업으로 유효한 신약 후보 화합물을 제약회사 등에 팔면 큰 수익을 얻을 수 있다.

<키워드>
AI 신약 개발: AI(인공지능)를 활용한 신약 개발을 말한다. 신약 개발에 있어서 연구 개발 기간은 가장 길고 성공률도 낮기 때문에 신약 개발에는 많은 비용이 든다. 최근 개발 기간 단축과 성공률 향상을 위해 AI를 이용하는 움직임이 활발하다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록