일본산업뉴스요약

AI로 상식을 뛰어넘는 신약 개발 실현 -- 유전자 발현과 화합물 합성에도 착안
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2024.5.9
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2024-05-19 21:01:37
  • 조회수207

Nikkei X-TECH_2024.5.9

AI 신약 개발 플랫폼 'DAIA'의 도전
AI로 상식을 뛰어넘는 신약 개발 실현
유전자 발현과 화합물 합성에도 착안

산학 연대의 신약 개발 AI(인공지능) 프로젝트 ‘DAIIA’에서는 기존의 신약개발 프로세스를 효율화하는 AI 뿐만이 아니라, “근미래적인 신약 개발”(나고야(名古屋)대학 대학원 정보학연구과의 야마니시(山西) 교수)을 실현하는 AI 개발도 추진하고 있다. 기존의 신약 개발 AI로는 어려웠던 '도전적 신약 개발'을 실현해 일본 제약기업들이 경쟁력을 높여나갈 수 있도록 할 계획이다.

“기존 방법으로는 제안할 수 없는 단백질이나 화합물의 단서를 얻을 가능성이 있다”. 나고야대학의 야마니시 교수는 DAIIA 에서 자신이 담당하고 있는 ‘오믹스(OMICS) 데이터를 포함한 다계층 데이터를 고려한 신약 개발 AI’에 대해 이렇게 말한다. 오믹스 데이터란 유전자 발현(유전자 정보에 근거한 단백질 합성)에 관한 생명 정보 등을 가리킨다.

DAIIA 에서 개발이 진행되고 있는 AI는 크게 세 가지로 나뉜다. '화합물 프로파일 예측 AI'와 '신규 화합물 제안 AI', 그리고 앞서 언급한 오믹스 데이터를 포함한 다계층 데이터를 고려한 신약 개발 AI이다.

이들 중 화합물 프로파일 예측 AI와 신규 화합물 제안 AI 는 조합되어 사용된다. 각 AI에서는 질환의 원인인 단백질(타깃)과 약의 후보인 화합물의 관계(활성치), 화합물의 성질(체내 동태나 독성 등) 등을 학습시킨다. 학습 데이터는 기본적으로 실험 등을 통해 얻은 것이기 때문에 AI가 제안하는 화학 구조의 범위는 한정된다.

이 한계를 타파하려는 것이 오믹스 데이터가 포함된 다계층 데이터를 고려한 신약 개발 AI이다. 유전자 발현 정보를 학습시키거나, 기존에는 검토 범위 밖이었던 구조나 원소를 대상으로 함으로써 학습 데이터가 존재하는 화합물과는 크게 다른 화학 구조를 발견할 수 있게 된다. 또한 설계한 화합물 합성 방법을 예측하는 AI 개발도 추진하고 있다.

구체적으로는, 크게 4 종류의 AI를 개발하고 있다. '오믹스 데이터 기반한 온·오프 타깃 예측 AI', '이종 데이터 융합을 통한 신규 구조 생성 AI', '구조 생성이 가능한 케미컬 공간 확충', '구조 생성의 신규 알고리즘'이다. 각각에 대해 소개한다.

-- 오믹스 데이터 등을 이용한 AI로 단백질이나 화합물을 예측 --
오믹스 데이터에 기반한 온·오프 타깃 예측 AI는 화합물이 작용하는 단백질을 찾기 위한 AI이다. 화합물과 그 화합물을 세포에 반응시켰을 때의 유전자의 활동 정도(유전자 발현 프로파일)를 입력하면, 그 화합물의 타깃이 될 수 있는 단백질을 출력한다.

입력 데이터는 생물 실험으로부터 취득할 필요가 있지만, “최근에는 저비용으로 데이터를 취득할 수 있다”(야마니시 교수)라고 한다. 이를 통해 제약기업이 독자적으로 보유한 화합물에 대해 새로운 치료 효과나 부작용을 예측할 수 있다.

이 AI에는 주로 공공데이터를 사용해 화합물과 그 화합물이 작용하는 단백질, 화합물을 세포에 반응시켰을 때의 유전자 발현 패턴이 학습되어 있다. 이를 통해 유전자 발현 패턴이 작용하는 단백질을 예측할 수 있다. 하지만, “유전자 발현 실험 데이터에는 결손값도 있기 때문에 보완해 정밀도를 높이고 있다”(야마니시 교수)라고 한다.

이종 데이터 융합을 통한 신규 구조 생성 AI는 오믹스 데이터 등을 이용해 화합물의 구조를 생성하는 AI이다. 입력 데이터는 '오믹스 데이터에 기반한 온·오프 타깃 예측 AI'와 유사해 생물 활성 데이터나 유전자 발현 데이터 등의 생명 정보, 화합물 구조나 반응에 관한 화학 정보 등을 취득할 필요가 있다.

표적이 되는 단백질을 활성화하는 화합물 작성하고 싶은 경우에는 그 유전자를 과발현시킨 상태의 데이터를, 단백질을 저해하는 화합물 작성하고 싶은 경우에는 단백질의 유전자를 녹다운한 상태의 데이터를 입력한다. 예를 들어, 이종 데이터 융합을 통한 신규 구조 생성 AI로 글루타미나아제에 대한 억제제를 생성한 결과, 선행 연구보다 결합 친화성이 높은 화합물을 생성할 수 있었다고 한다.

기존의 신약 개발 AI는 이미 발견된 단백질과 화합물의 데이터를 학습해 이를 기반으로 새로운 화합물을 출력한다. 이 때문에 학습 데이터가 존재하지 않거나, 구조가 크게 다른 화합물을 고정밀도로 예측하기 어려웠다.

“연구 기간이 그리 길지 않은 단백질을 대상으로 한 화합물 등, 단서가 없는 상황일 때 이 신약 개발 AI가 유용하다. 한편, 학습 데이터가 풍부하게 있는 경우에는 기존의 신약 개발 AI를 사용하면 된다”라고 야마니시 교수는 설명한다.

-- 합성 가능 여부도 AI로 예측 --
유전자 발현을 이용한 AI는 기존 방법으로는 예측할 수 없었던 화합물과 단백질을 발견할 수는 있지만, 신약 개발 용도로는 보완적이다. 이에 대해 야마니시 교수는 “기존에는 불가능했던 것을 실현하는 2가지 AI도 개발하고 있다.

그 중 하나가 설계한 화합물의 합성 경로를 예측하는 AI이다. “약으로서의 성질에서 예측한 화합물일지라도, 실제로 합성이 가능할지 여부는 모른다 그래서 원료나 반응 경로를 심층학습시킨 모델을 준비해 제안된 화합물의 합성 경로를 출력하거나, 합성 경로가 간단한 화합물의 구조를 출력하기도 한다”(야마니시 교수).

또 하나는 기존의 신약개발에서는 별로 사용되지 않았던 구조나 원소로 대상을 넓히는 ‘케미컬 공간의 확대’이다. 의약품 구조의 일부분을 대체해 그 성질을 개선할 때 사용된다. 화합물을 설계한 후, 옵션으로 이용할 수 있다.

예를 들어, 약의 후보 화합물에서 독성이나 대사과정 등의 성질이 불충분하다고 판명될 경우, 개발이 좌절되는 케이스가 있다. 이러한 케이스에서 화합물의 일부 구조를 교체하면 성질이 개선될 가능성이 있다. 야마니시 교수는 “사람이 예상할 수 없는 구조를 제안하는 케이스에 유용하다”라고 설명한다.

DAIIA는 2025년 이후, 사업화를 위한 준비를 개시. 복수의 AI를 활용할 수 있는 플랫폼을 제공할 방침이다. 일본 제약기업들이 잘 활용한다면 해외 대형 제약회사들에 대항하는 무기가 될 것이다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록