일본산업뉴스요약

AI를 최고의 주치의로 -- 의사시험의 정답률 55%
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2017.2.17
  • 신문사 일경산업신문
  • 게재면 2면
  • 작성자hjtic
  • 날짜2017-02-23 10:13:44
  • 조회수622

AI를 최고의 주치의로
의사시험의 정답률 55%

게이오대학은 의사국가시험의 일부를 자동으로 풀이하는 인공지능(AI) 프로그램을 일본에서 처음으로 개발하였다. 게이오대학 이공학부 생명정보학과의 사카키바라(榊原) 교수 연구팀이 담당하였다. 약 1년 전에 개발을 발표한 이후에도 계속 진화하여, 국가시험의 임상문제를 정답률 55.6%(과거 합격자의 평균 정답률은 66.6%)로 풀 수 있을 정도로 진화하였다고 한다. 사카키바라 교수에게 물었다.

Q: 개발 경위는 어떻게 되나요?
「컴퓨터 바둑 프로그램『알파고』가 최고의 바둑기사에게 이겼다는 보도 등을 통해, AI와 사람이 대결하는 이미지를 갖는 사람이 많을지도 모르겠습니다. 그러나 옛날에『딥블루』(IBM)라는 체스 프로그램에 진 사람은,『사람과 AI가 팀을 이루는 편이 더 강해진다』라고 생각하여, 지금은 AI 개발에 참여하고 있는 것 같습니다. 의사의 경우도, 컴퓨터와 의사가 함께 환자를 진찰하는 것이 보다 좋은 의료를 제공하는 데 유효하지 않을까라는 생각에서 개발을 추진하고 있습니다」

「게이오대학병원의 하루 외래환자의 수는 3,000명 정도이며, 연간 100만 건의 진료 기록이 축적됩니다. 저는『과거의 증례와 전자진료카드의 정보를 바탕으로 병명을 자동 진단하는 시스템을 개발한다』라는 것을 최고의 목표로 설정하고, 당면 목표로서 의사국가시험을 자동으로 풀이하는 인공지능 프로그램 구축을 시작하였습니다. 시험이 최종 목표는 아니지만, 시험을 통과하면 그 AI를 신용하지 않을까라는 생각을 했습니다」

Q: AI는 구체적으로 어떻게 학습하나요?
「의사국가시험의 경우, 임상 진단 문제로서『70세 여성. 왼쪽 상복부의 고통을 호소하며 내원하였다. 어젯밤, 오랜만에 손자와 놀고 있었는데 3시간 후부터 왼쪽 상복부에 고통을 느끼면서…』라는 증상에 관한 개요가 쓰여 있습니다. 그리고 원인은 무엇인가라는 물음에, 선택지로서『a.급성췌장염 b.복막혈종 c.장요근 종기…』등의 병명이 표시됩니다」

「AI가 문장을 해석하여,『여성』『복통』『구토』『설사』와 같은 단어를 추출합니다. 또한 수치도 추출합니다. 전후의 단어를 참고하면서, 수치가 무엇을 의미하는지를 AI가 판단합니다. 그리고 부정표현이 어디에 걸리는지, 형용사가 어떤 말을 수식하는지를 해석합니다. 부정표현이 어디에 걸리는지는 매우 중요한 문제이며, 증상이『있다』와『없다』는 완전히 다른 대답입니다」

「다음으로 진단입니다. 다양한 증상에 각각 계수를 할당하여, 증상을 바탕으로 병명을 찾아내는 함수식을 AI가 만들도록 합니다. 환자의 상태와 일치하는 증상만 더하면 병명을 찾아낼 수 있습니다. 이것이 문진과 검사결과를 바탕으로 진단할 수 있는 AI 컨셉입니다」

Q: 학습소재를 계속 제공하면, AI는 점점 올바른 진단을 할 수 있게 되나요?
「기본적으로는 그렇습니다. 단, 아직 과제는 남아있습니다. 예를 들면, 문제 속에 있는 시계열 정보에 대한 의미를 이해하지 못합니다. 한달 전에 발열이 있었고, 일주일 전에 발진이 있었다라고 쓰여 있는 경우, 증상의 시계열을 이해하지 못하면 대답이 나올 수 없습니다. 그러나 이렇게 문장 속에 나열되어 있으면, 그 시간 축을 해석하지 못하는 것이 현실입니다. 조금 더 자연언어 해석으로 개량, 아이디어가 필요하다고 생각합니다」

Q: 그 점이 해결된다면, 임상현장에 AI가 등장하게 되나요?
「의사국가시험은 쓸데없는 정보를 얼마나 배제하는가가 실제로 중요합니다. 헷갈릴 수 있는 키워드가 포함되어 있지만, 그것에 흔들리지 않고 정말로 중요한 키워드를 찾아내는 것이 필요합니다. AI가 진화되어 가기 때문에, 마찬가지로 쓸데없는 정보를 배제하는 기능도 필요하다고 생각합니다. 한편, 의사가 알아차리지 못하는 증상이 정말로 중요하며, 그것을 찾아내는 것이 AI가 됩니다. 그렇게 되면 의사와 AI가 서로 보완해주는 관계가 될 것으로 생각합니다」

「며칠 전 어느 모임에서 들은 이야기입니다. 환자가 통증을 느끼는 부위와는 다른 부위에 질환이 숨어 있는 경우가 있어서, 처음에 방문하는 진료과를 환자가 틀리게 됩니다. 그럴 경우, 전문의는 그러한 사실을 알아차리기 어렵고, 진짜 질환을 놓치게 될 위험이 있다는 이야기입니다. 의사는 질환을 놓치지 않도록 많은 질환, 증례, 진료 포인트를 염두에 두고 있지만, 전문성이 높아 질수록 선입관도 생기기 쉽기 때문에 모든 가능성을 선택지로서 갖기 어려울지도 모르겠습니다. AI라면 다양한 환자의 정보를 모두 입력하여, 놓치기 쉬운 질병도 포함하여 의사에게 제안하는 것을 기대할 수 있습니다」

Q: 처방도 가능하게 될까요?
「기본적으로는 학습이 가능하면 처방도 가능하다고 생각합니다. 단, 그 학습소재가 과제입니다. 진료수가명세서 데이터가 학습 소재가 될 수 있지만, 진료수가명세서에는 의사나 환자의 생각이나 기호가 반영되는 등, 반드시 최적∙최선의 것이 선택되지 않는 경우가 많습니다. 그것을 학습 소재로 한다면 AI는 상당히 곤란해할 것입니다」

Q: AI가 의료현장에 등장하기 위해서는 우선 무엇이 필요한가요?
「의약품은 환자를 대상으로 임상 시험을 실시하여 유효성이 검증되면 세상에 나오게 됩니다. 그것과 마찬가지로, AI가 어떠한 평가를 통해 사회에 나와도 된다고 판단되면 나오게 되겠지요. 그러기 위해서는 평가에 필요한 골드 스탠다드가 되는 데이터 세트가 반드시 있어야 합니다.」

「즉, 이 데이터 세트를 문제로 하여 AI가 대답을 찾았을 때, 그 해답의 정확도가 일정 이상 있으면 된다는 세트입니다. 그것을 제3자가 작성한 것이 아니면 신뢰를 얻을 수 없지만, 그러한 데이터 세트가 아직 준비되지 않았습니다. 그것이 준비되면, 그것을 통과해야 한다는 명확한 목표가 생기기 때문에, 개발은 가속화될 것으로 생각합니다. 어쩌면 의사국가시험은 이 데이터 세트에 적합할지도 모른다는 생각도 듭니다」

「제가 목표하는 것은『최고의 주치의』입니다. 기본적인 성능을 통과한 AI가, 환자 개개인의 이력을 학습한다면 그 환자에게 특화된 룰을 만들 수 있습니다. 다른 사람에게는 적합하지 않지만 그 사람에게만은 최적의『주치의』가 될 것입니다」

「과거의 병력과 그 회복 경과, 그리고 부모와 조부모의 병력 등이 포함돼도 좋습니다. 매일의 혈압이나 혈당의 변화 등도 포함시켜 나가면 그 사람 전용의 AI가 됩니다. 다소 열이 높아도 그 사람에게는 그것이 보통의 일이라면, 실수로『감기입니다』라는 진단을 내리는 일도 없어질 것입니다」

  -- 끝 --

목록