日経コンピュータ

일경컴퓨터_2019/12/12_초인간∙만능 AI -- 구글이 바꾸는 디지털 사회의 미래日経コンピュータ

저자 : 日経BP社
발행일 : 20191212
페이지수/크기 : 98page/28cm

요약

Nikkei Computer_2019.12.12 특집 요약 (p24~37)

초인간∙만능 AI
구글이 바꾸는 디지털 사회의 미래

미국 구글이 개발한 최첨단 인공지능(AI)이 바둑보다 어렵다고 하는 전략 게임에서 인간의 최고 선수를 상대로 승리했다. 또한 의료 및 문장 독해 분야에서도 인간의 능력을 뛰어넘기 시작했다. ‘AI는 복잡한 업무에서 인간을 당해낼 수 없다’라는 상식이 바뀌려 하고 있다. 스스로 학습해 힘을 기르는 AI, 무엇이든 해내는 만능 AI도 더 이상 꿈이 아니다. AI의 진화는 노동인구의 감소가 예상되는 일본 기업에 있어서 반가운 소식이 아닐 수 없다. 뿐만 아니라 전 인류에게도 크리스마스 선물과 같은 존재가 될 지도 모른다.

Part 1. AI의 ‘연승’이 시작된다
게임, 신약 개발, 의료에서

2019년 10월, 바둑보다 어렵다고 하는 전략 게임에서 AI가 인간을 이겼다. ‘고작 게임에서’라고 얕잡아 본다면 본질을 파악하지 못한 것이다. 이미 암진단 등에서도 전문의를 뛰어넘기 시작했다. 그 선두를 달리는 것이 미국 구글이다.

바둑의 세계 최고 프로에게 승리한 AI(알파고)의 개발로 알려진 구글계 AI 개발회사인 영국 딥마인드는 2019년 10월에 또 한번 세계를 놀라게 했다. 자신들이 개발한 AI ‘알파스타(AlphaStar)’가 실시간 전략 게임인 ‘스타크래프트2’의 온라인 대전에서 “세계 상위 0.2% 진입(그랜드 마스터 레벨)을 달성했다”라고 발표한 것이다. 스타크래프트2는 미국 블리자드 엔터테인먼트가 개발해 온라인에서 제공하는 전략 게임이다.

스타크래프트2는 일본어 버전이 없어 일본에서의 지명도는 높지 않다. 그러나 세계적으로는 인기가 높은 게임으로 다수의 ‘프로 게이머’가 존재한다. 스타크래프트2에서 AI가 인간을 이기는 것은 바둑이나 장기에서 이기는 것보다 어렵다고 인식되어 왔다. 따라서 알파스타의 ‘대단한 성과’는 미국 CNN 등의 일반 미디어에서도 취재하는 등, 유럽과 미국에서 관심을 모으고 있다.

스타크래프트2가 AI에게 어렵다고 인식되어 온 것은 바둑이나 장기에 비해 룰이나 판단이 복잡하기 때문이다. 스타크래프트2는 SF를 소재로 한 전략 게임으로서 플레이어는 수백 개의 유닛에 실시간으로 지시를 내려 상대를 공격한다. 바둑이나 장기와 같이 번갈아 두는 턴(Turn) 방식은 아니다.

바둑이나 장기에 비해 ‘시계(視界)’가 좁은 것도 복잡함으로 이어진다. 스타크래프트2 플레이어는 ‘카메라를 통해 지도의 일부만을 볼 수 있다. 플레이어는 한정된 정보를 바탕으로 다음 한 수를 생각해야 할 필요가 있다.

또한 스타크래프트2의 유닛에서는 상대를 공격하는 ‘전투 유닛’뿐만 아니라 자원을 수집해 유닛 및 건물을 만드는 ‘노동자 유닛’ 등 다양한 종류가 있다. 뿐만 아니라 절대적으로 강한 유닛은 존재하지 않으며 유닛의 종류에 따라 가위∙바위∙보와 같은 힘의 관계가 형성되어 있다. 플레이어는 공격 플랜과 같은 단기 전략과 동시에 유닛 생산 계획과 같은 장기 전략도 고려해야 할 필요가 있다.

딥마인드는 ‘심층강화학습’에 의해 알파스타를 개발했다. 컴퓨터가 시행착오를 통해 태스크(Task)를 시행하는 최적의 방법을 학습해나가는 ‘강화학습’과, 뉴럴 네트워크를 여러 단계로 조합한 ‘딥러닝(심층학습)’을 결합시킨 기계학습 방법이다.

심층강화학습에서는 컴퓨터의 플레이어(에이전트)들을 실제로 대결시켜 시행착오를 반복한다. 에이전트는 대결을 축적해나가며 게임에 이긴다는 ‘보수(報酬)’를 얻기 쉽도록 자신의 전략을 갱신해 더욱 강해진다.

-- 약점을 찔러 ‘파괴적 망각’을 방지한다 --
심층강화학습은 알파고의 개발에서도 사용한 방법이지만, 알파스타에서는 여러 종류의 에이전트끼리 대결하는 ‘멀티 에이전트 러닝’이라는 방법을 추가했다. 어떤 스킬을 기억하게 되면 과거에 학습한 스킬을 잊어버리게 되는 ‘파괴적 망각’이라고 부르는 문제를 방지하기 위해서이다.

구체적으로는 가장 강하게 원하는 메인 에이전트와는 별도로, 메인 에이전트의 약점을 찌르는 것에 특화된 ‘착취’ 에이전트를 준비해 메인 에이전트가 파괴적 망각을 하게 되어 약점이 발생하면 착취 에이전트가 그 약점을 찌른다. 그 대결을 통해 메인 에이전트는 한 번 망각했던 스킬을 되찾게 된다.

알파스타의 개발에서는 인간 플레이어에 의한 대결 데이터를 기억하게 하는 교사 학습을 시행함으로써 인간 플레이어를 따라 하는 에이전트를 개발했다. 그것으로부터 에이전트 간의 배틀을 통해 심층강화학습을 보다 강력해지게 했다. 알파스타의 개발에서 에니전트 간의 배틀 회수는 인간 플레이어가 하루 24시간 계속해서 대결한 경우의 200년분에 해당된다고 한다.

딥마인드는 2013년에 ‘스페이스 인베이더(Space Invaders)’ 등의 단순한 컴퓨터 게임을 플레이 할 수 있는 AI를 심층강화학습에 의해 개발해 AI 세계에서 화제가 되었다. 그리고 2년 후인 2015년에 바둑의 최고 프로선수를 이기는 AI를 만들어냈으며 4년 후인 2019년에 복잡한 온라인 전략 게임에서 인간의 최고 플레이어를 이기는 AI를 만들어냈다.

딥마인드는 복잡한 제약 조건 아래 몇 천~몇 만 단계에 이르는 장기 전략을 세울 수 있는 AI의 범용적인 개발 방법을 만들어냈다. 알파스타에서 중요한 것은 바로 이와 같은 사실이다. 딥마인드는 알파스타에서 사용한 개발 방법이 장기적인 기상 변동을 예측하는 AI 및 기후예보 AI 등에도 적용이 가능하다고 한다.

실제로 딥마인드는 2018년 12월에 단백질의 3D구조를 유전자 배열로부터 예측하는 AI ‘알파폴드(AlphaFold)’를 발표했다. 알파폴드는 단백질의 3D구조 예측을 경쟁하는 콘테스트인 ‘CASP(Critical Assessment of Structure Prediction) 2018’의 한 부문에서 1위를 차지했다. 단백질의 3D구조 예측은 신약 개발 등으로의 응용이 기대되고 있다. 게임뿐만 아니라 현실 문제를 해결하는 분야에 있어서도 AI는 인간을 초월하기 시작했다.

-- 폐암 진단에서 의사를 뛰어넘는다 --
-- AI가 AI를 자동 개발 --
-- 핵심은 AI가 스스로 하는 교사학습 --

Part 2. ‘BERT 혁명’의 충격
드디어 독해력도 인간을 초월

문장 독해 분야에서도 인간의 평균 레벨을 뛰어넘기 시작했다. 미국 구글의 새로운 AI기술 ‘BERT’가 인간과의 장벽을 무너뜨려 검색 및 정보 수집 등의 효율이 비약적으로 높아질 가능성이 생겼다.

AI에게 문장 독해는 불가능하다는 것이 수 년 전까지만 해도 상식이었다. 일본의 국립정보학연구소(NII)가 2011년에 시작한 ‘로봇은 도쿄대학에 합격할 수 있을까(도다이(東大) 로봇)’ 프로젝트에서도 AI은 대학입시 센터 시험의 영어 시험에서 장문의 독해 문제 및 단어 정렬 문제에 전혀 능력을 발휘하지 못했다. 도다이 로봇의 AI가 2016년에 센터시험의 영어 문제를 풀었을 당시의 수치 편차는 ’45.1’로 도쿄대학 합격은 도저히 불가능한 레벨이었다.

그러나 미국 구글이 2018년 10월에 발표한 신기술 ‘BERT’로 지금까지의 상식을 일변시켰다. BERT가 문장 독해 문제를 인간보다 높은 정답률로 풀어냈기 때문이다.

BERT는 문장의 ‘자연어’를 예측하는 ‘언어 모델’의 AI기술이다. 자연어 예측은 AI가 단어 및 문장을 이해하거나 자연스러운 문장을 생성하는데 있어서 불가결하다. 자연어를 기준으로 단어와 단어, 문장과 문장의 관계를 벡터에 의해 표현하거나 어느 단어의 다음에 어떤 단어가 이어지는 지 등을 예측하기 위한 기술이다.

구글이 BERT를 사용해 미국 스탠퍼드대학의 문장 독해 벤치마크 ‘SQuAD 1.1’에 도전한 결과, AI로서 처음으로 인간의 평균적인 정밀도를 뛰어넘었다. SQuAD 1.1는 위키피디아 안에 있는 140단어 정도의 문장을 AI에게 파악하게 해 그 문장에 관한 질문에 답하게 한다. 정답은 원래 문장에 문구로서 존재하며 정답 부분을 바르게 골라낼 수 있는 지가 포인트이다. 문장∙질문∙정답을 조합하면 10만가지 이상이다.

스탠퍼드대학이 인간 피험자에게 SQuAD 1.1의 문제를 풀게 한 결과, 원래 문장으로부터 정답을 완전 일치로 골라낸 스코어(정답률)는 82.304%. 부분 일치로 골라낸 스코어는 91.221%였다. 이에 반해 BERT의 스코어는 완전 일치가 87.433%, 부분 일치가 93.160%로 두 가지 모두 인간을 상회했다.

BERT의 이와 같은 성과는 세계 AI 연구자들을 자극했다. 구글이 BERT를 오픈소스로서 공개하는 등, BERT의 개량 판이 잇따라 등장해 한층 더 어려운 언어문제에서 인간을 육박하는 좋은 성적을 내고 있다.

어려운 언어 문제란 예를 들어 자연언어 처리의 통합적인 벤치마크인 ‘GLUE’나 ‘SuperGLUE’를 말한다. 독해와 더불어 환언(換言)이나 표현이 다른 2가지 문장의 의미가 같은지 여부의 판단(합의관계 인식), 단어 끼워 넣기 등의 문제 등이 있다. GLUE에서도 구글, 마이크로소프트, 페이스북, 알리바바 등의 AI가 인간을 뛰어넘는데 성공했다.

-- 상식을 초월한 답변이 가능하게 --
-- ‘빈칸 채우기 문제’로 학습 --

Part 3. 스스로 배우는 AI가 대두
개발자조차 불필요

AI 개발에서 인간의 관여가 적어질수록 우수한 AI가 만들어진다---. 이것은 역사를 바탕으로 한 경험법칙이며 앞으로도 같은 일이 계속될 것이다. 무엇이든 해치우는 ‘만능 AI’의 탄생도 더 이상 꿈이 아니다.

향후에는 AI 개발의 모든 영역에서 인간의 관여가 줄어들수록 AI 성능이 높아질 가능성이 크다. AI연구의 유력 거점인 캐나다 알버타대학의 산톤 교수는 “인간의 지식을 활용하는 방법보다 컴퓨터 파워를 활용하는 방법이 항상 효과적이다. 그것은 70년에 걸친 AI연구의 최대 교훈이다”라고 단언한다. 산톤 교수는 2019년 3월에 ‘씁쓸한 교훈’이라는 칼럼을 인터넷에 공개해 “AI연구자는 향후 AI에게 개발시키는 ‘메타수법’의 연구에 전념해야 한다”라는 시각을 제시했다.

일본의 AI개발 스타트업 기업인 GRID의 소가(曽我) 부사장은 산톤 교수의 지적에 대해 “AI의 개발은 어린이의 교육과 같은 것이다”라고 설명한다. “초등학교 정도까지의 교육이란 교사가 어린이에게 지식은 가르치는 것이다. 그것이 고등학교∙대학교로 진행됨에 따라 교사가 가르치는 것은 주로 학습 방법이나 사물의 사고 방식이며 지식 습득은 학생 본인의 주체적 행동에 의해서이다”(소가 부사장).

다시 말해 인간이 교사 데이터를 주고 AI에게 학습시키는 교사 학습은 초등학교와 중학교까지의 교육에 지나지 않는다. 그 레벨을 통과한 AI에게 필요한 것은 ‘학습하는 방법’을 가르치는 것이다. 그렇게 하면 나중에는 AI가 스스로 학습해나갈 수 있다고 한다.

실제로 최근 AI개발의 주류 또한 AI가 스스로 교사 데이터를 만들어내는 ‘자기 교사학습’ 및 소량의 교사 데이터를 보완하는 ‘반 교사학습’, AI가 AI를 개발하는 ‘전이학습’ ‘메타학습’ 등으로 전환되고 있다.

-- 후지쓰(富士通)연구소는 ‘반 교사 학습’으로 성과 --
-- AI가 시행착오를 통해 AI를 설계 --

-- 만능 AI의 야망도 --
구글은 한층 더 야심 찬 계획을 밝혔다. 구글의 선임연구원이며 소프트웨어의 리더를 맡고 있는 딘 씨는 2019년 7월에 일본을 방문했을 당시, 한 개의 기계학습 모델로 수 백~100만 종류의 태스크(Task)를 처리하는 ‘만능 AI’ 개발을 추진하고 있다고 밝혔다.

1개의 모델에 화상인식 및 음성인식 등 다양한 작업을 학습시킨다. 그 다음 만능 AI의 모델을 만들어 100만 종류 이상의 태스크에 대응하는 것을 목적으로 한다. 학습하지 않은 미지의 태스크에 대해서는 100만 종류의 학습이 끝난 태스크와의 유사성을 통해 어떻게 처리하면 좋은 지를 판단한다.

‘AI가 인간에게 기대지 않고 AI를 개발한다’라고 들으면 AI위협론을 상상할지도 모른다. 그러나 현실은 그렇게 단순하지 않다. AI가 AI를 개발하는 기술에는 현 시점에서 아직 한계가 있기 때문이다.

예를 들어 현 시점에서 자기 교사 학습을 적용할 수 있는 것은 화상이나 음성, 문장 등 데이터 안에 존재하는 규칙성을 추출하기 쉬운 것으로 한정되어 있다. 예를 들어 인간이 작성한 문장에는 문법이라는 규칙성이 존재한다.

GRID의 소가 부사장은 “센서 데이터 등 순수한 수치 데이터를 대상으로 한 AI를 개발하기 위해서는 인간에 의한 데이터의 정형 등이 앞으로도 필요하다”라고 지적한다. 센서가 계측한 데이터가 온도인지 무게인지, 데이터의 단위는 무엇이며 데이터가 몇 초 단위로 예측했는지 등은 AI에게는 헤아릴 수 없기 때문이다.

AI가 인간의 힘을 빌려서가 아닌, 시행착오를 통해 스스로 성능을 높여나가는 강화학습에도 약점이 있다. Preferred Networks(PFN)의 히도(比戸) 집행위원은 “강화학습이 적용되는 것은 컴퓨터 상에서 시행착오 할 수 있는 분야로 한정된다. 강화학습에는 수만 번의 시행착오가 요구되고 있으나, 로봇 및 자동차 등의 실제 기기를 사용한 실제 환경에서의 시행착오는 여러 번으로 늘리는 것이 어렵다”라고 지적한다. 모든 영역에서 AI가 AI를 개발하는 시나리오는 현실감이 떨어진다.

-- AI가 AI의 판단 근거를 설명 --
구글의 클라우드 AI사업을 총괄하는 세스 부사장(VP)은 “AI는 향후 인간을 돕는 방향으로 진화되어 갈 것이다”라고 말한다. 그 중 한 예가 구글이 2019년 11월 21일에 발표한 ‘설명 가능한 AI(Cloud Explainable AI)’라는 클라우드 AI 서비스이다.

설명 가능한 AI는 기존 AI의 뉴럴네트워크의 가동 상황을 분석해 AI에 의한 판단의 근거를 인간에게 알 수 있게 제시한다. 예를 들어 화상인식 AI가 분석 대상일 경우, 피사체를 분류할 때 근거로 한 픽셀을 하이라이트로 표시한다. 표 형식의 데이터일 경우, 데이터의 어느 부분(특징)이 판단에 큰 영향을 주었는지를 수치로 나타낸다.

지금까지 심층학습이 창출해 낸 뉴럴 네트워크는 유저에게 있어서 ‘블랙박스’로 불려왔다. “설명 가능한 AI는 뉴럴 네트워크를 추적함으로써 블랙박스 속을 인간이 이해할 수 있게 설명한다. 설명 가능한 AI에 의해 판단 근거를 제시하지 못하는 AI는 사용할 수 없다는 자세를 보이는 금융기관 등에서도 AI 도입이 확산될 전망이다”라고 세스 부사장은 자신감을 보였다.

AI가 붐이 된지 오래 되었지만, 비즈니스에서의 활용은 이제 막 시작되었다. 계속 편리해지는 AI를 어떻게 사용해 나갈 지가 인간이 당면한 과제라고 할 수 있을 것이다.

-- 끝 --

AI/로봇·드론/VR·AR

요약

목차