- 새로운 AI 'GQN' 개발 -- 딥마인드, 이미지로 입체구조 예측/ 사람 공간인식
-
- CategoryAI/ 로봇·드론/ VR
- 기사일자 2018.6.22
- 신문사 일경산업신문
- 게재면 5면
- Writerhjtic
- Date2018-06-29 10:00:36
- Pageview668
새로운 AI 'GQN' 개발
딥마인드, 이미지로 입체구조 예측 / 사람의 공간인식과 유사
미국 구글의 지주회사인 알파벳 산하에서 인공지능(AI)을 연구하는 영국의 DeepMind가 새로운 이미지인식기술을 개발하였다. 2차원의 이미지에서 3차원의 입체를 인식하는 기술로, 이미지인식기술을 개발하는 수고를 크게 줄일 수 있을 것으로 기대를 받고 있다.
개발한 기술의 명칭은 ‘GQN(Generative Query Network)’이다. 미국 사이언스지에 14일 발표하였다. GQN은 뇌의 활동을 모방한 ‘뉴럴네트워크(신경회로망)’ 기술의 일종이다. “동물이나 인간이 인식하듯이 주위의 상황을 관찰하여 인식할 수 있게 된다”. 딥마인드의 리서치 사이언티스트 알리 에슬라미 씨는 딥마인드가 공개한 동영상에서 이렇게 설명한다.
지금까지의 이미지인식기술은 인간의 손에 의해 라벨이 붙여진 ‘정답 데이터’와 그것을 바탕으로 한 학습과정이 필요했다. GQN의 경우는 정답 데이터의 작성 과정이 불필요하기 때문에 이미지인식을 이용한 시스템 개발에 드는 수고를 줄일 수 있다. 또한 생명이 시각을 어떻게 획득해 왔는지를 찾는 힌트가 될 것으로 기대되고 있다.
소니 컴퓨터 사이언스 연구소가 출자하는 AI 스타트업 기업인 GHELIA(도쿄)의 시미즈(清水) 사장은 GQN의 논문을 읽고 “인간이 전혀 알지 못하는 토지에 내려섰을 때 ‘길눈’을 더듬는 것과 비슷한 일이 AI에게도 가능하다는 사실을 알았다”는 인상을 받았다고 한다.
현재는 CG로 작성한 화면으로 실험이 성공한 것에 지나지 않는다. 그러나 시미즈 사장은 “실사로 이와 같은 일이 가능하도록 발전시킨 것을 로봇에 탑재하면 미지의 장소나 혹성 등의 탐사가 가능해지는 등 기대는 크다”라고 말한다.
GQN은 “표현 네트워크’와 ‘생성 네트워크’라는 2개의 부분으로 구성된다. 표현 네트워크는 상황에 관한 정보를 획득할 때에 사용한다. 물체의 색이나 모양 등을 다양한 각도에서 보고 학습하고, 그 세계에 관한 정보(Scene 정보라고 부름)를 획득한다. 생성 네트워크가 생성한 Scene 정보를 이용하여 학습할 때에 본 적이 없는 물질이라도 대상물의 모양 등을 추론한다.
실험에서는 복수의 물체가 랜덤으로 존재하는, 가상공간에서 학습을 시켰다. 학습할 때에 존재하지 않았던 각도나 시점에서도 정확하게 상황을 추측할 수 있었다. 또한 이미지로 입체물의 모양을 정확하게 추론하는 것도 가능했다고 한다.
또한, 로봇팔로 물체를 잡는 처리를 시켰을 경우, 기존의 학습보다도 적은 데이터양으로 정밀하게 인식할 수 있다는 것을 확인하였다. 현시점에서는 아직 CG에 근거하는 합성 이미지밖에 대상으로 할 수 없다. 게다가 기존의 물체 인식 기술을 뛰어넘는 정밀도에는 도달하지 않았다. 딥마인드는 하드웨어 등이 진화하면 현실의 시야에 대한 처리로 발전할 수 있을 것으로 생각하고 있다.
심플한 구조도 특징이다. GHELIA의 시미즈 사장은 “지금까지 심층학습은 복잡한 계층구조를 갖고 있기 때문에 왜 그렇게 되었는지를 설명할 수 없었다. GQN에 의해 이것을 극복할지도 모른다. 그 경우는 심층학습 이외의 분야에도 영향을 미칠 것이다”라고 설명한다.
딥마인드는 GQN과 마찬가지로 사전에 준비한 정답 데이터 없이 지식을 획득할 수 있는 AI의 개발에 주력하고 있다. 예를 들면 딥마인드를 일약 유명한 기업으로 만든 바둑 AI ‘알파고’. 처음에는 프로 바둑기사의 대국 자료를 학습시켰지만 후속 버전인 ‘알파고 제로’는 학습을 시키지 않고도 이전 알파고를 뛰어넘는 바둑 AI로 성장시켰다.
인간도 정답 데이터가 없어도 학습할 수 있다. GQN을 포함하여 정답 없이 학습할 수 있는 기술의 진화는 인간의 지능을 뛰어넘는, 이른바 ‘범용 인공지능’의 개발로 이어질 것이다.
-- 끝 --