책 커버 표지
일경일렉트로닉스_2018/02_인공지능(AI), ‘초인’의 영역으로
  • 저자 : 日経BP社
  • 발행일 : 20180120
  • 페이지수/크기 : 98page/28cm

요약

Nikkei Electronics_2018.2 특집요약(p18~39)

인공지능(AI), ‘초인’의 영역으로
심층학습으로 인간형 로봇이 아닌 초인(超人) 로봇을 개발

인간형 로봇이 한층 더 사람에 가까워졌다. 2017년 11월말, ‘2017 국제 로봇전’ 전시장. 도요타자동차의 부스를 겹겹이 에워싼 인파는 등장한 로봇 ‘T-HR3’의 시연에 감탄을 쏟아냈다. 한쪽 발을 들고 밸런스를 잡으며 멀리 공을 던지는가 싶더니, 축구공을 차는 제스처 및 우사인 볼트의 포즈까지 연이어 반복되는 동작들이 마치 사람을 방불케 했기 때문이다.

그러나 로봇이 아무리 사람과 흡사한 움직임을 추구한다고 해도 그것만으로는 사람과의 결정적인 차이를 부정할 수 없다. 그 둘 사이에는 높은 장벽이 존재하며, 그것은 바로 로봇에게 자립성이 없다는 것이다. 현재 존재하는 모든 로봇은 기본적으로 사람의 지시를 따르도록 되어있다. 도요타 T-HR3는 원격 조정하는 사람의 움직임을 충실하게 재현한다. 기존의 인간형 로봇의 행동은 사람이 만든 프로그램이라는 지시서에 의해 조정되었다.

자립성의 결여는 로봇의 행동범위를 상당히 제한시킨다. 사전에 동작의 환경을 상정하여 그에 상응하는 행동을 소프트웨어에 입력시킬 필요가 있기 때문이다. 대부분의 로봇이 공장이라는 관리된 환경에서 작업을 하는 것은 그 때문이다. 현재, 자립성을 가진 것으로 보이는 로봇이 있다고 하더라도, 정교한 프로그래밍과 치밀한 코딩에 의한 결과물일 뿐이며, 사람에 필적하는 행동의 실현과는 거리가 멀다고 할 수 있다.

그러나 이런 상황도 조만간 바뀌게 될 전망이다. 사람과 로봇을 나누는 장벽을 무너뜨리는 기술이 등장했기 때문이다. 대량의 데이터로 학습시킨 딥 뉴럴 네트워크(DNN)를 활용하는 인공지능(AI)기술인 ‘심층학습’이 바로 그 주인공이다.

2017년 12월에 심층학습용 반도체로 세계 선두를 독주하고 있는 미국 NVIDIA의 CEO, Jensen Huang 씨는 도쿄에서 열린 자사 이벤트에서 다음과 같이 선언했다. “자립적으로 움직이는 로봇의 시대가 올 것이다”. 2020년경에 실용화되는 자율주행차를 시작으로, 농업기계 및 건설기계, 다양한 로봇이 스스로 생각하고 행동하기 시작한다는 것이다.

심층학습이 기계에게 가져다 주는 능력은 크게 2가지이다. 이미 사람을 능가하는 화상인식 등을 바탕으로 한 상황 인식기능. 그리고 인식결과를 토대로 적절한 행동을 생성∙실행하는 제어기능이다. 두 가지 모두 사람에 의한 프로그래밍의 범위를 뛰어넘은 성능을 기대할 수 있다.

자동차 및 로봇을 주특기로 하는 다수의 일본 기업이 이와 같은 로봇 능력의 실용화에 나섰다. 우선은 사람만이 할 수 있었던 작업을 로봇으로 대체한다는 것이 목표이다. 그 이후에는 초인적인 기능을 갖춘 기계들이 등장하게 될 것이다. 그로 인해 자율주행차는 사고를 최소화 해 나갈 것이고 산업용 로봇은 숙련된 인간을 뛰어넘을 것이다. 또한 로봇이 일하는 농장에서는 무농약 야채가 저렴하게 판매되며 인류는 드디어 가사로부터 해방되게 될 것이다.

기계의 개발 프로세스 또한 점차 사람의 손을 빌리지 않게 될 지도 모른다. 현재는 개별 용도에 맞춰 AI 전문가가 적절한 알고리즘을 조합하여 필요한 데이터를 끌어 모을 필요가 있다. 한편, 세계 탑 클래스의 두뇌가 절차탁마 하는 맹렬한 경쟁으로 심층학습의 알고리즘은 매일같이 진화하고 있고 실용화도 병행해 추진되고 있다. 데이터로부터 추출된 지식은 기계가 재이용할 수 있는 형태로 축적되고 있다. 화상인식의 콘테스트에서 심층학습이 일약 주목을 받게 된 지 아직 5년밖에 지나지 않았지만, AI가 AI를 만들어 내는 날도 그리 멀지 않았다.

제 1부: 다음의 성장 단계로
행동 제어도 뉴럴 네트워크, 일본은 실용화 VS 구미(歐美)는 연구

각종 로봇을 비롯해 다양한 기계가 자립적으로 움직이는 시대가 다가오고 있다. 딥 뉴럴 네트워크 (DNN)를 이용한 기계의 행동을 제어하는 기술이 그것을 가능케 하고 있다. 최적으로 제어할 수 있는 DNN을 시행착오를 통해 개발하는 ‘심층강화학습’이 실용화되면서 2018년에는 실제 제품으로의 채택이 시작될 전망이다.

AI가 새로운 성장 단계에 들어섰다. 사람 못지 않는 상황인식 기능과 더불어 스스로의 판단으로 행동하는 능력을 지니게 되었다. 이것을 가능하게 한 것이 딥 뉴럴 네트워크(DNN)이며 기계의 움직임과 내부 상태를 제어하는 기술이다.

DNN을 제어에 사용하는 장점은 사람만이 할 수 있다고 인식해 왔었던 작업을 사람보다 훨씬 뛰어난 능력으로 실행할 수 있다는 가능성에 있다. 실행시키고 싶은 동작에 관한 대량의 데이터를 제공함으로써 DNN은 제어 방법을 스스로 터득한다. 데이터 안에 존재하는 추상적인 지식을 찾아내기 위해 처음 맞닥뜨리는 상황에서도 동일한 장면에서 유추해 적절한 대응을 할 수 있게 된다. 사람처럼 경험을 통해 배움으로써 변화무쌍한 현실 속에서도 유연하게 행동할 수 있는 것이다.

-- 관리된 장소에서 현실 공간으로 --
-- 시행착오로 최적의 방법을 찾는다 --
-- 현실론인가 이상론인가 --


제 2부: 현실론
사람을 보고 배워, 사람을 초월하는 사업화로 선봉을 다투는 일본 기업


심층학습을 이용한 제어기술이 자동차 및 각종 로봇, 화학 플랜트 등으로 확산되기 시작했다. 앞으로 다가 올 거대한 시장을 노리고 몇 몇의 일본기업이 2018년 이후에 잇따라 실용화한다는 계획이다. ‘정답’을 알 수 없는 미지의 영역인 만큼, 각 기업은 자신들만의 독자적인 연구에 주력하고 있다. 여기에서는 선행하는 기업의 도전을 소개하겠다.

“누구도 만들지 않은 것을 만든다”, “선두를 탈환하러 간다”---. 심층학습을 활용한 제어 기술의 개발자로부터 기세 등등한 말이 잇따라 튀어나온다. 다가오는 미래에 새로운 거대시장이 펼쳐져 있기 때문일 것이다. 사람만이 할 수 있었던 작업을 대신하는 기계는 기존 업계의 질서를 무너뜨릴 뿐만 아니라 완전히 새로운 세계를 열어갈 가능성마저 내포하고 있다. 미국 NVIDIA의 CEO인 Jensen Huang 씨는 2017년 12월의 자사 이벤트에서 “자립형 동작 머신(Autonomous Machine)의 시장은 4,000억 달러가 될 것이다”라고 주장했다.

각 사가 기세 등등한 것은 원래 일본이 잘하는 분야라는 자부심이 깔려있기 때문이다. 일본은 자동차 및 로봇, 건축 기계와 같은 제품에서 높은 점유율을 차지하고 있을 뿐만 아니라, 심층학습에서 무엇보다 중요한 현장의 데이터를 수집하기 쉬운 입장에 있다. 구글을 비롯한 구미 IT기업이 아무리 뛰어난 알고리즘을 개발했다고 해도, 데이터가 없다면 아무 소용이 없게 된다. 자립형 머신을 심층학습의 다음 무대로 생각하고 있는 NVIDIA의 Huang 씨는 “일본의 시대가 도래했다”고 일본을 치켜세우고 있다.

앞서가는 업체들은 시행착오를 통해 개발을 진행하고 있다. 현실 세계에서 기계의 동작을 제어하기 위해 심층학습을 적용한 사례는 아직 없기 때문이다. 특히, 기대를 모으고 있는 심층학습을 잘 구사하기 위해서는 많은 연구가 필요하다. 많은 기업이 사람의 동작을 모방시키는 등을 통해 딥 뉴럴 네트워크(DNN)를 어느 정도 학습시켜, 시행착오를 이용한 방법을 적용시키는 단계를 밟고 있다.

-- 세계 모델도 고려해 작동 --
심층학습을 이용하여 개발하는 기계 중에서도 가장 난이도가 높은 것이 자율주행차다. 이 난문에 전면으로 대응하고 있는 것이 벤처기업인 Ascent Robotics이다. 당사가 내건 목표는 좁은 길이 많은 등, 다른 나라에 비해 어려운 운전 환경에 있는 일본 국내에서 사람이 일체 관여하지 않는 완전 자율주행을 실현하는 것이다. 2020년~2021년 발매되는실제 자동차에서의 탑재를 목표로, 다수의 국내 대형 자동차 업체와 공동으로 개발하고 있다.

당면한 난관을 뚫기 위해 당사가 선택한 것은 물리법칙을 토대로 현실 속의 움직임을 예측하는 기능 등을 포함하여 자율주행차용 소프트웨어의 전체에 다수의 DNN을 활용하는 방법이다. 이에 따라 규칙을 기반으로 한 시스템으로는 대응이 안 되는 복잡한 상황 판단도 가능하게 된다고 한다. 당사는 자세히 밝히고 있지는 않지만, 심층강화학습의 최신 지식을 여러 개 도입해 실현하려고 하고 있다.   

-- 기계학습 중 한가지 수단으로 이용 --
심층학습 기술을 전면적으로 이용하는 Ascent Robotics와 대조적인 것이 세븐 드리머스 래버러토리스(Seven Dreamers Laboratories)이다. 당사는 2018년도에 발매 예정인 전자동으로 옷을 개주는 ‘런드로이드(laundroid)’의 동작의 일부를 심층강화학습을 이용하여 개발했다고 한다. 사람 손에 의한 설계 및 다른 기계학습 기술 등과 나란히 평가하여 이점이 있을 것으로 판단되는 부분에 사용했기 때문이다. 심층강화학습의 실력을 가려내기 위해서는 이 방법이 좀더 현실적일 수도 있다.

-- 우선은 지도 학습으로 --
심층강화 학습에 의한 시행착오를 가능한 줄이기 위해서 사람에 의한 지시를 조합시키는 방법을 검토하고 있는 곳이 파나소닉이다. 2017년 2월에 설립한 파나소닉-산업기술총합연구소(산총연) 선진형 AI 연계연구 라보(Lab)에서 물류창고를 상정한 로봇의 동작을 심층학습으로 제어하는 실험을 추진하고 있다.

당사가 착안한 것은 다수의 상품이 꽉 찬 상자가 기울어진 상태에서 로봇이 상품을 흡착하여 들어 올리는 작업이다. 실제의 창고에서는 사람 손을 필요로 하는 작업이며, 로봇으로 대체한다면 흡착 후의 흔들림 때문에 상품이 떨어지지 않도록 궤도를 생성해야 할 필요가 있다. 화낙이나 야스가와(安川)전기의 로봇이 물건을 잡기 전의 동작을 대상으로 한 것에 반해, 잡은 후의 행동을 모색하는 형태이다.

-- 사람의 지식 강화 학습을 겸용 --
-- 사람의 동작을 예측해 습득 --
-- DNN에 의한 모델 위에서의 강화학습 --


■ 역(逆)강화 학습, 본보기로 대가를 가시화
현실 세계에서는 같은 동작이라도 능숙한 사람과 서툰 사람이 있다. 예를 들어 운전이 특기인 사람은 무엇을 기준으로 행동하고 있는지를 알면 운전의 지원 및 안전성의 확보에 도움이 된다. 이런 경우 사용하는 방법이 역 강화학습이다.

역 강화학습은 모범적인 행동을 토대로, 그것이 어떤 대가에 의해 실현되고 있는지를 역산하는 방법이다. 행동 중의 각각의 상태에 대응하는 대가를 요구한다. 예를 들어 처음부터 사람 손으로 설계한 특징양의 선형(線型)관수 등으로 대가를 나타내며 그 무게를 추정한다. 최근에는 대가를 뉴럴 네트워크로 표시하는 방법도 등장했다.

각종 데이터 분석을 하고 있는 브레인패드는 역강화학습을 사업에서 활용하는 것을 검토하고 있다. 시험적으로 대학 내에서의 보행자와 자전거가 가기 쉬운 경로를 찾아낼 수 있는 것을 확인했다. 동일한 방법으로 점포내의 사람의 흐름을 분석하거나, 점포 내의 사람의 흐름을 분석할 계획이다.

■ 자발적인 지식을 획득, 대화 로봇의 반응을 연구
기존의 기술을 사용하면서도 경험으로부터 배우는 기능을 제품에 탑재하는 것은 연구 방법에 따라 가능하다. 히타치 제작소는 이용자의 질문에 반응하는 로봇이 대답을 못할 경우, 상대방에게 다시 물어봄으로써 자연스럽게 지식을 늘리는 기능을 개발했다. 로봇과 인간이 적절하게 역할을 분담함으로써 시스템 전체를 효율적으로 개선할 수 있는 좋은 사례라고 할 수 있겠다.

이 기술의 열쇠는 질문에 대답하지 못한 원인을 질문의 표현 문제와 지식의 결여 문제인 2가지로 나눌 수 있다. 첫 째는 이용자의 질문이 다른 표현의 질문과 같은 의미인지를 되물어 본다. 같다는 것이 파악되면 그곳에서 질문을 바꿔 말하는 법을 추측하여 다른 질문에도 동일한 표현을 적용시킴으로써 새로운 지식을 늘리게 된다. 두 번째의 경우는 시스템 관리자에게 지식의 추가를 의뢰하거나 할 수 있다.

제 3부: 이상적인 모습
궁극의 목표는 범용 지능, 뇌의 모방이나 메타학습에 기대


구미(歐美)의 기업 및 연구기관들은 새로운 심층학습 알고리즘을 맹렬한 기세로 개발하고 있다. 보다 폭넓은 문제에 적용할 수 있는 방식을 실현하기 위해 뇌의 구조의 모방 및 ‘메타학습’이라는 방법이 활발하게 이용되고 있다. 연구개발의 최전선에 있는 영국 DeepMind와 미국 OpenAI의 연구 사례를 소개하겠다.

영국 딥마인드를 이끌고 있는 Demis Hassabis 씨의 원동력은 다채로운 용도로 활용할 수 있는 범용의 인공지능을 개발한다는 신념이다. 당사를 일약 유명하게 만든 ‘비디오 게임을 플레이 하는 AI’는 동일한 학습 알고리즘과 DNN의 구조로 수십 개의 게임을 마스터했다. 세계 바둑 챔피언을 이긴 ‘알파고’도 ”그 기반이 된 기술은 범용기술이며 다른 분야에도 폭넓게 적용될 수 있다”라고 한다. 당사에는 범용 인공지능(AGI; Artificial General Intelligence)용을 상정한 방법의 논문이 나올 정도이다.

그렇다고 해도 사람의 지성이 갖춰진 범용성을 따라잡기에는 아직 멀었다. 새로운 기능을 획득하는 민첩성과 미리 계획을 세워 행동을 하거나 지속적으로 학습하는 능력 등에서 사람에 필적하는 AI는 현재 그 어디에도 없다.

보다 사람에 가까운 범용성을 목표로 딥마인드를 비롯해 많은 기업 및 연구기관들이 새로운 아이디어를 우리에게 제안하고 있다. 여기에서는 연구 개발의 최전선에서 선두를 다투는 딥마인드와 비영리 연구단체인 미국 OpenAI의 연구 사례를 소개하겠다.

-- 에피소드 기억 및 상상력을 재현 --
-- 학습방법을 학습시킨다 --


 -- 끝 --

목차