일본산업뉴스요약

NEC, 물류 창고 로봇용 AI 기술 개발 -- '세계 모델' 응용으로 인력 작업 대체 가능
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2024.3.8
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2024-03-17 21:42:55
  • 조회수55

Nikkei X-TECH_2024.3.8

NEC, 물류 창고 로봇용 AI 기술 개발
'세계 모델' 응용으로 인력 작업 대체 가능

NEC는 불규칙하게 배치된 다양한 형태의 물품에 대해 정밀한 핸들링 작업이 가능한 로봇용 AI(인공지능) 기술을 개발했다. 아직도 인력에 의지하고 있는 것이 많은 물류 창고에서의 피킹 작업이나 물품의 이동 작업 등에 응용할 가능성이 있다. NEC는 우선, 올해 안에 물류 창고 등의 현장에서 해당 기술의 실증을 추진할 예정이다.

NEC는 영상을 물체 단위로 해석하는 '세계 모델'을 응용해 로봇이 영상 데이터를 통해 작업 환경이나 자신의 동작 결과를 고정밀도로 예측하는 '시공간 예측'과 이것을 기반으로 최적의 정밀한 동작을 자동으로 생성하는 '로봇 동작 생성'으로 구성된 로봇 AI 기술을 개발했다.

세계 모델은 로봇의 자율제어의 열쇠가 될 수 있는 기술로 최근 주목을 받고 있다. 로봇이 어떤 행동의 결과로써 현실 세계에서 무슨 일이 일어날지 실제로 시험하지 않고 예측하는 것을 가능하게 한다. NEC에 따르면, 세계 모델을 베이스로 한 기술을 로봇에 적용해 실행시킨 것은 세계 최초라고 한다.

이번 개발을 담당한 NEC 데이터 사이언스 래버러토리의 오야마(大山) 주임 연구원은 기존의 로봇용 AI와의 차이점에 대해 “지금까지는 교사 데이터를 사용해 어떤 데이터에 대해 패턴 인식을 실시해서 현재의 상황을 파악했다. 한편, 세계 모델은 AI가 시행착오를 거듭해 실제 세계의 구조를 학습하고 이해해 상상력을 획득하는 것”이라고 설명한다.

-- 강화 학습에는 방대한 시간이 필요 --
현재, 로봇 도입에 있어서 가장 큰 과제는 로봇용으로 정비된 환경에서 동작을 정형화해 가동시킬 필요가 있다는 것이다. 양산 공장의 생산 라인 등에서는 도입이 일반화되고 있는 한편, 다양한 형상이나 화물을 취급하고, 선반의 레이아웃 변경이 자주 발생하는 물류 창고 등에서는 로봇 도입이 그다지 추진되고 있지 않는 것은 이 때문이다.

이러한 환경에서는 사람의 경우에는 무의식적으로 할 수 있는 것이 로봇에게는 난이도가 높다. 예를 들어, 선반에 불규칙하게 놓인 물품을 꺼내는 피킹 작업에서는 물품의 형상에 따라 잡았을 때의 움직임이 다르고, 여러 물품이 인접하거나 겹쳐 있을 경우, 가려져 보이지 않는 영역을 예측해 물품이 무너지지 않도록 피킹해야 한다.

기존의 로봇용 인식 기술에서는 보이는 영역을 통해 가려진 영역을 예측하기 위해 물품 등이 가려진 상태를 나타내는 교사 데이터를 대량으로 학습시킬 필요가 있어 실용화가 어려웠다.

세계 모델을 활용한 로봇 제어는 세계적으로 몇몇 연구가 진행되고 있지만, 그 대부분은 ‘강화 학습’을 이용하고 있다. 이 경우에는 거의 모든 대응 패턴을 망라적으로 학습할 필요가 있기 때문에 학습에 수개월~년 단위의 방대한 시간이 걸리는 문제가 있었다.

이에 반해 NEC가 개발한 세계 모델을 응용한 로봇 동작 학습 기술에서는 라벨 부착이 불필요한 교사 없는 학습으로도 정확하게 동작할 수 있게 된다고 한다.

-- 교사 없는 학습으로 영상을 보여주는 것만으로 가능 --
이 학습에 대해서 NEC 비주얼인텔리전스연구소의 시라이시(白石) 주임 연구원은 다음과 같이 설명한다. “구현한 심층학습 네트워크에 오로지 영상만을 계속 보여주고, 다음 시각의 영상을 생성할 수 있도록 했다. 그리고 다음 시각의 영상을 정답 데이터로 제공하는 학습을 반복했다.

예를 들어, 기존에는 영상 내에 다양한 형상의 물품이 있으면 그 형상들을 일일이 알려줘야 했지만, 이번 학습에서는 영상에서 개별 물품의 형상·외관·움직임의 특징량을 구해 그 전이를 예측하고 특징량을 통해 예측 영상을 생성할 수 있도록 했다. 어떤 영상에서 물품의 일부가 빠져도 다양한 영상을 계속 보여주다 보면 자연스럽게 올바른 형상을 파악하게 된다”.

범용적인 동작의 학습에는 시뮬레이터로 생성한 10만 건 정도의 비교적 적은 영상 데이터를 사용. 현장에 도입할 때에는 현실 세계의 물류 창고에 대한 소량의 영상 데이터를 추가한 다음 수일간 튜닝하는 것을 목표로 하고 있다고 한다.

현시점에서 제품화 시기는 미정이지만, 로봇으로의 구현에 대해서는 현장의 상황에 따라 시스템 인테그레이터(SIer)와 조합하거나, 자체적으로 로봇까지 제공하는 것을 상정하고 있다.

실용화를 위한 과제는 크게 2가지가 있다고 한다. 하나는 택트타임(Tack time, 한 개를 생산하는데 필요한 시간). 사람이 있는 환경에서 움직이는 협동로봇은 동작이 느리기 때문에 작업 효율 관점에서 고속화가 요구된다. 또 하나는 태스크의 성공률. 실험 레벨에서의 성공률은 90% 정도이지만, 실제 현장에서는 실패가 허용되지 않기 때문에 실패를 리커버리 하는 구조가 필요하다고 한다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록