니케이 일렉트로닉스 2024/06(2) NEC, 물류창고용 로봇 Ai 기술 개발 -- ‘세계 모델’ 응용으로 사람의 작업을 대체 가능

책 커버 표지
목차

Hot News
- 경제산업성이 라피다스에 5,900억엔 추가 지원, 칩렛 집적 등 후공정에 535억엔
2025년의 파일럿 라인 가동을 위한 설비 투자 및 연구개발이 대상
- Arm이 차량용 시장 독점을 위한 공세 가속화, 소니, 혼다, 덴소와도 연대
차량용 서버에서 차체 제어까지 IP 코어 갖춰
- 도요타·닛산이 참가한 ASRA를 정부도 지원, 2030년에 칩렛형 SoC를 양산차에
기술 기반을 정비해 표준화, 실시간성, 기능 안전 등을 차량용 기준으로
- 인텔이 선언한 유리코어 기판의 실용화, 일본 기업의 공세와 만만치 않은 라이벌 한국계 기업
부재 제조사의 판도 바뀔 가능성도

요약

Nikkei Electronics_2024.6 (p32-33)

Hot News
NEC, 물류창고용 로봇 Ai 기술 개발
세계 모델’ 응용으로 사람의 작업을 대체 가능

NEC는 불규칙하게 배치된 다양한 형태의 물품에 대해 정밀한 핸들링 작업이 가능한 로봇용 AI(인공지능) 기술을 개발했다. 아직도 사람 손에 의지하는 일이 많은 물류창고에서의 피킹 작업이나 물품의 이전 작업 등에 응용할 수 있는 가능성이 있다. NEC는 우선, 2024년 내에 물류창고 등의 현장에서 이 기술의 실증을 진행한다고 한다.

NEC는 이번에 영상을 물체 단위로 해석하는 '세계 모델'을 응용해, 로봇이 영상 데이터에서 작업 환경이나 자신의 동작 결과를 고정밀로 예측하는 '시공간 예측'과, 이를 기반으로 최적의 정밀한 동작을 자동으로 생성하는 '로봇 동작 생성'의 두 가지로 구성된 로봇 AI 기술을 개발했다.

세계 모델은 로봇 자율제어의 열쇠가 된다고 하여 최근에 주목을 받고 있는 기술이다. 로봇이 어떤 행동의 결과로 실세계에서 무슨 일이 일어날지 현실에 시도하지 않고 예측할 수 있게 한다. NEC에 따르면, 세계 모델을 베이스로 한 기술을 로봇에 적용해 실행시킨 것은 세계 최초라고 한다.

개발을 담당한 NEC 데이터 사이언스 연구실의 주임 연구원인 오야마(大山) 씨는 기존의 로봇 전용 AI와의 차이점에 대해 “지금까지는 교사 데이터를 사용해, 어떤 데이터에 대해 패턴 인식을 하고, 현재의 상황을 파악하는 것이었다. 한편, 세계 모델은 AI가 시행착오를 거듭해 실세계의 구조를 학습/이해하고, 상상력을 획득하는 것이다”라고 설명한다.

-- 강화학습에서는 방대한 시간 --
현재, 로봇 도입에서의 큰 과제는, 로봇 전용으로 정비된 환경에서 동작을 정형화해 가동시킬 필요가 있는 것이다. 양산 공장의 생산라인 등에서는 도입이 일반화되고 있다. 하지만 다양한 모양이나 짐을 취급하고, 게다가 선반의 레이아웃 변경이 자주 일어나는 물류창고 등에서는 아직 로봇이 많이 도입되지 못하고 있는 것은 이 때문이다.

이러한 환경에서는, 인간이라면 무의식적으로 할 수 있는 것이 로봇에서는 난이도가 높다. 예를 들어 선반에서 불규칙하게 놓인 물품을 꺼내는 피킹 작업에서는 물품의 모양에 따라서 집었을 때의 동작이 다르고, 여러 물품이 인접해 있거나 겹쳐 있을 경우는 가려서 보이지 않는 영역을 예측해 물품이 어긋나거나 무너지지 않도록 해야 한다.

기존 로봇용 인식 기술에서는 보이는 영역에서 숨은 영역을 예측하기 위해서는 물품 등이 숨은 상태를 나타내는 교사 데이터를 대량으로 학습시켜야 했기 때문에 실용화가 어려웠다.

또한 세계 모델을 활용한 로봇 제어는 세계에서도 몇개인가 연구가 진행되고 있지만, 그 대부분은 ‘강화학습’을 이용하고 있다. 이 경우는 거의 모든 대응 패턴을 망라해 학습할 필요가 있기 때문에 학습에 수개월~년 단위의 방대한 시간이 걸린다는 문제가 있었다.

하지만 NEC가 개발한 세계 모델을 응용한 로봇 동작의 학습기술에서는 라벨링이 불필요한 자율학습에서도 정확하게 동작할 수 있게 된다고 한다.

-- 자율학습으로 영상을 보여주기만 --
NEC 비주얼 인텔리전스 연구소의 주임 연구원인 시라이시(白石) 씨는 학습에 대해서 다음과 같이 설명한다.

“구현한 심층학습의 네트워크에 오로지 영상을 계속 보여줘서, 다음 시각에서의 영상을 생성할 수 있도록 했다. 그리고 다음 시각의 이미지를 정답 데이터로서 부여하는 학습을 반복했다. 예를 들면, 기존에는 영상 내에 다양한 모양의 물품이 있으면, 그 모양들을 일일이 알려줘야 했지만, 이번에는 영상을 통해 개별 물품의 모양, 외관, 동작을 특징량화하여, 그 전이를 예측하고 특징량을 바탕으로 예측 이미지를 생성할 수 있도록 했다. 어떤 영상에서 물품의 일부가 빠져도 다양한 영상을 보여주다 보면 자연스럽게 올바른 모양을 파악하게 된다”.

범용적인 동작을 학습할 때는 시뮬레이터로 생성한 10만건 정도와 비교적 적은 영상 데이터를 사용하고, 현장에 도입할 때는 소량의 실제 물류창고의 영상 데이터를 추가한 다음 며칠간 튜닝하는 것을 목표로 하고 있다고 한다.

현시점에서 제품화 시기는 미정이다. 하지만 로봇에 대한 구현에 대해서는 현장의 상황에 따라 시스템 인테그레이터(SIer)와 협력하거나 자사에서 로봇까지 제공하는 것을 상정하고 있다.

실용화를 위한 과제는 크게 2개가 있다고 한다. 하나는 택트타임(하나의 작업에 필요한 시간)이다. 인간이 있는 환경에서 움직이는 협동로봇은 동작이 느리기 때문에 작업 효율 관점에서 고속화가 요구된다. 다른 하나는 태스크의 성공률이다. 실험 레벨에서의 성공률은 90% 정도이지만, 실제 현장에서는 실패가 허용되지 않기 때문에 실패를 회복하는 구조가 필요하게 된다고 한다.

 -- 끝 --

Copyright © 2020 [Nikkei Electronics] / Nikkei Business Publications, Inc. All rights reserved.

TOP

목차



TOP