강화학습으로 얻은 제어기로 주행
강화학습 기술이 2족 보행 로봇에서도 이용되기 시작했다. 2022년 9월에 미국의 로봇 벤처기업 Agility Robotics(이하 Agility)와 미국 Oregon State University(OSU)는, 자사의 2족 보행 로봇 ‘Cassie(캐시)’가 100m를 24.73초에 주행하며 2족 보행 로봇으로서 기네스 세계기록에 올랐다고 발표했다. 이 기록은 강화학습으로 얻은 제어기(방책)로 로봇을 주행시켜 실현했다.
Agility는 OSU발 벤처기업으로, 미국 Carnegie Mellon University 출신의 로봇 연구자이자 OSU의 교수인 조나단 허스트(Jonathan Hurst) 씨 등이 2015년에 공동 창업했다. 현재까지 자금 조달액은 누계 약 1억 7,800만 달러(약 260억 엔)에 달한다.
2020년에는 휴머노이드형 2족 보행 로봇 ‘Digit’를 상용 제품으로 발매했다. 미국 Boston Dynamic의 ‘Atlas’ 정도로 활발하게 움직이지는 않지만 휴머노이드형을 상용화했다는 의미에서는 Boston Dynamic보다 앞서 있다고 할 수 있다.
-- 다리 로봇으로 확대 --
로봇용 강화학습 기술은 서서히 확산되고 있다. 예를 들면, 스위스 ETH Zurich는 4족 보행 로봇 ‘ANYmal’의 보행 제어에 강화학습으로 얻은 제어기를 적용했다. 산길 등 울퉁불퉁한 길에서 안정적인 보행을 실현해, 미국 DARPA가 주최한 경기대회 ‘DARPA Subterranean Challenge’에서는 Boston Dynamic의 ‘Spot’을 이용하는 팀을 누르고 우승했다.
|