일본산업뉴스요약

산업기술종합연구소, 영상인식 AI 개발 -- 지식추출∙로봇 제어에 활용
  • CategoryAI/ 로봇·드론/ VR
  • 기사일자 2019.1.18
  • 신문사 일간공업신문
  • 게재면 9면
  • Writerhjtic
  • Date2019-01-26 23:01:26
  • Pageview352

산업기술종합연구소, 영상인식 AI 개발
지식추출∙로봇 제어에 활용

인공지능(AI) 기술의 영상 대응이 추진되고 있다. 기존에는 영상 데이터는 정지화면 한 화면씩 모음으로 처리되어왔다. 최근에는 시간 변화를 전제로 한 진정한 의미의 영상으로써 AI가 데이터를 학습힐 수 있게 되었다. 영상에서 지식과 인과를 추출하거나 로봇 제어에 사용하거나 하면 응용 범위가 급속도로 확대될 거라고 기대된다. 과제는 방대한 데이터 처리 및 수집의 효율화다.

산업기술종합연구소(산종연) 지능시스템연구부문장인 사토(佐藤)는 딥러닝으로 인식 정확도를 74%로 높여 영상 인식 AI를 개발했다. 숫자로 해 약 30만 영상 데이터에서 152층으로 이루어진 학습 모델을 훈련했다. 학습에는 산종연의 AI용 슈퍼 컴퓨터 ‘AAIC’를 2개월 간 풀 회전시켰다. 사토는 “정지 화면의 학습은 100만 데이터에서 성패가 갈렸다. 영상도 데이터 양이 돌파구가 되었다.”고 설명한다.

-- 역분석 --
이러한 연구가 추진되면 영상에서 지식을 추출하는 응용이 시작된다. 산종연 인공지능연구센터장 아소(麻生)는 “AI가 무엇을 보고 판단 했는지 가시화하는 기술을 시간 축 방향으로도 응용할 수 있다.”고 한다.

예를 들어 인간이 넘어지는 영상과 넘어지지 않는 영상을 모아 걷는 못브에서 넘어질 확률을 예측하고 나아가 예측의 근거를 역분석 가능하다. “무릎이 올라가지 않는 보행자는 넘어지기 쉽다.”라는 이유를 추출할 가능성이 있다. 제조 작업의 영상에 이용하면 불량발생의 이유, 스포츠 영상이라면 좋은 플레이의 요인을 찾을 수 있다고 기대된다.

하지만 영상 인식 AI는 사람처럼 영상 내용을 이해하고 있는 것은 아니다. 사토는 영상 안에서 인간을 숨긴 영상을 준비해 AI에 학습시켰다. 그래도 70~80%의 인식 정확도였다. 사토는 “테니스라고 인식한 영상이라도 AI는 플레이하는 선수를 보고 있던 것이 아닌 코트를 보고 있었다.”고 설명한다. 이 결과 정지화면의 모음으로서 데이터를 처리하는 AI 연구에 대한 반증으로 주목 받았다. 이 문제는 영상 인식 AI에게도 이어진다.

영상에서 지식을 추출하기 위해서는 “더욱 연구가 필요하다.”고 센터장 쓰지이(辻井)는 지적한다. 배경과 인물, 동체와 정지물을 구분해 인식하면서 영상 장면 인식과 결부시켜 구조화할 필요가 있다.

-- 첨단영역 --
또한 로봇 제어에 분석결과를 응용하기 위해서는 영상 인식 결과를 언어가 아닌 로봇 시뮬레이션 및 제어용 언어 등의 형태로 출력할 필요가 있다. 쓰지이는 “영상처리는 지식계통과 데이터계통의 AI를 이어주는 첨단영역의 하나이다. 재미있어진다.”며 기대한다.

과제는 데이터다. 영상은 정보양이 많아 데이터 베이스 구축에 비용이 소요된다. 이용 횟수를 줄임으로써 데이터 수집의 효율화를 위한 일상 작업에 수집작업을 담는다고 하는 전략이 중요하다.

-- 끝 --

List