일본산업뉴스요약

디지털 변혁의 길, ICT 나침반(4): AI로 사람의 눈을 뛰어넘은 기계
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2020.1.16
  • 신문사 일간공업신문
  • 게재면 9면
  • 작성자hjtic
  • 날짜2020-01-23 21:53:51
  • 조회수184

디지털 변혁의 길, ICT 나침반(4)
AI로 사람의 눈을 뛰어넘은 기계
사물 식별의 정확도를 높인다

고생물학에서는 캄브리아기에 생물 종류가 폭발적으로 증가한 현상을 지칭하는 ‘캄브리아 폭발’이라는 단어가 있다. 이 현상은 생물이 눈을 가진 것이 요인이라는 설이 있다. 지금 인공지능(AI) 기술의 발전으로 기계가 사람에 필적하는 고도의 ‘눈’을 가지기 시작하고 있다.

기계 눈의 역할로 영상의 내용을 확인∙이해하는 영상인식 기술이 있다. 이 기술은 심층학습의 고도화로 인해 성능이 비약적으로 높아져 사람밖에 할 수 없었던 작업 과제를 기계로 대체할 가능성이 크게 확산되었다.

-- 높은 인식성능 --
심층학습은 대상을 비춘 다수의 영상 데이터를 학습해 인식에 최적한 특징을 자동적으로 획득함으로써 높은 인식 성능을 구현한다. 이 때문에 학습 데이터의 좋고 나쁨이 성능을 크게 좌우해 영상인식은 학습 데이터 세트와 심층학습의 두 가지가 하나가 되어 진화함으로써 발전해왔다. 여기서는 학습 데이터 세트의 진화를 축으로 기술과 응용의 확산에 대해서 기술한다.

2009년에 동물∙이동수단 등 1,400만 장의 사진에 비치는 것의 이름도 붙인 대규모 데이터 세트 ‘이미지 넷’이 갖추어졌다. 이것을 이용해 사진 안의 물체를 식별하는 콘테스트 ILSVRC가 개최되어 인식기술이 크게 발전했다. 2015년에는 심층학습의 네트워크 층 수를 큰 폭으로 늘리는 기술이 미국 마이크로소프트에 의해 개발되어 처음으로 기계가 사람의 인식 정확도를 뛰어넘었다. 응용으로 마이크로소프트의 사진에서 1만 개를 넘는 사물의 이름을 식별하는 ‘아줄 코그니티브 서비스’등이 알려져 있다.

-- 불량품을 식별 --
2014년에는 33만 장의 사진에 ‘어느 위치에’ 비치고 있는 지도 기록한 데이터 세트 ‘MS-COCO’가 완성되어 사진 안의 사물 위치도 추정하는 기술로 발전했다. 예를 들어 히타치제작소에서는 사진 안에서 인물 및 소지품을 검출하는 기술을 개발해 영상감시에 응용하고 있다.

한편 이물 및 불량품의 검사 등 지금까지의 데이터 세트에 없는 물체의 인식이 필요한 경우에는 독자적으로 데이터 세트를 갖추어 대응하고 있다. 큐피는 식품공장에서 손질된 야채의 자동검사에서 100만 장의 대량 양품 사진을 수집해 학습 모델을 만들고 미묘하게 형태와 색이 다른 불량품을 식별하고 있다.

-- 복잡 행동 검출 --
인물에 관해서는 “무엇을 하고 있는 지”를 기록한 영상 데이터 세트 MPI 등이 완성되어 인물의 행동인식기술이 발전하고 있다. 단순한 동작과 달리 예를 들어 두리번두리번거리며 걷는 ‘수상한 행동’이라는 여러 동작이 섞인 행동은 인식이 어렵다. 따라서 후지쯔는 걷다∙왼쪽을 향한다 등 사전에 학습한 100개 종류 이상의 기본동작을 융합해 복잡한 행동을 검출하는 기술을 개발했다.

앞으로도 데이터 세트와 AI 기술 두 가지의 발전으로 인해 기계의 눈이 더욱 고도화되어 의료분야에서의 영상 진단 및 스포츠 분야에서의 폼 분석 등 육안으로는 판단이 어려운 다양한 경우로 응용이 확대될 거라고 생각된다. 기계의 캄브리아 폭발은 이제 막 시작되었다.

-- 끝 --

목록