일본산업뉴스요약

소량의 데이터로 엣지 AI를 -- 교토 벤처기업 HACARUS, AI 활용에 고민하는 기술자 지원
  • CategoryAI/ 로봇·드론/ VR
  • 기사일자 2020.8.17
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • Writerhjtic
  • Date2020-08-24 22:17:12
  • Pageview357

Nikkei X-TECH_2020.8.17

소량의 데이터로 엣지 AI를
교토 벤처기업 HACARUS, AI 활용에 고민하는 기술자 지원

“우리도 AI를 활용해 뭔가 할 수 없을까?”라는 경영진과 상사의 질문에 고민하는 산업 분야의 엔지니어들이 적지 않다. 예를 들어  ‘AI로 생산 라인의 오류를 사전에 검지∙분석해 공장 전체의 가동률을 향상시켰으면 좋겠다’라는 지시가 내려왔다고 하자. 담당 엔지니어는 다양하게 시도를 해보지만 좀처럼 해법을 찾지 못하고 발만 동동 구른다. 이처럼 해법을 찾지 못하고 고민하는 엔지니어를 지원하기 위해 독자적 AI(기계학습) 시스템 개발을 추진하고 있는 곳이 교토의 AI 벤처기업 ‘HACARUS’이다. 소량의 데이터 학습을 통해 실용적인 AI를 만들어내는 기술에 강하다.

GAFA(구글, 애플, 페이스북, 아마존)의 눈부신 성장을 뒷받침한 기술 중 하나가 AI라는 점 때문에 IT업계는 빅데이터의 차기 키워드로서 AI를 내세우며 AI라면 무엇이든 가능하다는 듯한 홍보에 힘쓰고 있다. 반도체 제조사조차도 앞으로 성장할 응용 분야로서 AI를 내세우고 있다. 경영진이나 상사가 AI 활용에 기대를 거는 것도 이해가 간다.

현재의 AI 붐(제 3차 AI 붐)의 주역인 기술은 심층학습이라고 해도 좋을 것이다. 심층학습은 기존의 기계학습보다 단계가 많은(심층) 뉴럴네트워크인 DNN(Deep Neural Network)을 이용함으로써 추론(AI 처리)의 정밀도를 높이는 것이 가능해졌다. 학습 측면에서는 라벨이 부착된(정답을 사람이 직접 추가한) 데이터를 대량으로 입력함으로써 DNN 상에 추론 처리에 사용되는 모델이 자동적으로 생성된다. 추론 측면에서는 생성된 모델에 따라 데이터가 순차적으로 처리되기 때문에 데이터가 자동적으로 분류되거나, 일치하는지를 확인하는 등이 가능해진다.

현재 DNN 베이스의 학습∙추론 시스템 개발 플랫폼은 누구나 쉽게 이용할 수 있다. 즉, 라벨이 부착된 데이터를 ‘Caffe’나’ TensorFlow’ 등 프레임워크(대부분은 데이터 센터의 서버 상에서 가동된다)에 입력하면 추론용 모델이 자동으로 생성된다. 이 모델을 추론용 하드웨어(MPU와 MCU, FPGA, NPU(Neural network Processing Unit))에 최적의 모델로 변환하는 소프트웨어도 하드웨어 제조사들이 개발하고 있어 추론 처리계는 이것으로 완성된다.

앞에서 소개한 고민하는 엔지니어들도 대부분 위의 개발 플랫폼과 평가용 데이터를 이용해 심층학습 시스템이 구축되는 것을 확인하는 것까지는 가능하다. 하지만 자신의 시스템과 기기에 맞는 추론용 모델 개발에 실패하는 경우가 많다. 학습을 위한 데이터가 적기 때문이다. 특히 오류에 대한 데이터가 적다. 사실 심층학습이라는 기술은 학습용 데이터가 대량 존재하는 것이 전제가 된다. GAFA와 같이 가만히 있어도 이용자가 데이터를 만들어주는(사이트 상에 행동 기록을 남겨주는) 상황의 경우에는 문제가 없다. 하지만 산업 분야에서 학습용 데이터가 풍부한 케이스는 드물다.

스파스(Sparse) 모델링이란 소량의 정보로 대량의 정보가 있는 경우에 가까운 정밀도로 계산이나 분석을 시행하기 위한 기술로, 정보가 적은 만큼 처리 시간이 짧다는 특징도 있다. 이미 고속 의료용 MRI 영상 분석 등에 응용되고 있으며, 얼만 전에는 블랙홀을 가시화하는 초 해상화에도 적용되어 화제가 되었다.

2014년 설립된 HACARUS는 이미 복수의 고객사를 대상으로 스파스 모델링을 응용한 기계학습 시스템 개발을 추진하고 있다. 예를 들어 오사카가스와는 땅 속에 매장된 가스관 검사를 위한 기계학습 시스템을 공동으로 개발 중이다. 또한 교토대학과 고베대학, 바이엘약품과는 각각 의료 화상 진단을 위한 기계학습 시스템의 공동 개발을 개시했다.

-- Linux와 윈도우 PC 상에서 가동되는 개발 기반 마련 --
위에서 언급한 것처럼 스파스 모델링에서는 적은 정보라도 대량의 정보가 있는 경우에 가까운 정밀도 및 고속 처리가 가능하다. 이렇게만 말하면 이것이 마치 ‘마법’인 것처럼 들릴 수도 있다. 마법이 아닌 스파스 모델링의 포인트는 보유한 소량의 정보가 중요한 정보라는 것이다. 예를 들어 펄스 파형의 폭을 체크하는 경우에 중요한 포인트는 파형의 변화점(0에서 1로의 변화점, 1에서 0으로의 변화점) 정보이며 변화하지 않는 점에 대한 정보는 기본적으로 필요 없다. 즉, 복수의 정보에서 중요한 정보를 얻지 못한다면 스파스 모델링 기술은 잘 작동되지 못한다.

이에 HACARUS는 응용처의 전문가가 중요한 정보 수집을 시행하며 스파스 모델링 베이스의 기계학습 시스템을 구축하기 위한 플랫폼을 개발했다. 이 플랫폼은 Linux와 윈도우 PC 상에서 가동된다. 플랫폼 조작은 GUI 경유로 가능하다. 예를 들어 AI가 산업계로부터 큰 기대를 받고 있는 외관 검사를 통한 불량품/양품 판정 시스템 구축은 이하와 같이 추진된다. 프로그램화가 어려운, 다시 말하면 전문가가 직접 불량품/양품 판정을 해야 하는 미묘한 검품 영상을 수 개 준비하고 이를 이용해 학습시킨다(추론용 모델을 만든다). 학습 데이터 양이 적기 때문에 추론 모델은 단시간에 완성된다. 그리고 학습에 이용된 것과는 다른 검사영상을 통해 추론 모델을 체크해 유효성을 확인한다.

기대한 추론이 나오지 않았을 경우에는 2가지 방법이 있다. 하나는 다른 데이터를 이용해 다시 학습하는 것. 학습 데이터가 적기 때문에 제 2, 제 3의 추론 모델도 단시간에 구축할 수 있다. 다른 하나의 방법은 HACARUS가 마련한 플랫폼의 GUI를 이용해 학습 방식을 조정하는 것이다. 예를 들어 대조하는데 사용하는 요소 영상의 크기와 한계치 등을 변경한다. 이 GUI는 추론 방식 조정에도 이용할 수 있다. 이처럼 소프트웨어 개발에서 친숙한 애자일 형으로 AI를 구축하고 그 결과 중요한 정보(데이터)가 추출되며 추출된 정보의 유효한 이용 방법(조정된 학습 및 추론 방식)이 확립된다.

앞에서 언급한 바와 같이 GAFA에서 진가를 발휘하고 있는 심층학습은 기본적으로 많은 정보가 있다는 것을 전제로 하고 있다. 많은 데이터를 처리하기 위해 학습은 클라우드의 서버로 시행하는 것이 일반적이다. 학습을 통해 얻은 추론 모델은 양자화(고정 소수점화)와 비트 수 절감 등 연산 양 저감 처리를 시행하면 엣지 PC나 임베디드 시스템으로도 처리가 가능하다. 이처럼 심층학습 베이스의 AI에서는 학습과 추론은 각각 별도로 처리된다. 한편, HACARUS의 스파스 모델링 베이스의 AI는 처리 부하가 가볍기 때문에 이용자가 가진 PC 정도의 연산 능력으로도 학습과 추론을 모두 실행할 수 있다. 이러한 기능 때문에 응용처의 전문가도 참여한 애자일 형 AI 구축이 가능하기 때문에 마치 이용자가 직접 스마트한 AI를 만들어낼 수 있는 것처럼 되는 것이다.

-- FPGA 상에서 학습과 추론이 가능 --
앞에서 외관 검사를 통해 불량품/양품 판정을 위한 기계학습 시스템을 구축한 사례로 고객이 가진 PC로 학습∙추론하는 시스템을 소개했지만, 고객에 따라서는 다른 연산 자원을 이용하길 원하는 케이스도 있다. 이를 위해 HACARUS는 클라우드 서버, 고객이 가진 PC, 고객의 스마트폰 그리고 FPGA로도 AI를 구축∙이용할 수 있다고 한다. 현재, 임베디드 시스템으로의 응용을 통해 HACARUS가 주력하고 있는 것이 FPGA로의 기계학습 시스템 도입이다. 예를 들어 기계학습 시스템이 도입된 FPGA를 감시카메라에 탑재한다면 감시카메라만으로 영상 수집에서 학습, 추론을 이용한 영상 분석까지 완결할 수 있다. 이 FPGA 베이스의 기계학습 시스템에 HACARUS는 ‘COLIGO’라는 브랜드 명을 붙였다.

COLIGO는 Linux와 윈도우 상에서 가동되는 HACARUS의 기계학습 플랫폼의 베이스 부분(학습∙추론용 Python프로그램)을 C++코드로 변환해 그것을 고위 합성 툴에 입력한다. 고위 합성 툴은 미국 Xilinx와 인텔의 FPGA용 회로설계 데이터로 변환되기 때문에 플랫폼의 베이스 부분이 FPGA 상에 하드웨어로서 설치된다. 윈도우와 Linux가 없어도 학습∙추론이 가능한 기계학습 시스템을 FPGA(임베디드 시스템) 상에 구축할 수 있다. 이를 통해 PC 베이스의 기계학습 시스템에 비해 소비전력을 절감할 수 있는 등의 장점을 얻을 수 있다.

이 외에도 HACARUS는 스파스 모델링 베이스의 기계학습을 산업 분야에 보급하기 위해 다양한 활동을 추진하고 있다. 예를 들어 COM(Computer On Module) 제조사인 독일의 congatec과 협력해 스파스 모델링 베이스의 기계학습 시스템의 스타터 키트 제공을 개시했다. 또한 HACARUS는 congatec 및 일본의 기술상사 PALTEK와 함께 스파스 모델링 베이스의 기계학습을 이용한 온프레미스(On-premises)의 외관검사 서비스 ‘외관검사 서비스 SPECTRO by HACARUS’를 개시했다. PALTEK은 congatec의 판매 대리점으로 HACARUS의 COM과 이 COM이 탑재된 박스형 PC를 취급하고 있다. 또한 PALTEK은 HACARUS의 판매 대리점이기도 하다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

List