일본산업뉴스요약

클라우드 두뇌전 (12) : 울타리 없는 데이터 이활용 -- 데이터의 ‘호수’를
  • 카테고리사물인터넷/ ICT/ 제조·4.0
  • 기사일자 2018.2.27
  • 신문사 일간공업신문
  • 게재면 17면
  • 작성자hjtic
  • 날짜2018-03-05 23:30:24
  • 조회수795

클라우드 두뇌전 (12)
울타리 없는 데이터 이활용
데이터의 ‘호수’를 만들자

방대하고 다양한 데이터를 제3의 경영자원으로 삼아, 이를 활용하여 새로운 수익 모델을 구축한다. 이러한 대응은 거대한 클라우드를 다루는 플랫포머만이 아니라 모든 기업에 요구되고 있다. 단 보유하는 데이터양이 방대할 경우 이활용(利活用)하기 이전에 데이터를 어떻게 보관하면 좋을지 등의 문제에 직면한다. AI 붐이 일어나는 가운데 이러한 근간에 대한 논의가 다시 대두되고 있다.

산업계에서는 IoT의 실증실험이 잇따르고 있고, 기계의 가동 이력이나 카메라 영상 등의 데이터가 모든 곳에 축적되어 있다. 데이터 보관을 클라우드 업자에게 맡기는 것도 가능하다. 그러나 기업의 경우는 사내 규정이나 컴플라이언스(법령 준수)도 있기 때문에 클라우드가 데이터 보관 문제를 모두 해결할 수 있는 것은 아니다.

-- 기존 형식으로 축적 --
한편, 기업 내에서는 업무나 어플리케이션(응용소프트) 별로 데이터가 분단되어 사일로처럼 보관되어 있다. 빅데이터의 이활용의 경우는 오픈 소스의 분산처리 기술 ‘하둡(Hadoop)’의 대두로 크게 진화하였으며 이들을 포함하여 ‘모든 데이터를 통합∙관리하는 데이터 레이크를 만들자’라는 생각이 있다.

데이터 레이크는 다종다양한 데이터를 기존 형식대로 통째로 축적, 가시화하여 이활용을 촉진하는 것이 목적이다. 제창자는 미국의 델 테크놀로지스에 경영 통합된 스토리지(외부기억장치) 최대 제조기업인 미국의 EMC다. 데이터 레이크 제품을 담당하는 EMC재팬(도쿄)의 구라하시(倉橋) 운영책임자는 “우리들은 미들웨어나 그 상위에서 액세스하는 부분을 포함하여 데이터 레이크라고 부르고 있다”라고 설명한다.

데이터 레이크의 개념은 유럽과 미국에서는 빅데이터와 함께 5, 6년 전부터 제창되었지만 일본계 기업이 취급하는 데이터양은 유럽과 미국만큼 크지 않아 큰 영향이 없었다. 그러나 데이터 활용의 중요성이 강조되는 가운데 그 생각이 새삼 재조명되고 있다.

클라우드 사업의 새로운 전개로 ‘왓슨 데이터 플랫폼’을 주장하는 일본IBM의 요시자키(吉崎) 씨는 “데이터와 AI를 일체화한 솔루션이 향후 열쇠가 된다. 데이터 레이크도 뿌리는 같다”라고 말한다.
-- 흐름도 가시화 --
일본IBM에서는 데이터를 물고기에 비유하여 “데이터 레이크라는 것은 물고기를 헤엄치게 하는 호수”라고 말한다. 팩에 들어간 물고기는 매장에서 구입할 수 있지만, 그곳에 오기까지는 어업자, 중간 도매업자, 배송업자, 가공업자와 같은 프로의 작업이 필요하다. 데이터의 이할용도 이와 닮았다. 데이터 레이크의 경우 필요할 때에 바로 물고기(데이터)를 이용할 수 있다. 물론, 데이터를 모아만 둔다면 늪과 다를 바 없다. 데이터의 흐름 등을 가시화하여 깨끗한 호수를 만드는 것이 필요하다.

데이터 레이크가 요구되는 배경에는, 유저기업의 사업부문이 IT활용의 담당자가 되어 데이터 활용에 의욕적인 것도 있다. EMC재팬의 구라하시 씨는 “시장의 변화는 기회이며 사업부문에 대한 어프로치를 적극화하고 있다”라고 역설한다. EMC재팬이 제공하는 데이터 레이크에 대해서는 “울타리 없이 데이터에 엑세스할 수 있어 확장성이 높다”라고 말한다.

-- 운전지원으로 위력 --
예를 들면 자동차회사. 차종을 하나 만드는데 공공도로나 테스트코스를 20만km 정도를 주행하며, 그 동안은 카메라로 이미지를 촬영한다. 다루는 데이터양은 하나의 센서 당 5페타바이트(페타는 1,000조)에 달한다. 센서가 10개 있다면 50페타바이트가 되고, 데이터 관리비는 비용으로 되돌아온다. 구라하시 씨는 “당사의 스토리지 ‘Isilon’이라면 수십 페타바이트를 혼자서 관리할 수 있다. 유럽의 선진운전지원시스템(ADAS)용의 경우는 압도적인 점유율을 차지하고 있다”라고 자신 있게 말한다.

데이터를 경영자원으로서 활용하기 위해서는 클라우드와 레이크를 어떻게 구분 사용하는가가 중요하다.

  -- (13)에 계속 --

목록