책 커버 표지
일경컴퓨터_2022/04/28(2)_데이터베이스의 새로운 상식 -- DX 가속, 클라우드
  • 저자 : 日経BP社
  • 발행일 : 20220428
  • 페이지수/크기 : 98page/28cm

요약

Nikkei Computer_2022.4.28 특집요약 (p48~53)

데이터베이스의 새로운 상식
클라우드 전환으로 DX 가속

DX(디지털 변혁) 추진을 담당하는 데이터베이스는 나날이 중요성이 커져, 그 니즈에 따른 기능 강화가 지속적으로 이뤄지고 있다. 데이터베이스의 활용 무대가 클라우드로 바뀌고 있으며, 거기에는 새로운 '상식'이 만들어지고 있다. ‘데이터를 복사하지 않고 곧바로 분석’하거나 ‘튜닝도 데이터베이스를 통해 실행’ 하는 것이 가능하게 되었다. 최신 방법을 파악해 DX를 위한 활용을 모색해 본다.

예나 지금이나 기업 시스템의 핵심을 담당하는 데이터베이스는 퇴보된 제품으로 여겨지기 쉽지만, 클라우드의 데이터베이스 서비스를 중심으로 지금도 지속적인 진화가 이뤄지고 있으며, 그 활용의 중요성도 커지고 있다. 데이터베이스의 현재와 새로운 상식, 그리고 앞으로의 과제에 대해 살펴보기로 하겠다.

현황 파악이 우선이다. 최근에 데이터베이스를 둘러싼 커다란 이슈로 DX(디지털 변혁) 추진을 들 수 있다. DX에 대한 대처를 계기로 많은 기업들이 데이터 활용을 고도화하는데 주력해 왔다. 데이터 분석 하나만 보더라도, 지금까지 보다 대량으로 다양한 데이터를 빠르게 수집해, 깊이 있게 분석할 수 있는 데이터베이스의 구축이 요구되어 왔다.

기업이 취급하는 데이터는 방대하고 다양해지고 있다. 지금까지의 구조화된 데이터뿐만 아니라, 화상이나 음성, 영상 등 비정형 데이터도 분석 대상에 포함되었으며, 분석 수단도 늘어나고 있다. 기존의 BI(비즈니스 인텔리전스) 툴과 함께, AI(인공지능)나 기계학습을 활용하는 사례는 적지 않다.

이러한 데이터 활용을 고도화하는 무대로서 클라우드가 주류가 되고 있다. AWS(Amazon Web Services), Microsoft Azure, 구글 클라우드 등 대형 클라우드 벤더는 다양한 데이터베이스 서비스를 마련한다. 오라클 데이터베이스 및 마이크로소프트 SQL Server 등의 상용 제품과 함께, PostgreSQL 및 MySQL과 같은 오픈 소스 등 제품 라인은 다양하다. 클라우드 벤더가 독자적으로 개발한 데이터베이스 서비스도 제공한다.

-- 활약 무대는 클라우드 상에 --
클라우드 상에서 데이터베이스 활용이 추진되는 배경에는 두 가지 이유가 있다. 하나는 온프레미스 환경에서 클라우드로 전환함으로써 데이터베이스 관리자(DBA)의 업무를 줄일 수 있다는 것과, 또 다른 하나는 DX를 서포트 하기 위함이다. 기업을 둘러싼 시장의 변화에 따라, 많은 기업이 신규 사업이나 새로운 서비스 개발을 추진하고 있다. 그러한 앱을 개발할 경우, 클라우드 상에서 제작하는 경우가 많으며 데이터베이스도 클라우드 상의 것을 선택하게 된다.

예를 들어 손해보험재팬은 2021년 9월 쇄신한 'Driving!' 데이터베이스로 AWS의 아마존 오로라(Aurora)를 채택했다. 오로라는 AWS가 개발한 릴레이셔널 데이터베이스(RDBMS)로, MySQL 및 Postgre SQL과 호환되는 버전을 각각 갖추고 있다.

Driving!은 통신 기능을 갖춘 블랙박스를 활용한 안전운전 지원 서비스다. 블랙박스와 전용 스마트폰 앱을 와이파이로 연동해 녹화 확인 및 운전 진단이 가능하다. 드라이브 레코더는 평상 시의 감시 및 사고 시의 자동 통보 등의 기능을 탑재한다.

Driving!에서는 시간과 주행 차량의 위치로 구성된 주행 데이터를 일정 시간마다 AWS 상에 수집하고 있다. 시스템 개발을 담당했던 SOMPO시스템즈 디지털 트랜스포메이션 본부의 이자와(伊沢) 씨는 “주행 데이터를 얼마나 파악하느냐가 관건이었다”라고 말한다. 고객 차량에 탑재한 블랙박스에서는 24시간, 365일간의 데이터가 모인다. 한 달에 10테라바이트의 데이터가 수집되는 것으로 시산하고 있다.

텍스트 형태의 주행 데이터와 더불어 블랙박스로 녹화된 동영상 데이터도 수집 대상이다. 다양하고 방대한 데이터의 양에 대응하기 위해 손해보험재팬은 AWS의 여러 서비스를 조합했다. 주행 데이터 등은 객체 스토리지 ‘Amazon S3’에 일단 수집한다. 거기에서 데이터를 추출하여 오로라(Aurora)에 보관한다. 다만 모든 데이터를 직접 오로라로 옮기는 것은 부하가 높아지기 때문에 일부 데이터는 NoSQL 데이터베이스 'Amazon Dynamo DB'를 경유하는 구성으로 했다.

-- DBA의 업무를 클라우드가 대신 --
데이터 활용에서는 Driving!이 실행한 것처럼 적절한 데이터베이스 기반을 설계 및 구축한 뒤에 잘 운용할 필요가 있다. 성능과 확장성·가용성, 보안 등 다방면에 걸친 요건을 지금까지는 DBA가 충족시켜 왔다.

클라우드 상에서 데이터베이스를 구축할 경우, 이러한 DBA 업무의 일부를 클라우드 벤더가 대신해준다. 그 내용은 데이터베이스의 구축이나 운용·보수와 관련된 부분이 크다. 예를 들어 AWS 데이터베이스 서비스에서는 백업이나 리커버리, 패치 적용과 같은 DBA의 업무를 커버한다.

다키자와(瀧澤) AWS 퍼블릭섹터 기술본부 본부장은 "DBA 이외에도 가능한 데이터베이스와 관련된 업무는 클라우드 매니지드 서비스에 맡기는 것이 최근의 흐름이다"라고 말한다. DBA는 데이터베이스의 구축이나 운용·보수에 사용했던 시간을 다른 일에 돌릴 수 있게 된다.

-- 왜 ‘새로운 상식’이 만들어지는 것인가? --
이제부터는 클라우드 상에 데이터베이스를 새롭게 구축하거나 이행할 때 알아야 할 '새로운 상식'을 소개하겠다.

DX의 요청으로 앱이나 서비스를 빠르게 변경할 수 있는 시스템 기반이 요구되고 있다. 고도화하는 요건에 부응하기 위해 데이터베이스는 계속 진화하고 있다. 그 결과, 데이터베이스에도 새로운 상식이 만들어지는 셈이다.

▶ 신(新) 상식1
데이터를 복사하지 않고 바로 분석

첫 번째 새로운 상식은 '시스템에서 데이터를 복사하지 않고도 바로 분석할 수 있다는 것'이다. 지금까지의 데이터 분석에서는 각종 데이터베이스나 파일과 같은 다양한 데이터 소스로부터 ETL(추출, 가공, 로드) 툴을 통해 데이터 웨어하우스(DWH) 등으로 데이터를 통합할 필요가 있었다. 야간 배치 처리 등으로 데이터를 DWH에 복사할 필요가 있어 새로운 데이터를 즉각적으로 분석하기가 어려웠다.

‘여러 시스템의 데이터를 실시간으로 연결해 가시화하는 요구가 높아지고 있다’. SAP재팬 인더스트리&커스터머 어드바이저리 총괄본부 가바타(椛田) 시니어 디렉터는 이렇게 말한다. 그러한 요구에 응하는 방법 중 하나가 ‘데이터 가상화’에 의한 데이터 소스의 통합이다.

데이터베이스가 갖추고 있는 뷰의 정의를 통해 각종 데이터 소스에 보관된 데이터에서 분석 대상만을 가상 테이블에 통합한다. 기존의 DWH와 같이 데이터를 복사하여 수집할 필요가 없으므로 최신 데이터를 취득하기 쉬우며, 대상 데이터의 재검토가 비교적 간단하다는 장점이 있다. Denodo Platform, JBoss Data Virtualization, TIBCO Data Virtualization과 같은 데이터 가상화 툴이 그러한 기능을 갖추고 있다.

SAP의 인메모리형 데이터베이스 ‘SAP HANA’도 같은 기능을 제공한다. 이는 ‘가상 데이터 액세스’라고 불리는 것으로, 앱이나 BI 툴을 통해 SAP HANA와 각종 데이터 소스를 연결하여 실시간으로 데이터를 참조할 수 있다.

사용자 부문에 분석하려는 데이터가 있을 경우, 가상 데이터 액세스를 경유해 가상 테이블을 구축해 바로 제공할 수 있는 셈이다. BI 툴의 태블로(Tableau)와 접속하면 실시간으로 데이터를 지도나 그래프 등의 형태로 나타낼 수 있다.

-- SQL로 기계학습 모델 작성 --

신 상식 2
튜닝도 데이터베이스에 맡긴다

두 번째 새로운 상식은 ‘튜닝도 데이터베이스에 맡기는 것’이다. 지금까지는 운용 과정에서 DBA가 데이터베이스를 튜닝해 성능과 보안 수준 등을 최적화했다. 클라우드 데이터베이스를 중심으로 벤더가 기계학습 등을 활용해 이와 같은 튜닝 자동화를 추진하고 있다.

예를 들어 오라클의 ‘Autonomous Database’에서는 인덱스 작성에 AI나 기계학습을 응용한다. 통상적으로는 DBA가 수행하는 인덱스 튜닝에 대해 오라클이 직접 데이터베이스를 운용한 실적 데이터를 기반으로 기계학습을 응용해 자동화했다.

인덱스를 작성할 경우, SQL 실행 계획과 인덱스를 특정한 후 실전 환경과는 다른 환경에서 평가 및 검증을 실시. 검증 결과에 문제가 없으면 실전 환경에서 실행 및 확인을 하는 흐름이다. 이 일련의 흐름을 자동적으로 실행한다. 어떤 튜닝을 했는지 알 수 있도록 리포트도 작성되기 때문에 사용자는 그 과정을 확인할 수 있다.

마이크로소프트도 동일하게 SQL Server나 Azure SQL Database에서 자동 튜닝 기능을 제공한다. 지속적인 감시와 분석을 통해 통상적인 워크로드 특성을 파악하여 문제 발생 시 문제점과 개선점을 찾아낸다. 주로 실행 플랜 수정과 인덱스의 자동 관리가 이 회사의 자동 튜닝의 특징이다.

신 상식 3
다양한 데이터 형식을 즉시 이용 가능

세 번째 새로운 상식은 '다양한 데이터 형식을 즉시 이용할 수 있는 것’이다.

기존 기업 시스템에서는 RDBMS 이용이 중심이었다. 그러나 사외를 포함해 취급하는 데이터의 형식이 늘어나게 되면서 비정형 데이터를 취급할 수 있는 NoSQL에 이목이 집중되어 왔다. 키-밸류형이나 그래프형, 문서형과 같은 데이터 형식의 데이터를 취급하려는 니즈가 높아졌다.

그러한 데이터 형식을 이용하고 싶은 경우, 기존에는 그 형식에 맞는 NoSQL을 사용자가 서버에 도입할 필요가 있었다. 그러나 많은 클라우드가 NoSQL 데이터베이스 서비스를 갖추게 되면서 사용자들은 다양한 데이터 형식을 즉시 이용할 수 있게 되었다.

예를 들어 마이크로소프트는 키-밸류형, 와이드 컬럼(열지향)형, 문서형, 그래프형의 NoSQL에서 취급하는 4개의 데이터 모델을 하나의 서비스로 묶어 취급할 수 있는 'Azure Cosmos DB'를 제공한다. Azure Cosmos DB에서는 5종류의 API(애플리케이션 프로그래밍 인터페이스)를 제공한다.

AWS는 취급하는 데이터 형식별로 데이터베이스 서비스를 제공하는 '목적 기반(Perforce build)’이라는 개념 아래, NoSQL을 포함해 라인업을 충실하게 해왔다.

예를 들면 RDBMS로서 아마존 오로라나 Amazon RDS, 키-밸류형 데이터베이스로서 Amazon DynamoDB 등을 갖추고 있다. 애자일 개발 및 DevOps를 도입한 개발 체제가 자리잡고 있는 최근에는 취급하는 데이터의 양이나 종류가 증가하고 있다. 다키자와 AWS 본부장은 "어플의 조건이나 목적에 맞는 데이터베이스 엔진을 선택하는 것이 현재의 흐름이다"라고 지적한다.

취급하는 데이터베이스 엔진의 종류가 다양해짐에 따라 DBA의 학습 비용이 증대될 것으로 예상된다. AWS가 제창하는 목적 기반 서비스를 잘 활용하려면 다양한 데이터베이스에 대해 스킬을 축적할 필요가 있다.

AWS의 목적 기반의 정반대의 사고방식으로 데이터베이스 기능 확충을 도모하는 것이 오라클이다.

융합형 데이터베이스(Converged Database)를 제창하고 다양한 데이터 형식을 집약하여 하나의 데이터베이스로 관리한다. 트랜잭션(Transaction)과 기계학습, 마이크로서비스 등 다양한 워크로드에도 하나로 대응한다. 데이터베이스에 저장된 데이터는 SQL이나 REST를 사용하여 호출한다. 하나의 데이터베이스로서 통합되어 있기 때문에 데이터 연계의 수고도 적다고 한다.

-- 데이터베이스의 다음 과제 --
데이터베이스의 클라우드화가 진행되면서 새로운 상식도 생겨났다. 그렇다면, 데이터베이스나 DBA에 제시될 다음 과제는 무엇일까?

그 중 하나는 마이크로 서비스 아키텍쳐에 대한 대응이라고 말할 수 있다. 어시스트클라우드의 세키(関) 과장은 차기 조류(潮流)에 대해 "클라우드로 전환 후, 마이크로 서비스에 대한 대응을 추진하는 흐름이 있다"라고 보고 있다.

마이크로 서비스가 주목을 받는 이유 중 하나는 DX 관련 앱 개발의 수요이다. 시행착오를 반복해 완성도를 높이거나 사용자 피드백을 신속하게 도입해 개선하는 등 앱을 변경해 디플로이 하는 빈도를 높이려는 요구가 있다.


그런데 모노리틱(Monolithic) 시스템에서는 일부 기능에서 변경 요구가 있을 경우, 다른 기능에 대한 영향 조사나 테스트 등의 번거로움이 발생하기 때문에 신속한 개발이나 갱신에는 적합하지 않다. 이에 서비스 독립성을 높이는 마이크로서비스(Microservices) 채택의 니즈가 높아지고 있는 셈이다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

목차