- 정부, 민관 빅데이터 개방 -- 서식 및 용어 통일, 2020년 국내에 포털 사이트
-
- 카테고리사물인터넷/ ICT/ 제조·4.0
- 기사일자 2018.2.20
- 신문사 일본경제신문
- 게재면 5면
- 작성자hjtic
- 날짜2018-02-27 09:11:53
- 조회수704
민관의 빅데이터 개방
정부, 서식 및 용어 통일, 2020년 국내에 포털 사이트 개설
▶빅데이터: 기존 IT분야에서는 관리 및 분석이 불가능했던 방대한 데이터 집합을 의미한다. 통계와 지도에 대한 정보뿐만 아니라, 사람의 행동 및 건강 정보, 기계의 가동 상황 등이 대표적이다. 현재는 모든 사물이 인터넷으로 연결되는 IoT기술 보급으로 이러한 정보를 수집하기 쉬워졌다.
인공지능(AI)를 이용한 빅데이터 분석으로 상품 개발 및 마케팅을 보다 정밀하게 시행할 수 있게 되었다. 그 대표적인 것이 전자 상거래 사이트의 ‘추천 상품’ 표시. 구매 기록 및 연령, 성별 등에 따라 소비자에게 맞는 상품을 제안하고 있다.
-- 2020년, 먼저 국내에서, 미국∙유럽에 참가 요청 --
정부는 정부∙지방∙민간이 보유하고 있는 빅데이터 개방에 착수한다. 용어와 서식을 통일해 민관의 광범위한 데이터를 일원적으로 분석할 수 있도록 하는 것으로, 기업의 상품 개발 및 서비스 향상으로의 활용을 목적으로 한다. 2020년에 이를 위한 새로운 포털 사이트를 개설할 예정이다. 2019년 일본에서 개최되는 G20 정상회담에서 미국과 유럽 등에 참가를 요청, 10억 명 이상의 데이터 베이스를 목표로 한다.
정부는 현재, 정부의 통계와 지도 등 방대한 정보를 일반 대중용 사이트에 공개하고 있다. 하지만 용어∙서식 및 파일 형식이 통일되어 있지 않았기 때문에 지자체의 데이터가 부족하고, 민간 기업의 정보도 없었다.
정부가 개설하는 포털 사이트는 농업, 교통, 인프라, 방재 및 의료 등 광범위한 분야를 대상으로 한다. 농업의 경우, 농가와 농업협동조합으로부터 씨 뿌리기와 물주기, 토양 관리에 대한 정보를 수집. 교통 분야는 택시회사와 버스회사로부터는 도로, 지도 및 교통량, 의료분야에서는 익명으로 한 이용자의 건강 정보이다.
각각의 분야가 보유하고 있는 데이터를 일원화함으로써 인공지능을 이용한 정밀도 높은 분석이 가능. 분야를 망라한 데이터를 활용으로 예를 들어, 기상 정보를 통해 최적의 수확 시기를 판정, 교통량을 통해 도로의 보수 시기를 산출하는 등의 활용법이 가능하다.
포털 사이트에서는 누구나가 빅데이터에서 자신이 원하는 정보를 바로 찾아내 다운로드 할 수 있다. 사생활 및 안전 보장에 관한 정보는 지자체만 볼 수 있도록 하는 등, 열람의 제한도 도입한다. 또한 기업들의 적극적인 참여를 유도하기 위해 유료 정보도 취급. 휴대폰 회사가 가진 고객의 익명화된 위치정보는 일정의 요금을 지불한 이용자만이 볼 수 있도록 한다.
현재는 지자체와 기업 등이 기록하는 데이터는 사용하는 용어 및 서식이 서로 다르다. 예를 들어, ‘동사무소’의 경우도 복수의 표기가 있어 AI가 같은 뜻이라는 것을 이해하지 못하는 경우가 있다. 어휘는 일반사단법인인 데이터유통추진협의회와 연대해 행정 용어에서 산업 용어까지 모두 통일한다.
서식도 통일한다. 예를 들어, 현재는 시각 표기도 ‘10시30분’이나 ‘10/30’,’10-30’ 등 각각 다르다. 연도도 ‘2018년’, ‘18년’, ‘헤이세이(平成)30년’ 등으로 나뉘어져 있고, 파일 형식도 다르다.
앞으로는 더욱 빅데이터의 범위를 확대하기 위해 미국과 EU 등 해외가 보유하는 데이터와도 접속할 계획이다.
-- 끝 --