- 개인정보 익명성과 실용성 양립 -- 전기통신대, 빅데이터 분석기술 개발
-
- Category사물인터넷/ ICT/ 제조·4.0
- 기사일자 2017.7.17
- 신문사 일간공업신문
- 게재면 1면
- Writerhjtic
- Date2017-07-24 09:27:52
- Pageview472
개인정보 익명성과 실용성의 양립
전기통신대학, 빅데이터 분석 기술 개발
전기통신대학의 세이 유이치 교수의 연구팀은 익명성을 보호하면서 빅데이터를 분석 가능한 높은 실용성의 데이터 마이닝 기술을 개발했다. 올바른 정보에 유사한 정보를 섞어 개인을 ‘익명화’한 뒤에 분석한다. 의료기관 등이 축적한 의료 빅데이터를 신약 개발과 치료효과의 분석 등에 사용하기 쉬워진다.
개발한 것은 하나의 행의 데이터 마다 복수의 유사 정보를 심는 것으로 개인은 익명화되면서 추상도는 올리지 않고 데이터를 다루는 수법이다. 예를 들어 ‘30세 에이즈 바이러스(HIV) 환자’의 데이터에 ‘30세 식도염 환자’와 ‘51세의 HIV 환자’라는 유사 정보를 섞는다.
유사 정보는 존재하지 않는 정보로 어느 것이 유사 정보인지 특정 지을 수 없다. 때문에 안전성이 높아짐과 동시에 데이터 전체는 통계적인 분석이 가능해진다. 대량의 데이터를 처리한다면 결과적으로 유사 정보가 없는 경우와 같은 레벨의 통계치를 얻을 수 있다. 삽입한 유사 정보의 숫자를 늘리면 익명성을 더욱 높일 수 있다.
실제로 미국에서 조사 기업의 약 5만명 분의 데이터를 익명화하여 분석한 결과, 연령별 직업 분류에 있어서 기존의 수법보다 2승 평균오차를 두 자리 수 정도 줄였다.
기존의 익명화 수법은 ‘21~30세의 HIV 환자’등 범위를 주고 추상화하는 것이 일반적이었다. 단 익명성을 올리면 안전성은 향상되지만, 필요 이상으로 익명화하면 실용성에 있어서 의미가 없는 데이터가 될 우려가 있다.
‘개인정보의 보호에 관련된 법률(개인정보보호법)’은 2015년에 개정되어 2017년 5월에 전면 시행되었다. 개정에 따라 특정한 개인을 식별할 수 없도록 익명화한다면 본인의 동의를 얻지 않고 일정한 조건 아래에서 자유롭게 활용할 수 있다.
-- 끝 --