책 커버 표지
일경컴퓨터_2022/08/04(2)_차분 프라이버시 (Differential Privacy)
  • 저자 : 日経BP社
  • 발행일 : 20220804
  • 페이지수/크기 : 138page/28cm

요약

Nikkei Computer_2022.8.4 키워드 (p109)

차분 프라이버시 (Differential Privacy)
일반 통계 분석에서 기계 학습까지 폭넓게 사용 가능

차분 프라이버시는 프라이버시 보호를 위한 방법 중 하나이다. 개인 데이터를 포함한 데이터베이스에서 통계치 등을 추출할 때 그 수치에 난수를 더함으로써 정확한 값을 은닉할 수 있다. 이를 통해 추출한 데이터와 다른 외부 데이터를 곱해서 특정 개인의 프라이버시 정보를 빼내는 사이버 공격으로부터 데이터를 보호할 수 있다.

데이터베이스 등에 저장된 개인의 원 데이터에는 손을 대지 않고 데이터를 분석 등에 사용하는 사람이 쿼리를 실행했을 때 시스템 측이 쿼리 결과에 난수를 더해 답변하는 시스템이다. 쿼리 결과에 더한 난수는 수학적으로 정의된 요건을 충족하는 알고리즘을 기반으로 도출한다.

추출한 데이터에 난수를 더함으로써 만일 데이터를 제3자에게 빼앗기더라도 이를 통해 특정 개인에 관한 정보를 추출하기는 어렵다. 데이터를 외부에 공개할 경우에도 차분 프라이버시 방법으로 난수를 더함으로써 공개한 데이터에서 특정 개인의 정보가 누출될 위험을 줄일 수 있다.

일반적으로 프라이버시 보호 기술로는 특정 개인을 식별할 수 없도록 원 데이터 자체를 가공하는 익명화 방법이 자주 활용되고 있다. 익명화에서는 'k-익명성' 등의 평가 지표를 기준으로 데이터를 가공한다. 한편, 차분 프라이버시는 원 데이터가 아닌 추출한 통계치 등을 가공하는 방식이기 때문에 일반적인 통계 분석에서 기계학습까지 폭넓게 사용할 수 있다는 이점이 있다.

구글이나 마이크로소프트는 차분 프라이버시를 구현할 수 있는 라이브러리를 오픈 소스 소프트웨어로서 공개하고 있다.

-- 애플이나 구글 등이 활용 --
차분 프라이버시 활용 사례가 늘어나는 계기가 된 것은 애플이 2016년 개발자 회의 'WWDC'에서 차분 프라이버시를 언급한 것이다.

애플이나 구글은 차분 프라이버시를 활용해 프라이버시 보호와 데이터 이용 및 활용의 양립을 도모하고 있다. 예를 들면, 애플은 이용자에게 부여하는 ‘Apple ID’와 개인의 데이터가 연관되는 것을 막기 위해 프라이버시 보호 기술의 하나로 차분 프라이버시를 채택하고 있다.

구글은 '구글 맵'에서 시설 등이 혼잡한 시간대나 실시간 혼잡 상황을 표시하는 기능에 차분 프라이버시를 채택하고 있다. 혼잡 상황을 표시하는 기능은 구글 계정에서 위치 정보 데이터인 '로케이션 이력'을 활성화하는 사용자의 데이터를 기반으로 집계한다.

구글은 이 데이터에 차분 프라이버시를 사용해 로케이션 이력의 데이터 세트에 난수를 추가하고 있다. 이를 통해 개인의 익명성을 유지하면서 혼잡 상황도 표시할 수 있게 되었다.

이 밖에도 미국에서는 2020년 인구조사부터 차분 프라이버시를 활용해 국민의 익명성을 담보로 소득이나 학력 등에 대한 상세한 결과와 이것들을 주(州) 별로 집계한 데이터 등을 공개하고 있다.

차분 프라이버시에 관한 연구는 현재도 진행되고 있으며, GAFA 등의 대형 IT기업들이 연구 및 실장을 추진하고 있다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

목차