다중 정보제공자 환경에서 제공자의 특성 차이에 의한 속성노출을 방지하는 익명화 기법
An Anonymization Technique to Prevent Attribute Disclosure by Difference of Provider’s characteristics in Multiple Data Provider Environments
- 주제(키워드) 프라이버시 , 익명화 , privacy , anonymization
- 발행기관 서강대학교 일반대학원
- 지도교수 박석
- 발행년도 2011
- 학위수여년월 2011. 8
- 학위명 석사
- 학과 및 전공 일반대학원 컴퓨터공학과
- 실제URI http://www.dcollection.net/handler/sogang/000000046845
- 본문언어 한국어
- 저작권 서강대학교의 논문은 저작권보호를 받습니다.
초록/요약
다중 정보제공자 환경은 개인에 대한 데이터를 보유하고 있는 기관 및 제공자가 데이터 관리의 독립성을 유지하면서 개인의 프라이버시를 침해하지 않고 연구 및 기타 목적으로 개인에 관한 데이터를 배포하는 환경이다. 다중 정보제공자 환경에서 각각의 제공자들은 지역, 위치, 전문성 등의 고유한 특성을 지니고 있다. 그러나 시스템 특성상 제공자들이 전체 데이터 중 일부를 보유하고 있기 때문에 이를 토대로 개인의 프라이버시를 침해 할 우려가 있다. 만약 이러한 제공자의 특성, 환경을 충분하게 고려하지 않은 채 기존의 익명화 기법을 적용할 경우, 프라이버시 침해가 나타날 수 있는 문제점이 있다. 본 논문은 다중 정보제공자 환경에서 익명화 기법으로 LeFevre의 최대 길이 기반의 분할 선택방법에 추가적으로 레코드들이 속한 클래스들의 구별성이 낮도록 익명화 그룹을 형성할 때에 인센티브를 부여하여 정보유용성을 최대화 하면서 제공자 특성 차이를 이용한 추론 공격 위험을 완화하는 알고리즘을 제시한다. 또한 다중 정보제공자 환경에서 속성노출을 방지하기 위해 익명화 그룹의 특성을 세분화하여 각각의 공격에 대해 취약한 상태와 안전한 상태를 판별할 수 있는 기준을 마련하였다. 마지막으로 속성노출에 취약한 익명화 그룹의 프라이버시를 강화하기 위해 응집도(cohesion) 개념을 이용하여 최소한의 레코드 교환으로 프라이버시를 강화하는 효율적인 알고리즘을 제시한다.
more초록/요약
Multiple data provider environment is that data holders such as hospitals or institutions who has information of individuals cooperate with others keeping their data independent and protecting privacy of individuals in order to provide the information for research or specific purpose. In our scenario, each data provider originally has a difference from their specialty, geographical location and others. Data provider in the protocol, has a portion of integrated anonymized data, however, may violate privacy of individuals or other provider by comparing his one and integrated one using provider’s characteristics. Without consideration for provider’s characteristic and multiple data provider environment, traditional anonymization techniques such as k-anonymity will suffer from privacy violation. In this thesis, we suggest a revised Mondrian algorithm which is multi-dimensional anonymizaion technique to archive k-anonymity and to form equivalence class having low distinguishability between other provider’s data by combining widest range based metric and entropy based one. In addition, we provide a criterion which detects vulnerable EC by categorizing state of EC. Finally, we propose a s-cohesion algorithm which efficiently enhance privacy protection level by minimized record swap using a novel notion called cohesion.
more

