검색 상세

개인정보 데이터집합에서 삭제 연산시 익명성 유지 기법 : Anonymity Maintenance Technique of Privacy Dataset with Delete Operation

  • 발행기관 서강대학교 대학원
  • 지도교수 박석
  • 발행년도 2007
  • 학위수여년월 200702
  • 학위명 석사
  • 학과 및 전공 컴퓨터학
  • 식별자(기타) 000000103509
  • 본문언어 한국어

초록/요약

데이터를 배포할 때 개인적인 정보를 보호하기 위해서 데이터 관리자는 이름이나 주민등록 번호와 같이 개인을 식별할 수 있는 정보를 암호화 하거나 삭제하여 배포한다. 이러한 익명화를 하더라도 배포되는 여러 정보들을 서로 연결해서 개인의 신원을 식별하고 개인의 정보가 노출되는 문제가 있다. 이런 문제를 해결하는 기술로써 최근 몇 년간 k-anonymity 모델을 기초로 한 데이터 익명화 기법들이 연구 되었다. k-anonymity 관련 기술들이 데이터의 개인정보를 보호하는데 기여를 하였지만 기존의 연구들은 데이터의 삽입이나 삭제가 없는 정적인 환경을 가정하고 있다. 일부 몇몇의 경우에는 이러한 환경이 만족하지만 현실세계의 대부분의 데이터베이스는 지속적으로 삽입과 삭제가 일어난다. 이러한 동적인 데이터베이스 환경에 기존의 기법들을 그대로 적용할 경우 갱신된 데이터의 내용이 반영됨으로써 개인정보가 유출되는 취약성이 발견된다. 데이터의 삽입에 의해 발생하는 문제는 Byun에 의하여 해결되었다. 하지만 삭제연산을 처리하는 방법은 아직 해결되지 못했다. 그 이유는 삽입연산과는 달리 삭제연산을 반영할 경우 익명화 되어 배포된 데이터 테이블의 익명화 규칙인 k-anonymity와 ℓ-diversity가 손상되는 문제가 추가적으로 발생한다. 본 논문에서는 삭제연산이 이루어짐에 따라 k-anonymity와 ℓ-diversity가 무너지는 경우를 분석하고 삭제 후에도 k-anonymity와 ℓ-diversity를 그대로 유지할 수 있는 기법을 제안한다.

more

초록/요약

To protect personal information when releasing data, data manager must remove or encrypt the explicit identifiers such as names and social security numbers. De-identifying data, however, provides no guarantee of anonymity because released information can be linked to publicly available information to re-identify them and to infer information that was not intended for release. Recently the technique which solves like this problem were researched that based on k-anonymous. The k-anonymity related researches contribute to protect personal information data. However these are assuming the static environment which is not exist insert and delete operation. While this may be acceptable in some applications, today we see databases continuously growing everyday and even every hour. In such dynamic environments, the current techniques may suffer from poor data quality and/or vulnerability to inference. The problem of insertion operation was solved by the Byun, but the method which controls a delete operation is not still solved. The reason is processing the delete operation contain additional problem. After delete operation, the anonymity of released table maybe broken. In this thesis, we present an approach to securely anonymizing a continuously decreasing dataset in an efficient manner.

more