샘플 공개 위험 추정을 위한 지역 스무딩 모델

본 논문은 표본 빈도표에서 개인 식별 위험을 추정하기 위해, 인접 셀(유사 속성값을 가진 셀) 정보를 활용한 스무딩 기법을 제안한다. 기존의 로그선형 모델과 Argus 방법과 비교하여, 지역 이웃을 이용한 추정이 작은 모집단 셀을 더 정확히 파악함을 실험을 통해 보여준다.

저자: ** - Yosef Rinott (히브리 대학교, 이스라엘) - Natalie Shlomo (히브리 대학교, 이스라엘 & 사우샘프턴 대학교

본 논문은 표본 빈도표를 공개할 때 발생할 수 있는 개인 식별 위험을 정량화하고, 이를 최소화하기 위한 추정 방법을 개발한다. 위험은 주로 표본 셀과 모집단 셀 모두가 작을 때, 특히 표본 유니크(표본에서 한 번만 나타나는 셀)가 모집단 유니크와 일치할 가능성에서 발생한다. 이를 측정하기 위해 두 가지 전역 위험 지표 τ₁과 τ₂를 정의한다. τ₁은 표본 유니크가 동시에 모집단 유니크인 경우의 수, τ₂는 표본 유니크가 맞출 수 있는 기대 횟수를 나타낸다. 위험 추정은 표본 f와 모집단 파라미터 F 사이의 조건부 분포 F|f를 모델링하고, 해당 분포에서 P(F_k=1|f_k=1)와 E

샘플 공개 위험 추정을 위한 지역 스무딩 모델

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기