방향성 네트워크에서의 무작위 보행과 응답자 주도 표본추출 추정법

본 논문은 기존 RDS(응답자 주도 표본추출) 방법이 가정하는 무방향(양방향) 네트워크 한계를 넘어, 방향성을 가진 사회 네트워크에서도 적용 가능한 새로운 추정법을 제시한다. 저자들은 방향 및 무방향 엣지를 구분하고, 무방향 엣지를 통한 2단계 복귀 현상을 고려한 랜덤 워크 모델을 구축하여, 샘플링된 개인의 출입 차수(Outgoing degree)를 이용해 선택 확률을 추정한다. 인공 및 실제 네트워크 실험을 통해 제안 방법이 기존 추정법보다 …

저자: Jens Malmros, Naoki Masuda, Tom Britton

본 논문은 응답자 주도 표본추출(RDS)이 하드‑투‑리치(population) 집단의 특성을 추정하는 데 널리 사용되지만, 기존 이론이 전제하는 “무방향(양방향) 사회 네트워크” 가정이 실제 상황과 크게 다를 수 있다는 문제점을 지적한다. 이메일, 트위터, 온라인 커뮤니티 등에서 비대칭 관계가 흔히 발견되며, 이러한 방향성은 랜덤 워크의 정류분포를 복잡하게 만든다. 따라서 기존 VH(VH‑Estimator)와 같은 RDS 추정법은 편향을 초래한다. 저자들은 먼저 방향성 및 무방향 엣지를 구분하고, 무방향 엣지를 통한 2‑step 복귀 현상을 명시적으로 모델링한 새로운 랜덤 워크 프레임워크를 제시한다. 그래프 G는 N개의 정점으로 구성되며, 각 정점 i는 무방향 차수 d_un(i), 입력 차수 d_in(i), 출력 차수 d_out(i) 로 기술된다. 랜덤 워크는 현재 정점 i에서 무방향 혹은 출력 엣지를 균등 확률로 선택해 이동한다. 이때 무방향 엣지를 통해 두 단계 뒤에 다시 i 로 돌아오는 확률 p(ret)_i 와 장기적으로 i 를 방문할 확률 p(vis)_i 를 각각 정의한다. Renewal Theory 를 적용해, 한 번의 “renewal cycle”은 (i) 연속적인 2‑step 복귀 Z_i (Geometric 분포, 성공 확률 1‑p(ret)_i)와 (ii) i 를 떠난 뒤 다시 방문하기까지의 단계 Y_i (Geometric 분포, 성공 확률 p(vis)_i) 로 구성된다. 평균 사이클 길이는 2·E

방향성 네트워크에서의 무작위 보행과 응답자 주도 표본추출 추정법

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기