네트워크 노드 분류를 위한 능동 학습 동질 이질 구조 모두 대응

본 논문은 네트워크의 토폴로지는 알려져 있지만 노드 라벨은 숨겨진 상황에서, 소수의 노드 라벨을 획득해 전체 노드 라벨을 정확히 예측할 수 있는 능동 학습 알고리즘을 제안한다. 확률적 블록 모델을 기반으로 각 노드의 라벨과 나머지 노드 라벨 간의 상호 정보를 추정하고, 상호 정보가 가장 큰 노드를 순차적으로 탐색한다. 실험은 사회적 클럽 네트워크, 소설 속 단어 인접 네트워크, 남극 해양 먹이망 등 세 가지 실제 데이터에 대해 수행했으며, 기존…

저자: Cristopher Moore, Xiaoran Yan, Yaojia Zhu

네트워크 노드 분류를 위한 능동 학습 동질 이질 구조 모두 대응
본 논문은 “노드 라벨이 숨겨진 네트워크에서 소수의 라벨만을 획득해 전체 라벨을 정확히 예측하는” 문제를 다루며, 이를 위해 정보 이론과 확률적 그래프 모델을 결합한 새로운 능동 학습 프레임워크를 제시한다. 1. **문제 정의 및 동기** - 현실 세계의 사회·생물·기술 네트워크에서는 노드가 특정 속성(정치 성향, 종의 서식지, 품사 등)을 가지고 있지만, 이러한 속성은 직접 관측하기 어렵다. 반면 네트워크의 연결 구조는 비교적 쉽게 얻을 수 있다. 따라서 제한된 비용(실험, 현장 조사 등)으로 몇몇 노드의 라벨만을 알게 되면, 나머지 노드의 라벨을 추론하고자 하는 상황이 빈번히 발생한다. - 기존 연구는 주로 “동질성(assortative) 커뮤니티”를 전제로 하여, 같은 라벨을 가진 노드가 서로 많이 연결되는 경우에 초점을 맞추었다. 그러나 실제 네트워크는 동질성뿐 아니라 이질성(disassortative) 구조, 방향성, 복합적인 라벨-연결 관계를 동시에 포함한다. 2. **모델링: 확률적 블록 모델(SBM)** - 네트워크 G=(V,E)를 라벨 집합 {1,…,k}에 따라 생성되는 확률적 블록 모델로 가정한다. 각 라벨 쌍 (i,j)마다 연결 확률 p_{ij}를 두고, 모든 가능한 (u,v) 쌍에 대해 독립적으로 존재 여부를 결정한다. - 베이지안 관점에서 p_{ij}에 베타 사전분포(α,β)를 부여하고, 이를 적분해 라벨 t에 대한 주변가능도 P(G|t)를 얻는다. α=β=1(균등 사전)으로 설정하면 사전 영향이 최소화되어 데이터가 구조를 스스로 학습한다. - 이 모델은 (i) 동질성(p_{ii}>p_{ij}), (ii) 이질성(p_{ii}

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기