대학 관계 분석을 위한 이중선형·이중선형 혼합효과 모델
본 논문은 대학 간 협력·교류 데이터를 dyadic 형태로 모델링하기 위해 선형 랜덤효과와 이중선형(bilinear) 랜덤효과를 결합한 혼합효과 모델을 제안한다. 회귀 변수와 함께 3차 의존성(전이성, 클러스터링, 균형)까지 동시에 추정할 수 있는 베이지안 MCMC 알고리즘을 개발하고, 1991‑2005년 이란 대학 박사 과정 졸업생 간 관계 데이터에 적용하여 두 차원 및 세 차원 의존구조의 존재와 강도를 확인한다.
저자: S. Alimoradi, M. Khalilian
본 논문은 “Bilinear Mixed Effects Models For Relations Between Universities”라는 제목 아래, 대학 간 관계를 dyadic 데이터 형태로 분석하기 위한 새로운 통계 모델을 제시한다. 서론에서는 사회네트워크 데이터가 일반적으로 n명의 행위자와 그들 사이의 관계 y_{ij}로 구성되며, 기존 연구는 주로 이진 관계(존재/부재)와 단순 랜덤 효과에 초점을 맞추었다는 점을 지적한다. 그러나 실제 사회과학 연구에서는 연속형·계수형 관계와 회귀변수가 동시에 존재하는 경우가 많으며, 이러한 복합 데이터를 다루기 위한 일반화된 회귀 프레임워크가 필요함을 강조한다.
첫 번째 이론적 부분에서는 ‘잠재 공간(Latent Space)’ 접근법을 소개한다. 각 행위자 i는 잠재 벡터 z_i를 가지고, 두 행위자 사이의 관계는 이 벡터 간 거리 혹은 내적에 의해 결정된다고 가정한다. 기존 연구는 거리 기반 모델(예: 로그-오즈 회귀에서 |z_i−z_j|)을 주로 사용했지만, 본 논문은 내적(z_i′z_j) 형태의 이중선형(bilinear) 효과를 도입한다. 내적은 양의 3차 모멘트를 생성해 전이성(transitivity), 클러스터링(clusterability), 균형(balance) 같은 삼차 의존성을 자연스럽게 포착한다.
다음으로 선형 혼합효과 모델을 제시한다. y_{ij}=β′x_{ij}+ε_{ij} 형태의 기본 회귀식에 대해, ε_{ij}를 a_i + a_j + γ_{ij} 로 분해한다. 여기서 a_i는 행위자 i의 송신·수신 공통 효과, γ_{ij}는 dyad‑specific 상호작용을 의미한다. 이 구조는 행·열 교환가능성(exchangeability) 가정에 기반해 오류 행렬이 대칭적이며, Gaussian 가정 하에 공분산 구조를 명시적으로 기술한다.
핵심은 선형 효과와 이중선형 효과를 결합한 ‘Bilinear Mixed Effects Model’이다. 모델 식은
θ_{ij}=β_d x_{ij}+s_i+s_j+γ_{ij}+z_i′z_j
이며, s_i=β_s x_{s,i}+a_i 로 정의된다. 여기서 x_{ij}는 dyad‑specific 회귀변수, x_{s,i}와 x_{s,j}는 각각 송신·수신 전용 회귀변수이다. 이 식은 일반화 선형 모델(generalized linear model) 형태로, 링크 함수 g(·)를 통해 이항, 포아송, 정규 등 다양한 데이터 유형에 적용 가능하다.
베이지안 추정 방법으로는 Gibbs 샘플링과 Metropolis‑Hastings를 결합한 MCMC 알고리즘을 설계한다. 구체적인 단계는 다음과 같다. (1) 선형 고정효과 β_d, β_s와 랜덤 효과 a_i, γ_{ij}를 각각 정규·역감마 사전분포를 두고 전조건 분포를 샘플링한다. (2) 잠재 벡터 z_i를 다변량 정규 사전(MVN(0,Σ_z))으로 두고, 선형 회귀 형태의 전조건을 이용해 업데이트한다. (3) dyad‑specific 파라미터 θ_{ij}는 제안분포(MVN)에서 Metropolis‑Hastings 수용률을 계산한다. (4) 공분산 Σ_γ와 Σ_z는 역와이시트(Inverse‑Wishart) 혹은 역감마 사전으로 추정한다. 각 단계마다 전조건 분포는 폐형식으로 도출되며, 이는 계산 효율성을 크게 향상시킨다.
모델 식별성을 위해 두 가지 전략을 사용한다. 첫째, x_{i}와 x_{j}를 별도 회귀변수로 분리해 선형 효과와 이중선형 효과가 혼동되지 않도록 한다. 둘째, 잠재 차원 K를 사전에 정하고 Σ_z를 σ^2_z I_K 로 제한해 스케일 불확정성을 제거한다.
실증 분석에서는 1991‑2005년 사이 이란 내 대학 박사 과정 졸업생 간의 협력 관계를 dyadic 행렬 Y로 구성한다. 회귀변수로는 전공 분야 유사성, 지리적 거리, 학위 연도 차이 등을 포함한다. 모델 추정 결과, a_i와 a_j가 각각 송신·수신 효과를 설명하면서도 γ_{ij}가 남은 이질성을 포착한다는 점이 확인되었다. 특히, z_i′z_j 항의 평균이 양수이며, 그 분산이 유의미하게 추정돼 동일 분야·동시기 졸업생 간에 높은 전이성 및 클러스터링이 존재함을 시사한다. 3차 모멘트 E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기