베이지안 네트워크와 확률 구조 인과 모델의 관계

본 논문은 베이지안 네트워크(BN)와 확률적 구조 인과 모델(Probabilistic Structural Causal Model, PSCM) 사이의 관계를 이론적으로 탐구한다. 서론에서는 인과 추론에 대한 관심이 증가하면서 전통적인 확률 그래프 모델인 BN이 구조 인과 모델(SCM)로 대체되는 현상을 소개하고, 이러한 전환이 의미하는 바를 질문한다. 특히 BN이 전문가 지식이나 데이터 학습을 통해 얻어진 경우, 이를 결정론적 인과 메커니즘을 포함하는 PSCM으로 매핑할 수 있는지, 그리고 그 과정에서 모델 구조와 확률분포에 어떤 제약이 발생하는지를 핵심 연구 질문으로 제시한다. 2절에서는 치료(T)와 실명(B)이라는 간단한 이진 변수 예시를 통해 문제를 직관적으로 설명한다. BN에서는 P(B|T)라는 조건부 확률표가 직접 정의되지만, PSCM에서는 치료와 실명 사이의 인과 관계를 함수 f_B(T) = 1−T 로 표현하고, 외생 변수 R을 도입해 불확실성을 모델링한다. R의 이진 확률분포 P(R)만으로 두 조건부 확률을 재현할 수 있음을 보이며, 이는 외생 변수 하나로 두 개의 조건부 분포를 압축할 수 있는 특수한 경우임을 강조한다. 3절에서는 베이지안 네트워크와 구조 인과 모델의 형식적 정의를 제시한다. BN은 DAG G와 변수 집합 X, 그리고 각 노드의 조건부 확률분포 P(X_v|X_pa(v)) 로 구성된다. SCM은 동일한 DAG와 변수 집합을 갖지만, 각 노드가 부모 변수들의 함수 f_v 로 결정되는 결정론적 관계를 가진다. PSCM은 SCM에 외생 변수 U와 그 독립적인 확률분포 P'(U) 를 추가하여 전체 결합분포를 P'(X_V, U_W) = ∏_v P'(X_v|X_pa(v)) ∏_w P'(U_w) 로 정의한다. 4절에서는 외생 변수와 함수 f_v 사이의 관계를 수학적으로 분석한다. 함수 f_v 가 surjective(전사)임을 가정하고, 고정된 부모값에 대해 역함수 f_v⁻¹|pa(v) 를 정의한다. 이를 통해 조건부 확률 P'(x_v|x_pa(v)) = Σ_{u∈f_v⁻¹|pa(v)(x_v)} P'(U_w = u) 로 표현한다. 또한, marginal화 식 P'(X_v|x_pa(v)) = Σ_u P'(X_v|x_pa(v), U_w = u) P'(U_w = u) 를 제시하여 두 가지 계산 방법을 제시한다. 5절은 논문의 핵심 기여로, 선형대수와 선형계획법을 이용해 BN ↔ PSCM 변환을 체계화한다. 조건부 확률표를 행렬 A 로, 외생 변수 확률벡터 p 로 표현하고, 함수 매핑을 행렬 M 으로 나타낸다. 변환 가능성은 선형 시스템 A = M·diag(p) 가 해를 갖는지 여부와, 해의 유일성은 M 의 열이 선형 독립인지에 달려 있다. 선형계획법을 통해 p 를 최적화함으로써 주어진 BN의 모든 조건부 확률을 정확히 재현하는 외생 변수 분포를 찾을 수 있다. 6절에서는 파이썬 기반 실험 소프트웨어를 소개한다. 입력으로 BN의 구조와 조건부 확률표를 받아, 자동으로 행렬화하고, scipy.optimize.linprog 를 이용해 외생 변수 확률벡터를 계산한다. 여러 예시(예: 치료-실명, 다중 외생 변수)에서 변환 성공 여부를 실험하고, 변환이 가능한 경우 원본 BN과 재구성된 PSCM이 동일한 관측 분포를 생성함을 확인한다. 7절은 결론으로, BN과 PSCM 사이의 변환이 가능할 때와 불가능할 때의 차이를 정리한다. 변환이 가능하면 인과 메커니즘을 명시적으로 모델링하면서도 원본 BN이 제공하는 확률적 정보를 보존할 수 있다. 그러나 변환이 불가능한 경우는 외생 변수의 차원 부족이나 함수 f_v 의 비전사성 등 구조적 제약 때문이며, 이는 BN이 표현할 수 있는 인과적 의미가 제한됨을 의미한다. 향후 연구에서는 비선형 함수, 연속 변수, 그리고 학습 과정에서의 변환 알고리즘 개발을 제안한다.

베이지안 네트워크와 확률 구조 인과 모델의 관계

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기