인과 모델은 완전한 공리화가 불가능함

본 논문은 베이지안 네트워크가 표현하는 인과 모델이 유한하거나 가산한 수의 Horn·디스정합 절을 이용한 완전한 공리 체계로는 기술될 수 없음을 증명한다. 핵심은 인과 모델의 부분 모델이 다시 인과 모델이 될 필요가 없다는 점이며, 이는 무방향 그래프 기반의 그래프‑동형 모델과는 달리 폐쇄성을 상실한다는 사실에서 비롯된다.

저자: Sanjiang Li

이 논문은 확률 모델에서 조건부 독립(CI) 관계를 그래픽 구조로 표현하는 두 가지 주요 방법, 즉 무방향 그래프에 기반한 마코프 네트워크와 방향성 비순환 그래프(DAG)에 기반한 베이지안 네트워크(인과 모델)를 비교한다. 기존 연구에서는 무방향 그래프가 표현하는 그래프‑동형 모델이 semi‑graphoid 공리 네 개(대칭성, 감소성, 교환성, 삼각형 공리)만으로 완전히 기술될 수 있음을 보여주었으며, 이는 유한하거나 가산한 Horn 절·디스정합 절 집합으로도 충분함을 의미한다. 반면, 베이지안 네트워크는 d‑separation이라는 복잡한 분리 규칙에 의해 정의되며, 이는 콜리전 구조와 방향성을 동시에 고려한다. 논문은 이러한 인과 모델이 “부분 모델에 대한 폐쇄성”을 상실한다는 핵심 사실을 증명한다. 먼저, 논문은 독립성 논리(I L)를 도입하여 CI 관계를 논리식으로 표현하고, Horn 절(전건이 여러 개, 후건이 하나)와 디스정합 절(전건·후건이 여러 개)으로 구성된 공리 체계의 정의를 제시한다. 공리화란, 특정 독립성 모델 집합 M이 주어졌을 때, 모든 모델이 동일한 공리 집합 F를 만족하고, 반대로 F를 만족하는 모든 모델이 M에 속함을 의미한다. 이때, 공리 집합이 유한하거나 가산하면 실제 알고리즘적 활용이 가능하다. 다음으로, 부분 모델(sub‑model)의 개념을 정의한다. M|V는 원래 모델 M을 변수 집합 V에 제한한 것으로, 모든 독립성 삼중항이 V 안에만 포함된다. 논문은 일반적인 경우에 대해 “M이 어떤 성질을 만족하면 M|V도 동일한 성질을 만족한다”는 명제(Prop 4.1)를 증명한다. 이는 그래프‑동형 모델과 CI 관계 전체에 대해 성립한다. 구체적으로, 무방향 그래프 G가 주어지면, V에 대한 제한 그래프 G′를 구성하여 분리 관계가 그대로 유지됨을 보인다(Lemma 4.1, Prop 4.2). 따라서 그래프‑동형 모델은 부분 모델에 대해 닫혀 있다. 그러나 인과 모델에 대해서는 동일한 성질이 깨진다. 저자는 그림 1에 제시된 DAG D와 변수 집합 V={1,2,3,4}를 예시로 든다. 원래 모델 M은 D에 의해 정의되며, M|V는 몇몇 변수 쌍(1‑2, 2‑3, 3‑4) 사이에 어떠한 조건부 독립도 존재하지 않는다는 D(α,β) 관계를 가진다. 동시에 I(1,∅,3), I(1,4,3), I(2,∅,4), I(2,1,4)와 같은 독립성도 존재한다. 이러한 관계들을 동시에 만족시키는 DAG는 존재할 수 없으며, 구체적으로는 2→3와 2←3가 동시에 나타나야 하는 모순이 발생한다. 따라서 M|V는 어떠한 DAG로도 표현될 수 없고, 인과 모델 집합이 부분 모델에 대해 닫히지 않음을 증명한다. 이 비폐쇄성은 공리화 이론에 직접적인 영향을 미친다. 만약 어떤 독립성 모델 집합이 부분 모델에 대해 닫히지 않으면, 그 집합을 Horn 절이나 디스정합 절의 가산 집합으로 완전히 기술할 수 없다는 것이 Proposition 4.1의 역과정이다. 따라서 인과 모델 전체를 포괄하는 완전한 공리 체계는 존재하지 않는다. 이는 기존의 부정적 결과(Studeny 등)와 일치하며, 인과 모델이 그래프‑동형 모델과 근본적으로 다른 구조적 특성을 가진다는 점을 강조한다. 논문의 마지막 부분에서는 이 결과가 인과 추론 알고리즘 설계에 미치는 함의를 논의한다. 공리화가 불가능하다는 것은, 베이지안 네트워크에서 독립성 관계를 순수 논리적 규칙만으로 완전히 추론할 수 없으며, 실제 확률 분포에 대한 계산적 접근이 필수적임을 의미한다. 또한, 부분 모델이 인과 모델이 아닐 수 있다는 사실은 모델 축소, 변수 제거, 혹은 부분 관측 데이터에 기반한 학습 과정에서 주의가 필요함을 시사한다. 전체적으로, 논문은 인과 모델의 복잡성을 명확히 규정하고, 그래프‑이론과 논리학적 관점에서 그 한계를 체계적으로 제시한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기