베르누이 혼합 네트워크를 활용한 고성능 베이지안 구조 추정

** 베르누이 혼합 네트워크(BMN)는 각 이산 노드의 조건부 확률분포(CPD)를 여러 개의 간단한 서브구조(부모 집합)의 혼합으로 표현한다. EM 기반 학습으로 파라미터와 혼합 비율을 동시에 추정하며, 서브구조의 복잡도를 제한함으로써 과적합을 효과적으로 억제한다. 인공 데이터와 온라인 어드벤처 게임 로그에 대한 실험에서 기존 베이지안 네트워크 대비 예측 정확도가 크게 향상되었으며, 특히 키홀 플랜 인식(task)에서 뛰어난 성능을 보였다.…

저자: Geoff A. Jarrad

** 본 논문은 베이지안 네트워크(BN)의 파라미터 추정 문제에 새로운 접근법을 제시한다. 기존 연구에서는 조건부 확률분포(CPD)를 신경망(Neal 1992), noisy‑OR(Neal 1992, Diez 1993), 의사결정 트리(Friedman & Goldszmidt 1996) 등으로 표현함으로써 모델의 표현력을 강화하려 했다. 그러나 이러한 방법들은 각각 구조적 제약이나 학습 복잡도 측면에서 한계를 가지고 있다. 본 연구는 이러한 한계를 극복하기 위해 **베르누이 혼합 네트워크(Bernoulli Mixture Network, BMN)** 라는 새로운 모델을 도입한다. BMN은 이산형 노드의 CPD를 여러 개의 “로컬 서브구조”(각기 다른 부모 집합)들의 베르누이 분포 혼합으로 명시한다. 즉, 하나의 노드가 가질 수 있는 부모 집합을 고정하지 않고, 여러 후보 부모 집합을 동시에 고려한다. 각 서브구조는 독립적인 베르누이 파라미터와 혼합 비율을 갖으며, 전체 CPD는 이들의 가중합으로 정의된다. ### 1. 모델 정의 - **노드 \(X_i\)** : 이산형 변수, 값은 \(\{0,1\}\). - **서브구조 집합 \(\mathcal{S}_i = \{S_{i1},\dots,S_{iK_i}\}\)** : 각 \(S_{ik}\)는 부모 변수들의 부분집합. - **베르누이 파라미터 \(\theta_{ik}\)** : \(P(X_i=1|S_{ik})\) 를 나타내는 베르누이 확률. - **혼합 비율 \(\pi_{ik}\)** : \(\sum_k \pi_{ik}=1\). 전체 네트워크의 결합 확률은 \

베르누이 혼합 네트워크를 활용한 고성능 베이지안 구조 추정

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기