대규모 마진 볼츠만 머신과 대규모 마진 시그모이드 베리프 네트워크

현재 구조화된 예측을 위한 통계 모델들은 그래프 구조의 트리폭이 커짐에 따라 정확한 추론이 불가능해지는 문제를 피하기 위해 저차원 마코프 체인과 같은 단순한 가정을 사용한다. 반면 근사 추론 알고리즘은 표현력과 계산 효율성 사이의 트레이드오프를 강요한다. 본 논문에서는 구조화된 예측을 위해 두 종류의 새로운 확률 그래프 모델, 즉 대규모 마진 볼츠만 머신(LMBM)과 대규모 마진 시그모이드 베리프 네트워크(LMSBN)를 제안한다. 특히 LMSB…

저자: Xu Miao, Rajesh P.N. Rao

대규모 마진 볼츠만 머신과 대규모 마진 시그모이드 베리프 네트워크 현재 구조화된 예측을 위한 통계 모델들은 그래프 구조의 트리폭이 커짐에 따라 정확한 추론이 불가능해지는 문제를 피하기 위해 저차원 마코프 체인과 같은 단순한 가정을 사용한다. 반면 근사 추론 알고리즘은 표현력과 계산 효율성 사이의 트레이드오프를 강요한다. 본 논문에서는 구조화된 예측을 위해 두 종류의 새로운 확률 그래프 모델, 즉 대규모 마진 볼츠만 머신(Large Margin Boltzmann Machines, LMBM)과 대규모 마진 시그모이드 베리프 네트워크(Large Margin Sigmoid Belief Networks, LMSBN)를 제안한다. 특히 LMSBN은 임의의 그래프 구조에 대해 높은 확률로 다항 시간 내에 실행되는 매우 빠른 추론 알고리즘을 제공한다. 이 확률은 데이터 분포에 의존하며 학습 과정에서 최대화된다. 새로운 접근법은 기존 모델이 겪어온 표현력‑효율성 트레이드오프를 극복하고 복잡한 그래프 구조에서도 빠른 구조화된 예측을 가능하게 한다. 우리는 완전 연결 모델을 다중 라벨 장면 분류에 적용한 결과, 제안된 방법이 현재 최첨단 방법보다 현저한 성능 향상을 달성함을 보여준다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기