제약된 표본공간에서의 정규분포: 양의 실수와 단순체에 대한 새로운 기하학적 접근
본 논문은 양수 실수와 D‑파트 단순체와 같이 제한된 표본공간에 대해, 전통적인 유클리드 기하와 Lebesgue 측정 대신 로그 변환 기반의 내적·거리 구조와 전용 측정 λ_E를 도입하여 정규분포를 정의하고, 그 성질을 정리한다.
저자: G. Mateu-Figueras, V. Pawlowsky-Glahn, J.J. Egozcue
본 논문은 제한된 표본공간, 특히 양의 실수선 ℝ_+와 D‑파트 단순체 Δ^{D-1} 에서 정규분포를 정의하고 그 성질을 체계적으로 정리한다. 서론에서는 전통적인 통계 분석이 실수공간 ℝ^D 에서 Lebesgue 측정과 표준 유클리드 기하를 전제로 하지만, 비율·비율·백분율 등 제한된 공간에서는 이러한 전제가 부적절함을 지적한다. 특히 비율 데이터는 스퓨리어스 상관관계와 같은 왜곡을 초래한다는 고전적 예시를 제시한다.
2절에서는 일반적인 제한된 공간 E⊂ℝ^D 에 대해 일대일 미분가능 매핑 h:E→ℝ^d (d≤D) 가 존재한다면, h를 통해 E에 유클리드 벡터공간 구조와 자연 측정 λ_E 를 도입할 수 있음을 보인다. 내부합 ⊕와 외부곱 ⊙는 h⁻¹( h(x)+h(y) ) 및 h⁻¹( α·h(x) ) 로 정의되고, 내적 ⟨x,y⟩_E =⟨h(x),h(y)⟩ 로부터 노름·거리 구조가 유도된다. λ_E는 λ_d와 동등하게 정의되며, 확률밀도 f_E는 좌표밀도 f_Y와 단순히 f_E(x)=f_Y(h(x)) 로 표현된다. 이는 Jacobian 보정이 필요 없다는 장점을 제공한다. 기대값, 분산, 모드 등도 h를 통해 ℝ^d 의 전통적 정의와 일관되게 계산된다(식 5‑7).
3절에서는 ℝ_+ 를 사례로 삼는다. 여기서 h(x)=ln x 로 정의하면, 내부합은 곱셈, 외부곱은 거듭제곱이 된다. 내적은 ln x·ln y 로 정의되고, 거리 d_+(x,y)=|ln x−ln y| 가 된다. λ_+는 구간 (a,b) 에 대해 λ_+(a,b)=|ln b−ln a| 로 정의되며, 이는 dλ_+/dλ =1/x 로 표현된다. 이러한 구조 하에서 정의된 정규분포 N_+(μ,σ²) 의 밀도는 (1) f_+(x)= (1/(√2πσ))·exp{−½
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기