동시 검정의 함정: 언제 가설을 결합하고 언제 분리할 것인가

본 논문은 현대 생명과학·의학 연구에서 흔히 발생하는 수천~수만 개의 가설 검정을 어떻게 효율적으로 처리할 것인가에 대한 근본적인 질문을 제기한다. 전통적으로는 Benjamini–Hochberg(FDR)와 같은 전역적인 오류 제어 방법을 전체 데이터에 일괄 적용하는 것이 일반적이었다. 그러나 저자는 이러한 “전체 결합” 접근법이 서브그룹 간 신호 강도·분포 차이를 무시함으로써, 과도하게 보수적이거나 반대로 과도하게 자유로운 결과를 초래할 수 있음을 여러 사례를 통해 경고한다. 1. **두‑그룹 베이즈 모델** 각 검정 통계량 z_i는 Null(표준 정규)와 Non‑null(알 수 없는) 두 밀도의 혼합으로 모델링한다. 사전 확률 p₀는 보통 0.9 이상으로 가정한다. 이 모델은 FDR와 local‑fdr(밀도 기반) 정의의 기초가 된다. 2. **Separate‑Class 모델 도입** 전체 N개의 검정을 관측 가능한 클래스 A와 B(예: 전두와 후두)로 구분한다. 각 클래스마다 자체적인 p_A0, f_A0, p_B0, f_B0 등을 갖는다. 클래스 라벨은 관측 가능하지만, Null/Non‑null 라벨은 숨겨져 있다. 3. **베이즈 정리와 FDR 관계식** 전체 local‑fdr와 클래스별 local‑fdr 사이에 fdr_A(z)=fdr(z)·π_A0(z)/π_A(z) 라는 간단한 비율 관계가 성립한다. 여기서 π_A(z)=P(A|z), π_A0(z)=P₀(A|z)이며, 이 비율 R_A(z)=π_A0(z)/π_A(z) 를 추정하면 결합 분석이 클래스별 오류율을 얼마나 왜곡하는지 진단할 수 있다. 동일 관계는 tail‑area FDR(Fdr)에도 적용된다. 4. **뇌 DTI 데이터 적용** 15,443개의 voxel에 대해 dyslexic vs. normal 비교 z값을 계산하였다. 전체 히스토그램은 오른쪽 꼬리가 전두부 voxel에 의해 주도되었고, 결합 FDR(q=0.1)에서는 198개의 유의 voxel을 찾았다. 전후반부를 별도로 분석하면 전두부에서는 281개의 유의 voxel(z≥2.69), 후두부는 전혀 발견되지 않았다. 이는 결합이 전두부 신호를 과소평가하고 후두부 잡음을 과대평가함을 보여준다. 5. **π_A(z)와 π_A0(z) 추정** - π_A(z): z값을 0.2 간격으로 binning하고, 각 bin에서 전두부 voxel 비율 r_Ak를 계산 후 가중 로지스틱 회귀(3차 다항식)로 추정. - π_A0(z): Null 밀도를 정규(N(δ_A0,σ_A0²))로 가정하고, EM 기반 MLE(‘locfdr’ 패키지)로 δ,σ를 추정. 이를 이용해 식 (3.4) 로 π_A0(z)를 구한다. 추정 결과 R_A(z)≈0.94 (z≥3) 로 거의 1에 가까워, 결합과 분리 FDR 차이가 미미함을 확인한다. 그러나 낮은 z 구간에서는 R_A(z) 변동이 커, 특정 서브그룹에서만 신호가 존재할 경우 결합이 이를 가릴 위험이 있음을 강조한다. 6. **Type I 오류 제어와 효율성** Section 5에서는 전체 FDR 절차가 클래스별 분석을 하더라도 기대 false discovery 비율이 q 이하로 유지된다는 이론적 증명을 제시한다. 이는 독립성 가정이 약해도 경험적 Bayes 접근법이 강건함을 의미한다. 7. **Enrichment 분석** 클래스 전체가 Null에서 벗어났는지(전체 평균 이동) 검정하는 “enrichment” 방법을 제시한다. 이는 다수의 작은 서브그룹을 동시에 평가할 때 유용하며, 기존 “gene set enrichment”와 유사한 통계적 구조를 가진다. 8. **다중 클래스 확장 및 실용적 구현** 두 클래스에 국한하지 않고, 연속적인 위치 변수(x)와 연관된 가중치 함수 π(x) 로 일반화한다. 또한, R 코드와 ‘locfdr’ 패키지를 이용한 단계별 추정 절차를 상세히 설명한다. 9. **결론** 전체 데이터를 하나의 FDR 절차에 넣는 것이 편리하지만, 서브그룹 간 분포 차이가 클 경우 잘못된 과학적 결론을 초래한다. 베이즈 기반 Separate‑Class 모델은 이러한 위험을 정량화하고, 언제 결합하고 언제 분리할지를 판단하는 실용적인 지표(R_A(z))를 제공한다. 특히, 작은 서브그룹에 대한 효율적인 추정과 enrichment 검정은 현대 ‘omics’ 연구에 바로 적용 가능하다.

동시 검정의 함정: 언제 가설을 결합하고 언제 분리할 것인가

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기