고차원 유전체 파싱머니에서 켄달 타우의 새로운 적용
본 논문은 샘플 수는 작고 변수 차원은 매우 큰 HDLSS(High‑Dimension Low‑Sample‑Size) 상황에서 켄달 타우 통계량을 활용한 비모수적 검정 방법을 제시한다. 차원 증가에 대한 비대칭적 asymptotics를 전개하고, Chen‑Stein 정리를 이용해 통계량 간 의존성을 정량화한다. 마이크로어레이 데이터에 대한 구체적 예시와 함께, 다중 가설 검정 및 유전자‑환경 상호작용 탐지를 위한 실용적 절차를 제공한다.
저자: Pranab K. Sen
본 논문은 고차원·저표본(HDLSS) 데이터 모델을 다루는 새로운 통계적 접근법을 제시한다. 전통적인 다변량 정규성 가정이나 선형 회귀 모델은 변수 차원(K)이 표본 수(n)보다 훨씬 큰 경우에 적합하지 않으며, 특히 유전체·마이크로어레이와 같은 분야에서 이러한 상황이 빈번히 발생한다. 저자는 이러한 문제점을 해결하기 위해 켄달 타우(Kendall’s τ) 통계량을 차원 중심(asymptotics)으로 분석하고, Chen‑Stein 정리를 활용해 통계량 간 의존성을 정량화한다.
1. **문제 설정 및 동기**
- K≫n인 상황에서 다변량 정규성·선형성 가정은 현실적이지 않다.
- 변수 간 독립성도 보장되지 않으며, 일부 반응 변수는 이산형 혹은 순서가 없는 범주형일 수 있다.
- 따라서 비모수적, 순위 기반 방법이 필요하다.
2. **켄달 타우의 정의 및 변형**
- 각 유전자 k에 대해 관측값 Xᵢₖ(i=1,…,n)와 설계 변수 tᵢ(시간 혹은 질병 단계)의 순위 차이를 이용해
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기