예산 제한 하 활성 실험을 통한 이질적 처리 효과 추정

본 논문은 대규모 관찰 데이터와 제한된 예산의 무작위 실험을 결합해 이질적 처리 효과(HTE)를 효율적으로 추정하는 프레임워크를 제안한다. 관찰 로그를 사전 학습 및 영역 진단에 활용하고, 불확실성·도메인 차이·중첩 결핍을 고려한 획득 함수를 통해 가장 정보가 풍부한 표본을 선택해 RCT를 수행한다. 이론적으로는 유한표본 편차 경계, 마팅게일 중심극한정리 기반 비대칭성 분석, 그리고 최소극대 하한을 제공하여 정보‑이론적 최적성을 증명한다. 실험…

저자: Jiacan Gao, Xinyan Su, Mingyuan Ma

예산 제한 하 활성 실험을 통한 이질적 처리 효과 추정
**1. 연구 배경 및 문제 정의** 이질적 처리 효과(HTE) 추정은 개인화된 마케팅, 의료 의사결정, 정책 설계 등 다양한 산업·학문 분야에서 핵심 과제이다. 그러나 실제 시스템에서는 두 가지 상충되는 데이터 소스가 존재한다. 첫째, 무작위 대조 실험(RCT)은 인과 효과를 편향 없이 제공하지만 비용·시간이 많이 들고 표본 규모가 제한적이다. 둘째, 관찰 로그(OBS)는 대규모이며 고차원 특성을 포함하지만, 과거 타깃팅 정책에 의해 선택 편향과 중첩(overlap) 위반이 심각해 직접적인 인과 추정에 부적합하다. 기존 연구는 두 소스를 결합해 재가중치나 이중 강건 추정기를 설계했지만, 정책이 거의 결정론적일 경우 OBS만으로는 충분한 반사실 정보를 얻기 어렵다. 따라서 제한된 예산 하에서 “어디에 RCT를 수행해야 가장 효율적으로 HTE를 학습할 수 있는가”라는 실험 설계 문제가 대두된다. **2. 프레임워크 개요** 저자는 OBS와 RCT를 명확히 구분하는 ‘예산 제한 활성 실험(Budgeted Active Experimentation)’ 프레임워크를 제안한다. OBS는 (i) 공통 특성 표현 학습, (ii) 중첩 결핍 영역 탐지, (iii) 도메인 차이 진단에 활용된다. RCT는 실제 인과 효과를 추정하는 유일한 데이터 원천이며, 적응적으로 샘플을 선택한다. 전체 흐름은 다음과 같다. 1) OBS와 후보 풀(D_pool)을 합쳐 공통 인코더 φ를 학습한다. 2) 현재 CA‑TE 모델의 불확실성(v_u), 도메인 차이(d_u), OBS 중첩 결핍(o_u)을 각각 추정한다. 3) 다중 기준 획득 함수 S(u)=α·rank(v_u)+β·rank(d_u)+γ·rank(o_u)로 후보를 점수화한다. 4) 상위 m_k개의 후보를 선택해 RCT에 할당하고, 할당 확률 p_k(X)∈

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기