확률적 경사 하강법의 함수형 중심극한정리

본 논문은 볼록 목적함수에 적용된 확률적 경사 하강법(SGD)의 전체 궤적에 대해 함수형 중심극한정리(FCLT)를 증명한다. 적절히 시간과 공간을 재스케일한 SGD 경로는 장기적으로 최소점 주변에서 확산 과정으로 수렴한다. 이 결과는 마지막 반복값이나 평균값에 대한 기존의 점별 중심극한정리와 달리 시간적 구조를 보존하며, 비정규화된(비스무스) 목적함수, 특히 기하학적 중앙값과 같은 강인 위치 추정 문제에도 적용 가능함을 보여준다.

저자: Kessang Flam, Victor-Emmanuel Brunel

본 논문은 확률적 경사 하강법(SGD)이 볼록 최적화 문제에서 어떻게 확산 과정으로 수렴하는지를 함수형 중심극한정리(FCLT)라는 강력한 확률론적 도구를 통해 체계적으로 분석한다. 서론에서는 대규모 데이터와 온라인 학습 환경에서 SGD의 중요성을 강조하고, 기존 연구가 주로 마지막 반복값이나 평균값에 대한 점별 중심극한정리(CLT)를 제공해 왔으며, 이러한 결과는 시간적 변동성을 반영하지 못한다는 한계를 지적한다. 이어서 관련 연구 섹션에서는 Polyak‑Ruppert 평균, 연속 시간 확산 근사, 그리고 비스무스 목적함수에 대한 최근의 확률적 분석을 정리한다. 문제 설정에서는 목표 함수 L(θ) 가 볼록하고 리프시츠 연속이며, 최소점 θ\* 이 존재한다고 가정한다. SGD는 θ_{k+1}=θ_k−η_k g(θ_k,ξ_k) 형태이며, 여기서 g 은 무작위 샘플 ξ_k 에 대한 서브그라디언트(또는 편미분)이다. 학습률 η_k 은 전통적인 Robbins‑Monro 조건 η_k→0, ∑η_k=∞, ∑η_k^2<∞ 을 만족한다. 추가 가정으로는 E

확률적 경사 하강법의 함수형 중심극한정리

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기