서브그라디언트 알고리즘의 보편성 적대적과 확률적 환경 모두에서 최적 성능

본 논문은 단순히 널리 사용되는 서브그라디언트 알고리즘이 단순히 적대적 비용에 대해 O(√N)의 레지스트를 보장할 뿐 아니라, i.i.d. 비용에 대해서는 O(1) 수준의 의사레지스트(pseudo‑regret)를 달성한다는 보편성을 증명한다. 이는 히지(Hedge) 변형이 아닌 최초의 보편적 알고리즘이며, 새로운 벡터 집중 부등식과 정상원뿔(normal cone) 접근을 통해 증명한다.

저자: Daron Anderson, Douglas Leith

본 연구는 온라인 선형 최적화 문제에서 비용 벡터가 적대적이든 i.i.d.이든 동일한 알고리즘이 최적의 성능을 보일 수 있음을 증명한다. 먼저 문제 설정을 명확히 정의한다. 비용 벡터 b₁,b₂,…∈ℝ^d가 주어지고, 매 라운드 n에서 이전 비용을 모두 관찰한 뒤, 컴팩트한 볼록 집합 X⊂ℝ^d(특히 단순히 S, 즉 d‑차원 단순체)에서 행동 x_n을 선택한다. 레지스트는 ∑_{i=1}^N b_i·(x_i−x^*) 로 정의되며, i.i.d. 경우에는 평균 비용 a=E

서브그라디언트 알고리즘의 보편성 적대적과 확률적 환경 모두에서 최적 성능

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기