보편 코딩 스킴의 강건성 문제

레프렘-지프(Lempel‑Ziv) 압축은 모든 정상적(ergodic) 정적 소스에 대해 평균 압축률이 엔트로피에 수렴하는 최적성을 갖는다. 본 논문은 이 최적성이 알고리즘적 무작위성 결함(디피시언시)이 아주 천천히 증가하는 경우에도 깨질 수 있음을 보이며, 특히 마코프 체인에 의해 생성된 시퀀스에 대해서는 디피시언시가 o(n) 이면 레프렘‑지프는 강건함을 유지한다는 결과를 제시한다.

저자: V.V.Vyugin

논문은 먼저 Kolmogorov 복잡도 K(x)와 그 단조 버전 Km(x)를 정의하고, 이를 통해 무작위성 결함 dP(ωⁿ)=−log P(ωⁿ)−Km(ωⁿ)를 도입한다. Proposition 1에 따르면, 어떤 무한 시퀀스 ω가 측정 P에 대해 알고리즘적으로 무작위라면 dP(ωⁿ)은 상수 이하로 제한된다. 반대로, dP(ωⁿ)이 무한히 커지면 ω는 P‑null 집합에 속한다. 다음으로 저자는 ‘비강건성’ 정리를 제시한다. 임의의 비감소·비한정 함수 σ(n)과 0<ε<1/4를 잡으면, σ에 대해 계산 가능하고 엔트로피 H≤ε인 ergodic 측정 P와 무한 시퀀스 α가 존재한다. 이 α는 모든 충분히 큰 n에 대해 dP(αⁿ)≤σ(n) 를 만족하지만, 압축률 lim sup K(αⁿ)/n ≥1/4 와 lim inf K(αⁿ)/n ≤ε 를 동시에 만족한다. 즉, 압축률이 엔트로피와 크게 차이 나는 구간이 무한히 존재한다. 이를 증명하기 위해 저자는 절단‑쌓기 방법으로 ergodic 변환 T와 측정 P를 구성한다. 단계별로 두 개의 gadget(Δₛ, Πₛ)을 정의하고, Δₛ는 균등 베르누이 분포에 가까운 이름을, Πₛ는 엔트로피가 매우 작은 이름을 만든다. σ(n)의 성장 속도에 맞추어 각 단계에서 이름의 복잡도를 조절함으로써 무작위성 결함을 σ(n) 이하로 유지한다. 동시에, Πₛ의 이름은 0과 1의 비율을 제한해 압축률을 낮게 만든다. 이렇게 구성된 α는 원하는 두 가지 압축률 경계를 동시에 만족한다. 그 후 논문은 Lempel‑Ziv 압축 알고리즘의 강건성을 검토한다. 마코프 체인에 의해 생성된 시퀀스에 대해 dP(ωⁿ)=o(n)이면, LZ 압축의 평균 코드 길이 lₙ/n 가 −log P(ωⁿ)/n 에 수렴한다는 정리를 증명한다. 이는 기존의 Shannon‑McMillan‑Breiman 정리와 Kolmogorov 복잡도와의 관계를 이용한 것으로, 무작위성 결함이 선형보다 느리게 증가하면 LZ는 엔트로피에 가까운 압축률을 유지한다는 의미다. 마지막으로 저자는 이 결과가 압축 이론과 알고리즘적 무작위성 이론 사이의 연결 고리를 제공한다는 점을 강조한다. 일반적인 보편 압축 스킴은 무작위성 결함이 아주 천천히라도 최적성을 잃을 수 있지만, 실제 통계적 모델(예: 마코프 체인)에서는 결함이 선형 이하일 경우 강건하게 동작한다. 이는 압축 알고리즘 설계 시 무작위성 결함을 고려해야 함을 시사한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기