단어 겹침을 위한 등변곡선 부등식

길이 n 인 단어 집합 A, B 가 서로 접미사·접두사가 겹치지 않을 때, 두 집합의 밀도 α, β 는 α·β ≤ (1+o(1))/(e n) 을 만족한다. 이 상한은 큰 n 에 대해 최적에 가깝다.

저자: Dmitrii Zakharov

이 논문은 유한 알파벳 Ω 위에서 길이 n 인 모든 단어들의 집합 Ωⁿ 에 대해, 두 부분집합 A, B 가 서로 겹치지 않는 조건(즉 A 의 어떤 단어의 접미사가 B 의 어떤 단어의 접두사와 일치하지 않음)을 만족할 때 가능한 밀도 α=μ(A), β=μ(B) 의 곱에 대한 상한을 연구한다. 먼저 겹치지 않는 집합 A 에 대해 겹치지 않는 단어들의 전체 집합 U(A)=Ωⁿ\⋃_{j=0}^{n-1}s^j(A)×Ω^j 을 정의하고, 주어진 α 에 대해 γ(α,n)=max_{μ(A)=α}μ(U(A)) 을 고려한다. 저자는 γ(α,n) 이 α 에 대해 감소함을 이용해, γ(α,n) 에 대한 명시적 상한을 찾는다. 핵심 아이디어는 시프트 연산 s(w₁,…,wₙ)=(w₂,…,wₙ) 을 반복 적용해 A_j=s^{n-j}(A) (길이 j 단어 집합)들을 만든 뒤, 각 단계에서 남는 부분 D_j=A_j\bigl(B_{j-1}×Ω\bigr) 를 정의한다. 여기서 B_j=⋃_{i=1}^{j}A_i×Ω^{j-i} 는 A_j 와 그 이전 단계들의 시프트 집합들의 합집합이다. 관찰 2.1을 통해 μ(A_j∩(D_i×Ω^{j-i}))≤α_{j-i}·μ(D_i) 라는 부등식을 얻고, 이를 누적하여 부등식 (1) 을 도출한다. 이를 다시 γ_j=1-β_j, δ_j=α_{j-1}-α_j 로 치환하면 재귀식 (2) γ_j≤∑_{i=0}^{j-1}γ_i·δ_{j-i} 를 얻는다. 다음 단계에서는 δ_i/(1-α) 을 확률 질량 p_i 로 두고, 독립적인 확률 변수 Z₁,…,Z_n 을 정의한다. 관찰 2.2는 γ_j≤∑_{s≥0}(1-α)^s·Pr

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기