가중 유한 상태 변환기의 3방향 합성: 이론·실험 고속화

본 논문은 기존 2‑방향 합성 알고리즘의 비효율성을 극복하고, 세 개의 가중 유한 상태 변환기(T₁, T₂, T₃)를 직접 합성하는 3‑way 합성 기법을 제안한다. 완전 해싱을 이용한 전처리와 ‘가로’·‘중심’ 두 가지 탐색 전략을 결합해 최악의 시간 복잡도를 O(|T|_Q·min(d(T₁)d(T₃), d(T₂)) + |T|_E) 로 낮추었으며, ε‑필터링을 위한 새로운 자동화 설계도 제공한다. 실험 결과, 대규모 음성·텍스트 처리 작업에서 …

저자: Cyril Allauzen, Mehryar Mohri

본 논문은 가중 유한 상태 변환기(FST)의 합성 연산을 확장하여, 세 개의 트랜스듀서 T₁, T₂, T₃를 직접 합성하는 3‑way 합성 알고리즘을 제시한다. 서론에서는 가중 FST가 음성 인식, 음성 합성, 정보 추출, 문자열 커널 등 다양한 응용 분야에서 핵심 역할을 수행한다는 점을 강조하고, 기존 2‑way 합성의 복잡도 O(|T₁|·|T₂|·|T₃|) 와 중간 결과의 폭발적 증가 문제를 지적한다. 2장에서는 가중 트랜스듀서의 형식적 정의와 semiring, ε‑전이, 규제성 등을 정리한다. 특히, 전이의 입력·출력 라벨과 가중치가 semiring 연산에 따라 결합되는 방식을 명확히 하고, 표준 2‑way 합성 규칙 (q₁,a,b,w₁,q₂)·(q₁′,b,c,w₂,q₂′) ⇒ ((q₁,q₁′),a,c,w₁⊗w₂,(q₂,q₂′)) 를 재소개한다. 3장에서는 ε‑없는 경우의 3‑way 합성 알고리즘을 상세히 기술한다. 핵심은 상태 삼중 (q₁,q₂,q₃) 를 큐에 넣고, 각 단계에서 T₁의 전이 e₁와 T₃의 전이 e₃를 모두 조합한 뒤, T₂에서 입력 라벨이 e₁의 출력과 일치하고 출력 라벨이 e₃의 입력과 일치하는 전이 집합 G 를 해시를 통해 O(|G|) 시간에 찾는 것이다. 새로운 전이가 발견되면 상태와 전이를 결과 트랜스듀서 T에 추가하고, 아직 탐색되지 않은 상태를 큐에 삽입한다. 시간 복잡도 분석에서는 두 가지 탐색 전략을 제시한다. 가로 전략(lateral)에서는 d(T₁)·d(T₃) 만큼의 전이 조합을 고려하고, 중심 전략(central)에서는 d(T₂)만을 고려한다. 상태별로 |E

가중 유한 상태 변환기의 3방향 합성: 이론·실험 고속화

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기