컴퓨터과학에 내재된 무작위성
본 논문은 콜모고로프 복잡도 이론을 중심으로 무작위성의 정의와 성질을 탐구한다. 확률론에서 시작해 알고리즘 정보 이론, 전위 복잡도, 마틴‑로프 무작위성 등 다양한 관점을 통합하며, 무작위성이 컴퓨터과학에 자연스럽게 자리 잡은 개념임을 논증한다.
저자: Marie Ferbus-Z, a (LIAFA), Serge Grigorieff (LIAFA)
본 논문은 “무작위성은 컴퓨터과학에 원생적인가?”라는 질문을 출발점으로, 무작위성의 수학적 정의와 그 발전 과정을 상세히 서술한다. 1장에서는 확률론에서 무작위성을 정의하려는 전통적 시도와 그 한계를 소개한다. 동전 던지기 예시를 통해 모든 결과가 동일한 확률을 갖는다는 사실이 무작위성의 직관과 충돌함을 지적하고, 리차드 폰 미제스와 같은 초기 시도에도 불구하고 1960년대에 이르러서야 계산가능성에 기반한 새로운 접근이 등장함을 설명한다.
2장에서는 콜모고로프 복잡도(Kolmogorov complexity)의 정의와 기본 성질을 제시한다. 프로그램을 이진 문자열로 보고, 어떤 문자열 x를 출력하는 가장 짧은 프로그램의 길이를 K(x)라 정의한다. 여기서 “왜 이진 프로그램인가?”라는 질문에 대해, 이진은 길이 측정의 절대 기준을 제공하고, 다른 알파벳을 사용할 경우 로그 변환이 필요함을 설명한다. 또한, 조건부 복잡도 K(x|y)와 입력을 포함한 모델을 도입해, 확률론의 조건부 확률과 유사한 구조를 만든다.
3절에서는 불변성 정리(Invariance Theorem)를 증명한다. 모든 부분계산 함수 A에 대해 상수 c가 존재하여 K_A(x) ≤ K_U(x)+c가 성립함을 보이며, 이를 통해 언어 독립적인 최적 복잡도 K가 정의된다. 이어서 쌍 문자열 코딩, 비결정성, 그리고 복잡도 근사 방법을 논의한다. 특히, K(x)의 정확한 값은 일반적으로 계산 불가능하고, 어떠한 비자명한 하한도 효과적으로 구할 수 없음을 보이는 무결정성 결과를 제시한다.
4장에서는 알고리즘 정보 이론의 핵심 관계들을 정리한다. 압축(Zip/Unzip) 관점에서 K와 압축률의 관계, 쌍 복잡도 K(x,y)와 개별 복잡도 사이의 부등식, 그리고 대칭성(Symmetry of Information) 정리를 통해 K(x)+K(y|x)=K(y)+K(x|y)+O(log K) 형태의 식을 도출한다. 이러한 결과는 정보가 어떻게 서로 교환되는지를 정량화한다.
5장에서는 무작위성과 논리학의 연결 고리를 탐구한다. 차이니의 불완전성 정리와 유사하게, Chaitin은 K에 대한 불완전성 결과를 제시한다. 즉, 충분히 큰 n에 대해 “K(x)>n”이라는 명제가 증명 불가능함을 보이며, 이는 수학적 진리와 복잡도 사이의 근본적 한계를 드러낸다.
6장에서는 유한 무작위 문자열의 실제 응용을 논한다. 난수 생성, 샘플링, 데이터 압축, 암호학 등에서 K가 큰 문자열이 “무작위”하다고 판단되는 근거를 제공한다. 무작위성의 정도를 정량화함으로써, 알고리즘 설계와 보안 프로토콜에 실질적인 이점을 제공한다.
7장에서는 전위 복잡도(Prefix Complexity) H를 도입한다. 프로그램 앞에 자체 구분자를 붙여 self‑delimiting 프로그램을 정의하고, H는 K보다 한 단계 정교한 측정이다. H와 K의 비교, H의 성장률, 그리고 코딩 정리(Coding Theorem)를 통해 두 복잡도 사이의 상수 차이를 명시한다.
8장에서는 무한 시퀀스에 대한 무작위성을 다룬다. 위에서 언급한 전위 복잡도와 마틴‑로프(Martin‑Löf) 무작위성 정의를 연결한다. 마틴‑로프 무작위성은 모든 효과적인 통계 검정을 통과하는 무한 문자열 집합이며, 이는 H의 상한을 이용해 등가성을 보인다. 또한, 빈도 검정, 대수적 진동 정리, 그리고 Chaitin의 실수 Ω와 같은 특수 무작위 실수들을 소개한다.
9장에서는 무작위성 연구의 확장 방향을 제시한다. 오라클을 이용한 고차 복잡도, 무한 계산 모델, 집합론적 무작위 실수 등으로 범위를 넓힌다. 이러한 고차 이론은 전통적인 계산가능성 한계를 넘어서는 무작위성 개념을 탐구한다.
결론적으로, 논문은 무작위성이 확률론적 개념을 넘어, 프로그램 길이와 계산가능성에 기반한 본질적 속성임을 강조한다. 콜모고로프 복잡도와 전위 복잡도는 무작위성을 정량화하는 핵심 도구이며, 이론적 결과와 실제 응용 모두에서 컴퓨터과학의 중심적 역할을 수행한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기