그래프 비교를 위한 새로운 공분산 매트릭스 공간

본 연구는 그래프를 수학적으로 비교할 수 있는 새로운 표현 방법을 제시한다. 기존의 그래프 비교 방법은 주로 스펙트럼(고유값)이나 작은 서브그래프 카운트(히스토그램) 등에 의존했으며, 각각 차원 불일치, 정보 손실, 계산 복잡도 증가 등의 한계를 가지고 있었다. 저자들은 이러한 문제를 해결하기 위해 그래프의 인접 행렬 \(A\)에 대해 시작 벡터 \(e\) (모든 원소가 1인 벡터)를 사용한 전력 반복(power iteration) 과정을 도입한다. 전력 반복은 \(A^{i}e\) 형태의 벡터들을 순차적으로 생성하며, 각 단계에서 벡터를 \(\ell_{1}\)‑노름으로 정규화한다. 이렇게 얻은 \(k\)개의 정규화 벡터를 행렬 \(M\in\mathbb{R}^{n\times k}\)의 열로 배치하고, 각 열 간의 공분산을 계산해 \(k\times k\) 공분산 행렬 \(C^{A}\)를 만든다. **핵심 이론** 1. **그래프 불변성**: 정리 1에 따르면, 임의의 순열 행렬 \(P\)에 대해 \(C^{A}=C^{PAP^{T}}\) 가 성립한다. 이는 그래프의 정점 순서를 바꾸어도 동일한 공분산 행렬을 얻는다는 의미이며, 따라서 \(C^{A}\)는 그래프 동형성에 대해 불변이다. 2. **양의 반정밀성**: \(C^{A}\)는 샘플 공분산 행렬이므로 대칭이며 양의 반정밀(semi‑definite)이다. 이는 이후 거리 측정에서 수학적 안정성을 보장한다. 3. **스펙트럼·서브구조와의 연관성**: 전력 반복 벡터 \(A^{i}e\)는 Krylov 부분공간을 형성한다. Krylov 부분공간은 행렬의 고유값 다항식과 직접 연결되므로, \(C^{A}\)는 고유값 분포(스펙트럼) 정보를 내포한다. 또한, 저자들은 \(C^{A}\)의 원소가 특정 길이의 경로 수와 삼각형 수와 선형 결합 관계에 있음을 증명한다. 즉, 작은 서브그래프 카운트가 암묵적으로 포함된다. **유사도 정의** 두 그래프 \(G\)와 \(H\)에 대해 각각 \(C^{A}, C^{B}\)를 구한 뒤, 이를 확률 분포(다변량 정규분포)로 해석한다. Bhattacharyya 거리(또는 유사도)를 사용해 \

그래프 비교를 위한 새로운 공분산 매트릭스 공간

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기