중세 사회 네트워크 분석 커널 SOM과 클러스터링 기법

본 논문은 13세기 남프랑스 지역의 중세 계약 데이터를 기반으로 615명의 인물과 4193개의 관계를 가진 가중 그래프를 구축하고, 스펙트럴 클러스터링, 커널 k‑means, 그리고 커널 SOM을 이용해 정밀한 군집화와 시각화를 수행한다. 각 방법의 군집 품질을 q‑modularity 지표로 비교하고, 커널 SOM이 가장 높은 모듈러리와 의미 있는 지리·시대 구분을 제공함을 보인다.

저자: Nathalie Villa (IMT), Fabrice Rossi (INRIA Rocquencourt / INRIA Sophia Antipolis), Quoc-Dinh Truong (IRIT)

중세 사회 네트워크 분석 커널 SOM과 클러스터링 기법
본 논문은 중세 남프랑스 지역의 사회적 관계를 정량적으로 분석하기 위해 데이터 마이닝과 그래프 이론을 결합한 종합적인 방법론을 제시한다. 연구의 출발점은 1260‑1340년 사이에 체결된 약 1000건의 농업 계약 기록이다. 각 계약에는 계약 당사자인 농민, 영주, 공증인 등의 이름이 포함되어 있어, 이를 기반으로 인물‑인물 간의 거래 횟수를 가중치로 하는 무방향 가중 그래프를 구축하였다. 최종 그래프는 615명의 정점과 4193개의 간선으로 이루어져 있으며, 각 간선의 가중치는 두 인물 사이에 존재하는 계약 수를 의미한다. 첫 번째 분석 단계에서는 그래프 정점을 군집화하여 복잡한 네트워크를 이해 가능한 서브구조로 축소하고자 했다. 이를 위해 두 가지 전통적인 방법을 적용하였다. (1) 스펙트럴 클러스터링은 라플라시안 행렬의 가장 작은 p개의 고유벡터를 추출해 저차원 유클리드 공간에 매핑한 뒤, k‑means 알고리즘으로 50개의 군집을 만든다. (2) 커널 k‑means는 라플라시안에 확산 커널 \(K_{\beta}=e^{-\beta L}\) 을 적용해 전체 스펙트럼을 활용한다. β 파라미터(β=0.05)를 통해 스무딩 정도를 조절하고, 얻어진 RKHS 상에서 k‑means를 수행한다. 두 방법 모두 q‑modularity 지표를 사용해 군집 품질을 평가했으며, 스펙트럴 클러스터링은 Q=0.4195, 커널 k‑means는 Q=0.4246을 기록했다. 그러나 두 경우 모두 대형 군집이 전체 정점의 절반 이상을 차지하는 등 군집 크기의 불균형이 두드러졌다. 두 번째 단계에서는 군집화와 동시에 그래프 레이아웃을 제공하는 커널 SOM(자기조직화 지도)을 도입했다. 배치 방식의 SOM을 7×7 격자(총 49개의 뉴런) 위에 구현하고, 각 정점을 확산 커널에 의해 정의된 재생산 커널 힐베르트 공간(RKHS)으로 매핑한 뒤 학습을 진행하였다. 결과적으로 35개의 군집이 도출되었으며, q‑modularity는 0.551로 기존 두 방법을 크게 앞섰다. U‑matrix를 통해 군집 간 평균 거리와 내부 응집도를 시각화했으며, 지도는 크게 세 개의 구역(좌상, 우상, 우하)으로 구분되었다. 각 구역은 연도와 지리적 특성에서 뚜렷한 차이를 보였다. 좌상 구역은 평균 계약 연도가 가장 오래(약 1270년)이며, 작은 마을 Divilhac 에 집중돼 있었다. 우상 구역은 평균 연도가 최신(약 1330년)이며, St Julien 3 지역의 인물들이 주를 이룬다. 이러한 시계열·지리적 패턴은 세대 교체와 지역 간 연결 고리가 네트워크 구조에 어떻게 반영되는지를 명확히 보여준다. 세 번째 단계에서는 SOM 격자를 기반으로 힘‑지향 레이아웃 알고리즘을 적용해 전체 그래프를 시각화하였다. 이 과정에서 특정 인물 Pierre Fornie 와 Aliquier 가족이 서로 다른 군집을 연결하는 ‘브릿지’ 역할을 수행함을 확인했다. 특히, Pierre Fornie는 역사학자들에게 이미 알려진 핵심 인물로, 그의 위치가 두 주요 군집(좌상과 우하) 사이에 존재함은 데이터 정제와 역사적 해석에 중요한 단서를 제공한다. 또한, Aliquier 가족은 네트워크 내 사회적 결속을 유지하는 핵심 연결 고리로 식별되었다. 전체적으로, 논문은 다음과 같은 주요 결론을 도출한다. (1) 전통적인 스펙트럴 클러스터링과 커널 k‑means는 q‑modularity 측면에서 비슷한 성능을 보이지만, 군집 크기의 불균형 문제가 존재한다. (2) 커널 SOM은 전체 스펙트럼을 활용하면서도 군집 수와 크기의 균형을 개선하고, 높은 q‑modularity를 달성한다. (3) U‑matrix와 힘‑지향 레이아웃을 결합한 시각화는 역사학자들이 네트워크의 주요 구조적·시대적·지리적 특징을 직관적으로 파악하도록 돕는다. (4) 데이터 정제 과정에서 발견된 중복 인물 및 연결 고리는 향후 역사적 연구와 데이터베이스 개선에 중요한 인사이트를 제공한다. 본 연구는 수학·컴퓨터 과학·역사학이 협업하여 복합 사회 네트워크를 해석하는 모델을 제시함으로써, 중세 사회 구조에 대한 새로운 이해를 가능하게 한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기