레반틴 상아 조각 지역 분류를 위한 머신러닝 접근

본 연구는 66개의 범주형 특성을 이용해 레반틴 지역의 고대 상아 조각을 ‘페니키아’와 ‘북시리아’(및 중간형)로 구분하는 기계학습 모델을 구축하였다. 서포트 벡터 머신(SVM) 기반 분류기는 10‑fold 교차검증에서 98% 정확도를 기록했으며, 상호정보량을 활용한 특성 중요도 분석과 나모그래프 시각화를 통해 기존 시각적 분류에서 놓쳤던 관계들을 밝혀냈다.

저자: Amy Rebecca Gansell, Irene K.Tamaru, Aleks Jakulin

레반틴 상아 조각 지역 분류를 위한 머신러닝 접근
본 논문은 레반틴 지역(현대 시리아·레바논·팔레스타인 일대)에서 출토된 고대 상아 조각의 지역적 기원을 과학적 방법으로 규명하고자 한다. 서론에서는 기존 연구가 시각적 유사성에 기반해 ‘페니키아’, ‘북시리아’, ‘중간형/남시리아’ 등으로 구분해 왔으며, 이러한 구분이 연구자의 주관적 판단에 크게 의존한다는 점을 지적한다. 고대 네메시스 왕조 시기의 상아 조각이 네메르드·니므루드 등지에서 발견되었으며, 이들 조각이 정치·경제·문화적 교류를 반영한다는 점에서 정확한 지역 구분이 고고학적·역사학적 해석에 필수적임을 강조한다. 자료 수집 단계에서는 210점의 여성 형상을 중심으로 한 조각을 선정하였다. 선택 기준은 전체 형태가 보존된 것, 심각한 복원 흔적이 없는 것, 성별이 명확한 것 등이며, 이라크 내 다수 유물은 접근이 제한돼 표본에서 제외되었다. 각 조각에 대해 75개의 정밀 측정값을 기록하고, 이를 바탕으로 비율 변수와 66개의 범주형 특성을 정의하였다. 최종 데이터셋은 약 32,000개의 엔트리를 포함한다. 그러나 본 연구에서는 범주형 특성만을 사용해 머신러닝 모델을 구축하였다. 방법론에서는 WEKA와 Orange라는 두 개의 오픈소스 머신러닝 툴을 활용하였다. WEKA의 SMO(Support Vector Machine) 구현을 주 분류기로 채택했으며, 이는 고차원·희소 데이터에 적합한 알고리즘이다. 10‑fold 교차검증을 1,000번 반복해 평균 테스트 정확도를 98%로 달성했으며, 이는 오차율 2%에 해당한다. 교차검증 과정에서 각 반복마다 오류가 발생한 객체를 기록해 아웃라이어 탐지를 수행했으며, 이 과정에서 ‘Intermediate/South Syrian’ 라벨이 실제로는 두 주요 그룹 사이의 경계에 위치한다는 가설을 뒷받침하는 사례들이 발견되었다. 특성 중요도 평가는 상호정보량(Mutual Information)으로 수행했다. MI는 각 범주형 변수와 지역 스타일 그룹(RSG) 사이의 비선형 종속성을 정량화한다. 상위 특성으로는 ‘머리 장식(Head Charm) 유무’, ‘눈·눈썹 인레이 여부’, ‘형식(전신·머리·스핑크스 등)’, ‘의복 종류’, ‘날개 유무’ 등이 도출되었다. 이러한 특성들을 조합해 Orange의 나모그래프 시각화 도구를 이용해 나이브 베이즈 분류기의 확률적 출력과 결합함으로써, 특정 특성 조합이 어느 지역에 속할 확률을 직관적으로 파악할 수 있었다. 예를 들어, ‘머리 장식이 없고, 눈이 인레이되지 않았으며, 전신 형식인 경우’는 ‘페니키아’ 그룹에 높은 확률로 귀속된다는 식이다. 분류 결과를 실제 사례에 적용해 보면, 오류율이 높은 몇몇 조각이 기존 시각적 분류와 일치하지 않음이 확인되었다. 예컨대, BM1 18264는 ‘Intermediate/South Syrian’으로 라벨링됐지만, 알고리즘은 91.8%의 확률로 ‘North Syrian’이라고 예측했다. 이는 해당 조각이 ‘winged female’ 형태이면서 이집트식 ‘pegwig’가 없다는 점에서 기존 라벨과 차이가 있음을 시사한다. 또 다른 사례인 BM1 18186은 ‘Intermediate/South Syrian’ 라벨이었지만, ‘Phoenician’ 특성을 많이 가지고 있어 알고리즘이 높은 확률로 ‘Phoenician’이라고 분류했다. 이러한 사례들은 머신러닝이 기존 시각적 분류의 한계를 보완하고, 새로운 해석의 실마리를 제공한다는 점을 보여준다. 논문의 마지막 부분에서는 연구의 한계와 향후 과제를 논의한다. 첫째, 데이터가 주로 서구·중동 박물관에 소장된 표본에 의존하고 있어 지역적 편향이 존재한다. 둘째, 수치형 비율 변수를 배제함으로써 잠재적인 정보 손실이 발생했을 가능성이 있다. 셋째, 현재 사용된 SVM 기반 모델은 해석 가능성이 제한적이며, 딥러닝 기반 이미지 분석이나 그래프 신경망을 활용한 다중모달 접근이 향후 연구에 유용할 것으로 제안한다. 또한, 손상된 조각에 대한 복원 모델링과 라벨링이 없는 데이터에 대한 반지도 학습(semi‑supervised learning) 적용도 고려한다. 결론적으로, 이 연구는 고대 레반틴 상아 조각의 지역 구분에 머신러닝을 성공적으로 적용함으로써, 전통적인 시각적 방법의 주관성을 보완하고, 학제간 연구의 새로운 가능성을 열었다는 점에서 학술적 의의가 크다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기