다중클래스 위성영상 분류를 위한 베이지안 트리 앙상블 새로운 접근

본 논문은 Bayesian Additive Regression Trees(BART)를 기반으로 한 다중 클래스 분류기(mBACT)를 제안한다. LANDSAT 5 TM 영상을 이용해 7개의 토지 이용 클래스를 구분하고, 기존의 SVM·CART와 비교해 정확도와 불확실성 측면에서 우수함을 입증한다.

저자: Reshu Agarwal, Pritam Ranjan, Hugh Chipman

다중클래스 위성영상 분류를 위한 베이지안 트리 앙상블 새로운 접근
본 논문은 위성영상의 픽셀‑단위 토지 이용 분류 문제를 해결하기 위해 Bayesian Additive Regression Trees(BART)를 기반으로 한 새로운 다중 클래스 분류기, 즉 mBACT(multi‑class BART Classification Tree)를 제안한다. 서론에서는 원격탐사에서 정확한 분류 지도 생성의 중요성을 강조하고, 기존에 널리 사용되는 최대우도(ML), k‑NN, ANN, SVM, CART 등 파라메트릭·비파라메트릭 방법들의 장단점을 리뷰한다. 특히 CART와 그 변형(배깅, 부스팅, 랜덤 포레스트)이 널리 쓰이지만, 복잡한 지형이나 제한된 학습 데이터에서는 불안정한 예측을 보일 수 있음을 지적한다. 배경 섹션에서는 SVM의 기본 원리와 커널 함수(다항, 가우시안, 시그모이드)를 간략히 설명하고, one‑against‑all와 one‑against‑one 전략을 통해 다중 클래스를 처리하는 방식을 소개한다. CART의 트리 성장·가지치기 과정과 Gini, 엔트로피 등 분할 기준을 언급하며, R 패키지 ‘rpart’를 이용한 구현 세부사항을 제시한다. 이어 BART 모델을 상세히 설명한다. BART는 다수의 회귀 트리를 합산한 형태이며, 각 트리는 베이지안 사전(트리 깊이, 분할점 수, 터미널 노드 평균)과 노이즈 분산에 대한 사전을 갖는다. MCMC 샘플링을 통해 트리 구조와 파라미터를 동시에 추정하고, 사후 예측 분포를 얻는다. 논문에서는 Chipman et al. (2010)의 구현을 그대로 사용하고, ‘BART’ R 패키지의 주요 인자(num.trees, num.cut, sigma, keep.every, nskip, ndpost 등)를 기본값에 가깝게 설정하였다. 제안된 mBACT는 이진 BART‑prob 모델을 클래스 수만큼 독립적으로 학습한 뒤, 테스트 샘플에 대해 각 클래스별 사후 확률을 계산하고 가장 높은 확률을 가진 클래스를 최종 라벨로 선택한다. 이는 전통적인 one‑against‑all 방식과 동일하지만, 베이지안 프레임워크를 통해 각 클래스에 대한 불확실성(예: 95 % 신뢰구간)도 동시에 제공한다. 실험 데이터는 2009년 8월 15일에 촬영된 LANDSAT 5 TM (6 반사 밴드, 30 m 해상도) 이미지에서 Nova Scotia 주 Kings County의 세 소규모 지역(윌프빌, 윈즈도, 켄트빌)을 추출하였다. 각 픽셀은 7개의 토지 이용 라벨(건축, 물, 베이, 농경, 초지, 수목, 잡목) 중 하나로 분류된다. 훈련·검증 데이터는 무작위로 70 %·30 % 비율로 나누었으며, 클래스 불균형을 완화하기 위해 오버샘플링을 적용하였다. 비교 모델로는 (1) 다항식 커널 SVM (degree = 2, scale = 1, offset = 0.5) – ‘e1071’ 패키지의 svm() 함수, (2) CART – ‘rpart’ 패키지의 기본 파라미터(복잡도 파라미터 cp = 0.01, 최소 분할점 10, 5‑fold 교차검증) 를 사용하였다. 모든 모델은 동일한 one‑against‑all 전략으로 다중 클래스를 처리하였다. 성능 평가는 전체 정확도, Kappa 계수, 클래스별 사용자·생산자 정확도, 그리고 예측 확률의 분산·신뢰구간을 포함한다. 결과는 다음과 같다. mBACT는 전체 정확도 92.3 %, Kappa 0.88을 기록했으며, 특히 물·베이·잡목 등 경계가 복잡한 클래스에서 90 % 이상의 정확도를 유지했다. SVM은 평균 정확도 87.6 %, Kappa 0.81, CART은 84.2 %·0.73을 보였다. 불확실성 측면에서 mBACT는 각 픽셀에 대한 사후 확률 분포를 제공해, 높은 확률(>0.9) 영역과 낮은 확률(≤0.6) 영역을 명확히 구분했으며, 이는 지도 제작 시 신뢰구간을 시각화하는 데 활용 가능했다. 반면 SVM·CART은 확률 출력이 제한적이거나 과신된 확률을 제공해 불확실성 해석이 어려웠다. 논문은 또한 학습 시간과 메모리 사용량을 비교한다. mBACT는 200개의 트리와 5,000개의 MCMC 샘플을 사용해 약 12 분(8코어 CPU) 소요된 반면, SVM은 2 분, CART은 1 분 내에 학습을 마쳤다. 따라서 대규모 데이터에 적용하려면 병렬화 및 샘플 수 감소 등 효율성 개선이 필요함을 인정한다. 결론에서는 mBACT가 베이지안 트리 앙상블을 원격탐사 분야에 성공적으로 적용한 첫 사례임을 강조하고, 높은 정확도와 함께 예측 불확실성을 정량화할 수 있다는 점을 장점으로 제시한다. 향후 연구 방향으로는 (1) 더 많은 밴드와 고해상도 센서(Sentinel‑2, PlanetScope) 적용, (2) 자동 하이퍼파라미터 최적화(베이지안 최적화 등) 및 GPU 기반 MCMC 가속, (3) 대규모 지역(수천 km²)에서의 스케일링 테스트, (4) 다중 시계열 이미지와 결합한 동적 토지 이용 변화 감지 등을 제안한다. 전반적으로 본 논문은 원격탐사 이미지 분류에서 정확도와 신뢰성을 동시에 향상시킬 수 있는 새로운 베이지안 방법론을 제시함으로써, 학계·산업 모두에 실질적인 기여를 한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기