YOLO와 HiResCAM을 활용한 초벌목벌 자동 식별 시스템
본 연구는 고해상도 이미지와 최신 객체 검출 모델 YOLOv12·YOLOv26을 결합하고, HiResCAM을 이용해 시각적 설명을 제공함으로써 초벌목벌(Ichneumonoidea) 과학적 식별 정확도를 96 % 이상으로 끌어올렸다. 모델은 날맥, 더듬이, 복부 구조 등 전통적인 형태학적 특징에 집중함을 시각화로 검증했으며, 데이터셋과 코드가 공개돼 재현성과 확장성을 확보한다.
저자: Joao Manoel Herrera Pinheiro, Gabriela Do Nascimento Herrera, Alvaro Doria Dos Santos
본 논문은 초벌목벌(Ichneumonoidea)이라는 곤충군의 복잡한 형태학적 변이를 자동화된 딥러닝 시스템으로 해결하고자 하는 연구이다. 초벌목벌은 기생벌로서 전 세계적으로 수만 종이 존재하지만, 외형이 매우 유사하고 작은 크기와 미세한 차이 때문에 전통적인 현미경 기반 식별이 전문가에게도 어려운 과제로 남아 있다. 이러한 문제를 해결하기 위해 저자들은 고해상도 이미지와 최신 객체 검출 모델을 결합한 파이프라인을 설계하고, 모델의 결정 과정을 시각적으로 설명하는 XAI 기법인 HiResCAM을 도입하였다.
데이터 수집은 브라질 상파울루 대학교(USP)와 연계된 DCBU(디지털 콜렉션)에서 진행되었으며, Leica M205C 스테레오 현미경과 K5C 디지털 카메라를 이용해 3 556장의 고해상도 사진을 획득하였다. 이미지 스택을 Helicon Focus로 합성해 깊이와 선명도를 높였으며, 주요 과(Ichneumonidae, Braconidae, Apidae, Vespidae 등)별로 라벨링하였다. 데이터는 70 % 학습, 15 % 검증, 15 % 테스트로 무작위 분할했으며, 모든 이미지는 512 × 512 픽셀로 리사이즈하였다.
모델 아키텍처는 최신 YOLOv12와 YOLOv26의 nano 변형(yolo12n‑cls, yolo26n‑cls)을 채택했다. YOLO는 실시간 객체 검출에 최적화된 구조로, 다중 스케일 피처 피라미드와 효율적인 백본을 통해 작은 곤충의 세밀한 특징까지 포착한다. 두 모델 모두 사전 학습된 가중치를 전이 학습했으며, 학습 과정에서는 CIoU 손실과 클래스 교차 엔트로피 손실을 결합하고, cosine annealing 스케줄러로 학습률을 조절하였다. 학습은 AMD Ryzen 9 7900 CPU와 64 GB RAM, NVIDIA RTX 4090 GPU(CUDA 13.1) 환경에서 수행되었다.
성능 평가는 정확도, 정밀도, 재현율, F1‑score 네 가지 지표로 진행되었다. YOLOv26은 Top‑1 정확도 96.14 %와 F1‑score 0.962를 달성했으며, YOLOv12은 94.85 % 정확도와 0.938의 F1‑score를 기록했다. 혼동 행렬 분석 결과, 주요 오류는 Braconidae와 Ichneumonidae 사이에서 발생했으며, 이는 두 과가 공유하는 날맥 패턴(특히 2m‑cu의 존재·부재) 때문에 발생한 것으로 해석된다. 소수 클래스에서도 과도한 편향 없이 안정적인 성능을 보였으며, 전체 데이터셋에 대한 평균 정밀도와 재현율이 각각 0.95 이상이었다.
해석 가능성 측면에서는 HiResCAM을 적용해 클래스별 활성화 맵을 생성하였다. HiResCAM은 기존 Grad‑CAM보다 높은 공간 해상도를 제공해, 모델이 실제로 날맥, 더듬이 절절, 복부(메타솔) 등 형태학적 진단 부위에 집중하고 있음을 시각적으로 확인할 수 있게 한다. 전문가가 지정한 진단 부위와 HiResCAM이 강조한 영역 사이의 평균 IoU는 0.71로, 모델이 인간 전문가와 유사한 판단 근거를 사용한다는 강력한 증거를 제공한다. 또한, 시각화는 모델이 배경이나 라벨링 오류와 같은 무관한 요소에 의존하지 않음을 보여, 과학적 신뢰성을 높인다.
데이터와 코드가 각각 Zenodo와 GitHub에 공개돼 재현 가능성을 보장한다. 저자들은 향후 다른 곤충군, 식물 표본, 혹은 현장 촬영 이미지에도 동일한 파이프라인을 적용할 수 있는 확장성을 제시한다. 다만, 512 × 512로 다운샘플링된 이미지가 미세 구조(예: 털, 색소 패턴)를 손실할 가능성이 있으며, 실제 현장 환경에서 조명 변화와 배경 잡음에 대한 견고성 검증이 추가로 필요하다고 언급한다.
결론적으로, 이 연구는 고해상도 이미지와 최신 YOLO 객체 검출 모델, 그리고 HiResCAM 기반 XAI를 결합해 초벌목벌 식별의 정확도와 투명성을 동시에 달성하였다. 96 % 이상의 정확도와 형태학적 특징에 대한 시각적 검증을 통해, 곤충학, 생물다양성 모니터링, 생물학적 방제 프로그램 등에 실용적인 AI 도구로 활용될 수 있음을 입증한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기