반복 주석으로 신경망 학습 효율화 병리와 영상 분야를 잇는 HAI L 파이프라인
본 논문은 Aperio ImageScope와 DeepLab v2 기반의 HAI L(Human AI Loop) 시스템을 제안한다. 전문가가 ImageScope에서 XML 형태로 주석을 달고, 이를 자동으로 마스크로 변환해 네트워크를 학습·예측에 활용한다. 인간‑인‑루프 방식으로 반복 주석을 수행하면 주석 속도가 70~80% 감소하고, 5회 반복 후 신장 사구체와 전립선 MRI 등에서 거의 완벽에 가까운 분할 성능을 달성한다. 다중 해상도(Deep…
저자: Brendon Lutnick, Br, on Ginley
본 연구는 디지털 병리와 방사선 영상 분야에서 딥러닝 기반 의미론적 분할을 실용화하기 위해, Aperio ImageScope와 DeepLab v2를 연결한 HAI L(Human AI Loop) 파이프라인을 설계·구현하였다. ImageScope는 병리학자들이 익숙하게 사용하는 WSI 뷰어이며, XML 형식으로 주석을 저장한다. 연구팀은 OpenCV와 OpenSlide을 활용해 XML 주석을 픽셀 마스크로 변환하고, 네트워크가 출력한 마스크를 다시 XML로 변환해 ImageScope에 표시하도록 하였다. 이를 통해 전문가가 네트워크 예측을 실시간으로 시각 확인·수정할 수 있게 되었다.
학습 과정은 인간‑인‑루프(active learning) 방식을 채택하였다. 초기에는 소수의 수동 주석(Iteration 0)만으로 모델을 학습시키고, 이후 모델이 생성한 예측을 전문가가 교정한다. 교정된 영역은 새로운 학습 데이터로 즉시 추가되며, 이 과정을 반복함으로써 주석 효율이 크게 향상된다. 실험에서는 신장 마우스 조직의 사구체(Glomeruli) 분할을 5회 반복 학습했으며, 각 반복마다 주석 속도가 4~10배 빨라졌다(81.4%, 82%, 72.7% 시간 절감). 네트워크 성능은 F1 점수와 민감도·특이도 지표에서 거의 완벽에 근접했으며, 4번째 반복에서 최종 성능에 도달했다.
대용량 WSI의 희소한 목표를 효율적으로 처리하기 위해 두 단계의 다중 해상도 네트워크(DeepZoom)를 도입하였다. 저해상도(1/16) 네트워크가 전체 슬라이드에서 후보 영역을 빠르게 탐색하고, 고해상도 네트워크가 해당 영역을 정밀 분할한다. 이 전략은 전체 해상도 단일 패스 대비 4.5배 빠른 추론 속도와 높은 F1 점수를 제공한다. 특히, 저해상도 단계가 배경 영역을 걸러내어 고해상도 단계의 오탐지를 크게 감소시켰다.
다중 클래스 확장성도 검증하였다. 사구체 내 핵 유형(포도당세포·비포도당세포), 간질 섬유화·관상 위축(IFTA), 경화·비경화 사구체 등을 별도 레이블링하여 재학습했으며, 인간 주석 오류에도 불구하고 모델이 더 정확한 경계를 제시하는 경우가 있었다. 이는 모델이 통계적 패턴을 학습해 인간의 일관성 부족을 보완할 수 있음을 시사한다.
또한, 파이프라인을 방사선 영상에 적용해 인간 전립선 T2‑MRI 데이터를 분할하였다. 39명의 환자(평균 32 슬라이스, 512×512) 데이터를 4명씩 추가하며 5회 반복 학습했으며, 민감도 0.88 ± 0.04, 특이도 0.99 ± 0.001, 정밀도 0.90 ± 0.03, 정확도 0.99 ± 0.001의 성능을 달성했다. 여기서도 두 번째 반복 이후 주석 시간이 90% 이상 감소했다.
전체적으로 HAI L 파이프라인은 (1) 기존 병리·영상 뷰어와의 원활한 연동을 통해 전문가가 익숙한 환경에서 주석·검증을 수행하도록 함, (2) 인간‑인‑루프와 다중 해상도 전략을 결합해 주석 효율과 모델 성능을 동시에 극대화함, (3) 다양한 조직·모달리티(신장, 전립선 MRI 등)에 적용 가능하도록 설계됨을 보여준다. 향후 DICOM 뷰어와 직접 연동, 자동 주석량 예측, 신뢰도 기반 이상 탐지 등 임상 현장 적용을 위한 기능 확장이 계획되어 있다. 이러한 접근은 디지털 병리와 의료 영상 데이터베이스 구축에 핵심적인 역할을 할 것으로 기대된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기