다양한 폐결절을 대량 합성하는 3D 다중조건 GAN 기반 CT 이미지 증강 및 객체 탐지 향상

본 논문은 3차원 다중조건 GAN(MCGAN)을 설계하여 폐 CT 영상에 실제와 구분하기 어려운 32×32×32 크기의 결절을 원하는 위치·크기·감쇠 강도 조건으로 합성한다. 생성된 가상 결절을 3D Faster R‑CNN 학습에 추가함으로써, 동일한 FP 비율에서 모든 결절 크기·형태에 대해 감도(sensitivity)를 크게 향상시켰으며, 시각 튜링 테스트에서도 전문가가 실물과 합성을 구별하지 못했다.

저자: Changhee Han, Yoshiro Kitamura, Akira Kudo

다양한 폐결절을 대량 합성하는 3D 다중조건 GAN 기반 CT 이미지 증강 및 객체 탐지 향상
**1. 연구 배경 및 필요성** 컴퓨터 보조 진단(CAD)은 대규모 라벨링된 의료 영상 데이터가 전제되어야 높은 정확도를 달성한다. 그러나 폐 CT와 같은 3D 영상은 스캔 장비와 프로토콜이 다양하고, 전문 방사선과의 라벨링 비용이 높아 데이터가 작고 파편화된 경우가 대부분이다. 기존의 기하학·강도 변환 기반 데이터 증강은 원본 이미지와 거의 동일한 변형만을 제공해 데이터 다양성을 충분히 확보하지 못한다. 최근 GAN을 활용한 데이터 증강은 새로운 샘플을 생성함으로써 데이터 분포를 확장할 수 있지만, 대부분 2D 이미지에 국한되거나 3D 세분화에만 초점을 맞추었다. 특히, 바운딩 박스 기반 3D 객체 탐지는 라벨링 비용이 낮아 임상에서 실용적이지만, 이를 지원하는 3D 조건부 GAN은 아직 존재하지 않는다. **2. 목표** 본 연구는 (i) 바운딩 박스만으로 충분히 라벨링된 폐 결절 데이터를 활용해, 원하는 위치·크기·감쇠 조건을 동시에 만족하는 3D 결절을 자연스럽게 합성하는 GAN 모델을 개발하고, (ii) 생성된 합성 결절을 3D 객체 탐지 모델(3D Faster R‑CNN)의 학습에 활용해 감도와 FP 비율을 개선하는 것을 목표로 한다. **3. 데이터 준비** - 데이터셋: LIDC‑IDRI (총 1,018 스캔) 중 슬라이스 두께 ≤3 mm, 픽셀 간격 0.5–0.9 mm인 745 스캔을 선택. - 라벨링: 결절을 크기(소 ≤10 mm, 중 10–20 mm, 대 >20 mm)와 감쇠(고형, 반고형, Ground‑Glass) 두 축으로 라벨링, 총 6가지 조건. - 학습/검증/테스트 분할: 훈련 632 스캔(3,727 결절), 검증 37 스캔(143 결절), 테스트 76 스캔(265 결절). **4. MCGAN 설계** - **입력**: 64×64×64×7 텐서. 64³ 주변 부피에 노이즈 박스(값 범위

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기