전방 안구 OCT 영상의 조직 경계 정확 분할을 위한 적대적 사전‑분할 기법
본 논문은 전방 안구 OCT B‑scan에서 얕은 조직 경계가 가려지는 강한 스펙큘러 아티팩트와 스페클 노이즈를 제거하기 위해 조건부 생성적 적대 신경망(cGAN)을 사전‑분할 단계로 적용하고, 원본 이미지와 사전‑분할 결과를 결합한 Tissue Interface Segmentation Network(TISN)으로 최종 경계를 정밀하게 추출한다. 코라놀·림벌 데이터셋에서 높은 정확도를 달성했으며, 전통적 그래프 기반 알고리즘과 결합한 하이브리드…
저자: Jiahong Ouyang, Tejas Sudharshan Mathai, Kira Lathrop
본 논문은 전방 안구 OCT(Optical Coherence Tomography) 영상에서 가장 얕은 조직 경계, 즉 각막 전표면이나 림버 상피‑바운더리를 정확히 추출하는 데 직면한 두 가지 주요 문제—강한 스펙큘러 아티팩트와 높은 스페클 노이즈—를 해결하기 위해 새로운 두 단계 신경망 파이프라인을 제안한다. 첫 번째 단계는 조건부 생성적 적대 신경망(cGAN)으로, 입력 B‑scan을 받아 스펙큘러 반사와 상위 스페클을 억제한 “클린” 마스크를 생성한다. 생성자는 U‑Net 기반 인코더‑디코더 구조에 스킵 연결을 유지하고, L1 손실과 판별기의 adversarial loss를 동시에 최소화한다. 판별기는 실제 전문가가 만든 스펙큘러‑제거 라벨과 생성된 마스크를 구분하도록 학습함으로써, 생성자가 물리적 의미를 유지하면서도 잡음만을 제거하도록 유도한다. 이 사전‑분할 단계는 전통적인 필터링(예: 위상 기반 웨이블릿, 평균 필터)보다 구조적 정보를 더 잘 보존한다는 점에서 차별성을 가진다.
두 번째 단계인 Tissue Interface Segmentation Network(TISN)는 원본 OCT 이미지와 cGAN이 만든 사전‑분할 마스크를 2채널 입력으로 받아, 다중 스케일 컨볼루션과 dilated convolution을 결합한 U‑Net‑like 아키텍처로 얕은 인터페이스를 픽셀 수준에서 세분화한다. TISN은 Dice loss와 경계 정밀도 손실을 동시에 최적화하도록 설계돼, 얇은 전표면의 미세 변화를 감지한다. 네트워크는 깊이 5의 인코더와 디코더를 갖추고, 각 레벨에서 3×3 컨볼루션, 배치 정규화, ReLU를 적용한다. 디코더 단계에서는 업샘플링 후 스킵 연결을 통해 고해상도 정보를 복원한다. 최종 출력은 1채널 바이너리 마스크이며, 후처리 단계에서 작은 잡음 영역을 제거하기 위해 3×3 구조 요소를 이용한 형태학적 연산을 적용한다.
데이터셋은 Carnegie Mellon University와 University of Pittsburgh에서 수집한 전방 안구 OCT B‑scan으로 구성된다. 코라놀 데이터는 1500장, 림벌 데이터는 500장을 포함하며, 각 이미지에 대해 전문가가 직접 라벨링한 얕은 인터페이스와 스펙큘러‑제거 마스크가 제공된다. 데이터 증강으로 회전(±15°), 수평·수직 뒤집기, 강도 변형(γ 보정) 등을 적용해 학습 다양성을 확보하였다. 학습은 Adam 옵티마이저(learning rate 1e‑4, β1=0.9, β2=0.999)로 진행했으며, 100 epoch 동안 배치 크기 8을 사용했다. cGAN은 L1 손실 가중치 λ=100을 적용해 픽셀 수준 재구성을 강조했고, TISN은 Dice loss와 경계 손실을 0.5:0.5 비율로 결합했다.
성능 평가는 Dice coefficient, 평균 절대 오차(MAE), 95th percentile Hausdorff distance를 사용했다. 기존 단일 CNN(직접 세그멘테이션) 대비 제안된 두 단계 파이프라인은 Dice가 0.92→0.96, MAE가 3.2 µm→1.8 µm, Hausdorff distance가 12 µm→6 µm로 크게 개선되었다. 특히 스펙큘러가 강하게 나타나는 영역에서 오류 감소가 두드러졌으며, 림벌 데이터에서도 유사한 성능 향상을 보였다.
추가 실험으로, cGAN이 만든 사전‑분할 마스크를 전통적인 그래프 기반 최적화(예: 최소 경로 탐색, Dijkstra 알고리즘)와 결합한 하이브리드 프레임워크를 구현했다. 이 경우에도 평균 경계 오차가 2.1 µm에서 1.4 µm로 감소했으며, 연산 시간은 GPU 기반 TISN 대비 약 1.5배 증가했지만, 기존 레거시 시스템과의 호환성을 확보할 수 있었다.
논문의 주요 기여는 다음과 같다. (1) 전방 OCT 특유의 스펙큘러와 스페클을 학습 기반으로 사전‑제거하는 cGAN 설계, (2) 사전‑제거 마스크와 원본을 동시에 활용해 얕은 인터페이스를 정밀하게 추출하는 TISN, (3) 전통적 이미지 분석 기법과 결합해 하이브리드 성능을 검증한 점이다. 제한점으로는 라벨 마스크 생성에 전문가 주관이 크게 작용해 데이터셋 확장성이 낮을 수 있으며, 매우 강한 섀도우(예: 각막 절제술 후)에서는 잔여 노이즈가 남아 경계 추정에 영향을 줄 수 있다. 향후 연구에서는 무감독 혹은 반감독 학습으로 라벨 의존성을 낮추고, 3‑D 볼륨 전체에 걸친 연속성 제약을 추가해 실시간 수술 가이드라인에 적용하는 방안을 모색할 필요가 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기