운영형 세그멘테이션 네트워크로 코로나19 흉부 X선 진단 혁신

본 연구는 운영형 신경망(Self‑ONN) 기반 디코더를 도입한 OSegNet을 제안하고, 12만 1천 378장의 흉부 X선(CXR) 이미지와 9 258장의 코로나19 마스크를 포함하는 확장된 QaTa‑COV19 데이터셋을 공개한다. 픽셀‑레벨 폐렴 세그멘테이션을 통해 COVID‑19 여부를 판단함으로써 기존 분류‑중심 모델보다 높은 정확도(99.65 %)와 높은 정밀도(98.09 %)를 달성하였다.

저자: Aysen Degerli, Serkan Kiranyaz, Muhammad E. H. Chowdhury

운영형 세그멘테이션 네트워크로 코로나19 흉부 X선 진단 혁신
본 논문은 코로나19(COVID‑19) 진단을 위한 흉부 X선(CXR) 이미지 분석에 있어, 기존 딥러닝 기반 분류 모델이 데이터 부족과 비관련 영역에 대한 과도한 주목으로 신뢰성에 한계를 보인다는 문제점을 지적한다. 이를 해결하고자 저자들은 ‘운영형 세그멘테이션 네트워크(OSegNet)’를 제안한다. OSegNet은 최신 전이 학습 모델(DenseNet‑121, Inception‑v3)을 인코더로 사용하고, 디코더에는 Self‑Organized Operational Neural Networks(Self‑ONN) 기반의 운영 레이어를 적용한다. Self‑ONN은 각 커널 요소마다 테일러 급수를 이용해 임의의 비선형 변환을 학습하도록 설계된 ‘운영 뉴런’으로, 전통적인 선형 컨볼루션에 비해 훨씬 풍부한 표현력을 제공한다. 이러한 구조적 차별화는 모델 깊이와 복잡도를 낮추면서도 높은 학습 효율을 가능하게 한다. 데이터 측면에서는 기존 연구가 소규모 데이터셋에 의존해 과적합 위험을 안고 있었던 반면, 저자들은 QaTa‑COV19 데이터셋을 크게 확장하였다. 원본 데이터는 ChestX‑ray14(112 120장, 정상·14가지 폐질환)와 BIMCV‑COVID19+에서 추출한 9 258장의 코로나19 양성 CXR을 포함한다. 중복 제거와 환자 단위 분할을 통해 훈련·검증·테스트 셋을 각각 93 669, 106 524, 27 709장으로 구성했으며, 모든 코로나19 이미지에 대해 전문가와 자동화된 U‑Net, UNet++·DLA 기반 모델을 활용한 반자동 주석 과정을 거쳐 정확한 폐렴 마스크를 생성했다. 이렇게 구축된 대규모 픽셀‑레벨 라벨은 세그멘테이션 모델의 일반화 능력을 객관적으로 평가할 수 있는 기반이 된다. 학습 과정에서는 Dice loss와 focal loss를 합산한 하이브리드 손실 함수를 사용해 클래스 불균형을 보정하였다. Adam 옵티마이저(learning rate = 1e‑4)와 50 epoch 학습을 통해 모델을 최적화했으며, 데이터 증강으로는 회전(±10°)과 수평·수직 이동(10%)을 적용했다. 평가 지표는 픽셀‑레벨 민감도, 특이도, 정밀도, F1‑Score, F2‑Score, 전체 정확도이며, CXR 단위 진단은 ‘마스크에 하나라도 양성 픽셀이 있으면 COVID‑19 양성’이라는 규칙으로 수행했다. 실험 결과, OSegNet은 다양한 Q(테일러 차수) 설정에 따라 성능 변화를 보였으며, 특히 Q=3일 때 Inception‑v3 인코더와 결합된 모델이 민감도 89.36 %와 F2‑Score 88.75 %를 기록해 기존 UNet++·DLA 기반 모델을 능가했다. 또한, Q=5 설정에서는 파라미터 수가 약 3.6 M 감소하면서도 정확도 99.65 %와 정밀도 98.09 %를 유지해 효율성 측면에서도 우수함을 입증했다. 비교 실험에서 UNet++(Inception‑v3)와 OSegNet(Q=3) 모델의 혼동 행렬을 보면, UNet++은 31건의 COVID‑19를 놓쳤고, OSegNet은 40건의 false‑positive만 발생해 전반적인 오류율이 낮았다. 파라미터 수와 추론 시간에서도 OSegNet은 UNet++보다 3.6 M~1.2 M 적게 요구하며, 실시간 임상 적용 가능성을 시사한다. 결론적으로, OSegNet은 운영 레이어를 활용해 폐렴 영역에 집중하도록 강제함으로써 기존 CNN이 배경·텍스트·골격 등 비관련 영역에 주목하는 문제를 해결한다. 픽셀‑레벨 세그멘테이션 기반 진단은 모델의 설명 가능성을 높이고, 대규모 고품질 라벨 데이터와 결합해 실제 임상 환경에서 신뢰할 수 있는 자동 진단 도구로 활용될 수 있다. 또한, 저자들이 공개한 QaTa‑COV19 데이터셋은 향후 코로나19 및 기타 폐질환 연구에 중요한 자산이 될 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기