크라우드소싱 기반 자동 부식 탐지 딥러닝

본 논문은 부식 검출을 위한 대규모 라벨링 데이터 확보가 딥러닝 모델 성능 향상의 핵심이라는 전제 하에, 일반 대중이 참여할 수 있는 웹 기반 플랫폼 corrosiondetector.com 을 설계·운영한 과정을 상세히 기술한다. 초기 데이터셋은 859장의 이미지로 구성되었으며, 이는 개발자 제공 이미지와 구글 이미지 검색을 통해 수집된 사진들이다. 웹사이트는 두 가지 주요 기능을 제공한다. 첫째, 사용자는 화면에 무작위로 제시된 4장의 이미지를 보고 ‘부식이 보이는가’를 체크한다. 동일 이미지에 대해 최소 5명의 투표가 모이면 다수결에 따라 ‘부식 있음’ 또는 ‘부식 없음’ 라벨이 확정된다. 둘째, 사용자는 자신이 촬영한 이미지를 업로드할 수 있으며, 업로드된 이미지는 현재 최신 모델이 실시간으로 부식 여부를 판단하고, 사용자는 결과를 검증·수정할 수 있다. 라벨링된 데이터는 즉시 학습 파이프라인에 투입된다. 모델은 U‑Net 인코더 구조를 변형한 5계층 합성곱 신경망(CNN)으로, Kaiming uniform 초기화와 Cross‑Entropy 손실 함수를 사용하고, Adam 옵티마이저(학습률 1e‑4)로 최적화한다. 초기 베이스 모델은 전체 데이터셋을 한 번(1 epoch) 학습한 뒤 배포되었으며, 이후 누적된 투표와 업로드 이미지를 반영해 25 epoch씩 3차례 재학습한다. 학습은 NVIDIA GTX 1080Ti GPU와 CUDA 가속을 이용해 Ubuntu Linux 환경에서 수행되었고, 추론 단계에서는 모델을 ONNX 포맷으로 변환해 AWS Lambda 상에서 실행한다. Lambda의 50 MB 이하 압축 제한을 만족하도록 전체 런타임을 가상 환경에 패키징하였다. 운영 기간은 2018년 9월 26일부터 37일간 진행되었으며, 이 기간 동안 총 2 539표가 수집되었다. 또한 사용자는 310장의 이미지를 업로드했고, 이들 이미지에 대해 최신 모델이 실시간으로 부식 여부를 판단하였다. 모델 성능 평가는 별도 검증 셋(444장)에서 정확도(Accuracy)로 측정했으며, 초기 정확도 66 %에서 37일 차에 93 %까지 상승하였다. 정확도 향상 곡선을 기반으로 저자는 99.9 % 수준의 정확도를 달성하려면 약 30 000표가 필요하다고 추정한다. 이는 라벨 수와 모델 정확도 간의 경험적 관계를 제시하며, 대규모 라벨링이 성능 향상의 핵심임을 재확인한다. 라벨 품질에 대한 분석에서는 투표 불일치가 빈번히 발생했음을 보고한다. 특정 이미지에 대해 40~60 %의 의견 차이가 있었으며, 이는 비전문가가 부식을 ‘부식’과 ‘손상·오염’ 등으로 혼동하거나, 의도적인 피팅(날씨강철)까지 부식으로 인식하는 사례가 원인이다. 예시로는 폐허 건물, 해양 플랫폼, 철근 준비 현장 등이 제시되었으며, 각각 53 %, 50 %, 45 % 정도의 부식 긍정 투표가 있었다. 이러한 현상은 인간 전문가가 상황적 맥락과 재료 특성을 고려해 판단하는 반면, 현재 모델은 단순 이진 분류에 머물러 있어 복잡한 현장 판단을 재현하기 어렵다는 점을 강조한다. 저자는 라벨 품질 향상을 위한 방안으로 (1) 전문가 검증 단계 도입, (2) 투표 신뢰도 가중치 적용, (3) 다중 클래스(부식·오염·손상 등) 분류 체계 확대, (4) 이미지 메타데이터(촬영 환경·재료 정보) 활용 등을 제시한다. 또한, 크라우드소싱 플랫폼을 지속적으로 운영하기 위해 사용자 참여 유도 방안(보상·피드백 제공)과 데이터 프라이버시·저작권 관리 정책을 명시하였다. 결론적으로, 본 연구는 크라우드소싱을 통한 대규모 라벨링 파이프라인 구축, 클라우드 기반 딥러닝 모델의 실시간 서비스 연계, 그리고 라벨 수·품질·모델 복잡도 간의 상호작용을 실증적으로 보여준다. 향후 연구에서는 라벨 품질 제어 메커니즘을 강화하고, 보다 정교한 세분화 모델을 개발함으로써 현장 부식 검출의 신뢰성을 높이는 방향으로 나아갈 필요가 있다.

크라우드소싱 기반 자동 부식 탐지 딥러닝

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기