분산 ECG 라벨링을 위한 웹 기반 도구 LabelECG
LabelECG는 웹 브라우저만으로 12‑lead ECG를 시각화·주석 달 수 있게 만든 분산형 라벨링 시스템이다. 통합 데이터 관리와 사용자 인증을 제공해 여러 병원의 의사·기술자가 동시에 작업할 수 있게 하며, 3개월 동안 15 000건의 ECG를 성공적으로 주석 달아 국내 최초 ECG AI 경진대회를 지원하였다.
저자: Zijian Ding, Shan Qiu, Yutong Guo
본 논문은 심전도(ECG) 데이터를 기반으로 한 딥러닝 모델 개발에 필요한 대규모 라벨링 작업을 효율적으로 수행하기 위한 웹 기반 도구, LabelECG를 제안한다. 기존의 ECG 라벨링 툴은 대부분 오프라인 전용이며, 설치·사용이 복잡하고 데이터 관리가 분산돼 협업에 한계가 있었다. 이를 해결하고자 저자들은 프론트엔드·백엔드·시각화 모듈로 구성된 통합 플랫폼을 설계하였다.
프론트엔드는 HTML5와 JavaScript를 이용해 PC, 노트북, 태블릿, 스마트폰 등 다양한 디바이스에서 웹 브라우저만으로 접근 가능하도록 구현되었다. 사용자는 회원가입 시 관리자가 제공하는 인증 코드를 입력해 계정을 생성하고, 로그인 후 개인 대시보드에서 데이터셋을 선택한다. 데이터셋은 공개된 PhysioNet 저장소와 사용자가 직접 업로드한 파일을 모두 지원한다. 선택된 데이터셋 내에서 마지막으로 작업한 레코드부터 순차적으로 표시되며, Lightwave 시각화 엔진을 통해 12‑lead ECG 파형을 실시간으로 렌더링한다. 사용자는 리드별 표시/숨김, 확대·축소, 심박수 등 기본 파라미터를 확인할 수 있다.
라벨링 인터페이스는 세 개의 입력 영역으로 구성된다. 좌측에는 ECG 파라미터(심박수 등), 중앙에는 자동 진단 결과(예: 정상, AF, ER 등), 우측에는 자유 서술형 주석 입력란이 있다. 사용자는 ‘확인(confirmed)’ 버튼을 눌러 라벨을 확정하거나, ‘불확실(unsure)’ 버튼을 눌러 해당 레코드를 의심 목록에 추가한다. 라벨이 저장되면 시스템은 자동으로 다음 레코드로 전환한다. 또한 ‘이전’, ‘다음’ 버튼을 통해 임의의 레코드로 이동할 수 있다.
백엔드는 Node.js와 Express 기반의 RESTful API 서버와 세 개의 MySQL 데이터베이스로 구성된다. 첫 번째 데이터베이스는 사용자 계정·권한 정보를 관리하고, 두 번째는 ECG 원시 데이터·파라미터·자동 진단 결과를 저장한다. 세 번째 데이터베이스는 사용자가 입력한 라벨과 ‘불확실’ 리스트를 보관한다. 이러한 구조는 데이터 무결성을 보장하고, 다중 사용자가 동시에 접근해도 충돌 없이 라벨링 작업을 수행할 수 있게 한다.
시각화 모듈인 Lightwave는 PhysioNet에서 제공하는 CGI 기반 ECG 파서와 연동된다. 백엔드 서버가 Lightwave에 ECG 데이터를 전달하면, Lightwave는 이를 파싱해 웹 페이지에 그래픽으로 출력한다. 현재 버전은 파형 전체를 보여주는 데 초점을 맞추었으며, 향후 비트 수준(beat) 및 fiducial point(예: P‑wave, QRS, T‑wave) 라벨링 기능을 추가할 예정이다.
LabelECG는 Docker 컨테이너 이미지로 배포되어, 로컬 LAN 환경이나 퍼블릭 클라우드(AWS, Azure 등) 어디에서든 손쉽게 설치·운용할 수 있다. 이는 병원 내부망에서 데이터 보안을 유지하면서도 웹 기반 협업을 가능하게 한다.
실제 적용 사례로, 저자들은 베이징 청창병원, 중국과학원 중관촌병원, 톈진 우칭구인민병원, 칭다오대학 부속병원 등 네 개 병원의 의사 4명이 LabelECG를 이용해 3개월 동안 약 15 000건의 12‑lead 휴식 ECG를 라벨링했다. 라벨링 작업은 평균 하루 200건 이상을 처리했으며, 라벨 품질을 높이기 위해 전문가 계정이 일반 사용자의 라벨을 검토·수정하는 검증 절차를 도입했다. 결과적으로 라벨링된 데이터는 ‘제1회 중국 ECG 인텔리전스 경쟁’의 학습·평가 데이터셋으로 활용되어, 대회 참가팀들의 알고리즘 성능 향상에 크게 기여하였다.
논문에서는 현재 시스템의 제한점도 언급한다. 첫째, 파형 수준(beat, fiducial point) 라벨링이 아직 구현되지 않아 심전도 세부 구조 분석에 제약이 있다. 둘째, 인터페이스가 현재 한글로만 제공되어 국제 사용자 접근성이 낮다. 이를 해결하기 위해 향후 영어 버전을 배포하고, 자동 QRS 검출·ST‑segment 변형 자동 표시 등 추가적인 자동 분석 기능을 통합할 계획이다.
결론적으로, LabelECG는 ECG 라벨링의 병목을 해소하고, 대규모 고품질 라벨링 데이터를 효율적으로 구축할 수 있는 실용적인 인프라를 제공한다. 오픈 소스로 공개될 경우 전 세계 연구자들이 손쉽게 활용할 수 있어, ECG 기반 인공지능 연구의 가속화에 크게 기여할 것으로 기대된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기