디지털 문맹을 위한 실시간 약어 도움 브라우저 확장

본 논문은 기술 약어와 약자를 마우스 오버하면 사전 정의와 OpenAI LLM 기반 설명을 툴팁으로 제공하는 Chrome 확장 프로그램 ‘Acro Helper’를 설계·구현하고, 디지털 문맹 사용자 25명을 대상으로 이해도 향상, 검색 시간 절감, 사용성 만족도를 평가한다. 페이지 분류를 위해 Google NLP Taxonomy API와 ChatGPT를 이중으로 활용했으며, 사전 기반 정의는 평균 2 135 ms, AI 기반 정의는 16 429…

저자: Christos Koutsiaris

본 논문은 디지털 문맹(디지털 활용 능력이 낮은 사용자)에게 웹 페이지 상의 기술 약어와 약자를 실시간으로 설명해 주는 브라우저 확장 프로그램 ‘Acro Helper’를 제안한다. 서론에서는 디지털 기술 확산과 함께 등장한 전문 용어가 디지털 문맹에게 이해 장벽이 된다는 문제를 제시하고, 기존 교육 프로그램이나 별도 검색 방식이 즉각적인 해결책이 되지 못함을 지적한다. 관련 연구에서는 Tipper, LemonAid, NASA Acronyms 등 기존 컨텍스트 도움 도구들을 검토하고, 이들 도구가 AI 기반 페이지 분류와 LLM을 활용한 정의 제공을 결합하지 못한 점을 차별점으로 제시한다. 연구 질문(RQ)은 (1) 확장 프로그램이 디지털 문맹 사용자의 기술 용어 이해도를 향상시킬 수 있는가, (2) 정보 검색 시간을 절감하는가, (3) AI가 페이지 분류 정확도에 기여할 수 있는가이다. 시스템 아키텍처는 네 단계 파이프라인으로 구성된다. ① **콘텐츠 정제·파싱**: 페이지 로드 후 복제된 DOM에서 헤더·푸터·광고·스크립트 등을 제거하고, Mozilla Readability를 이용해 본문 텍스트를 추출한다. ② **AI 기반 페이지 분류**: 정제된 텍스트를 Google Cloud NLP Taxonomy API에 전송해 ‘컴퓨터·소프트웨어·인터넷·공학·기술’ 카테고리가 포함되면 기술 페이지로 판단한다. 해당 카테고리가 없을 경우 ChatGPT에 “이 텍스트에 기술 관련 용어가 포함되어 있는가?”라는 프롬프트를 보내 이진 판단을 수행한다. 이중 검증으로 오분류 위험을 최소화한다. ③ **약어 탐지**: 사전 서버에서 약어 리스트(키만) 를 받아 정규식(`\b{key}\b`) 으로 본문에서 매칭한다. 매칭된 약어에 대해 사전 정의를 즉시 반환하고, 사전에 없는 경우 추가적인 ChatGPT 호출을 통해 컨텍스트에 맞는 정의를 생성한다. ④ **DOM 툴팁 삽입**: 탐지된 약어를 `약어` 로 감싸고, 브라우저 기본 툴팁을 활용해 마우스 오버 시 정의가 표시되도록 한다. 텍스트 노드만 교체해 기존 HTML 구조와 충돌을 방지한다. 또한 확장 팝업에 별도 탭 페이지를 제공해 사용자가 전체 사전을 실시간 검색할 수 있게 했다. 평가 방법은 혼합 방법(양적·질적) 설계로, 25명의 참가자를 세 그룹(노년 커뮤니티, 성인 교육기관, 비전산 업무 종사자)으로 모집했다. 각 참가자는 먼저 확장 없이 기술 기사(맥북 프로 리뷰)를 읽고 사전 설문을 작성한 뒤, 확장을 활성화하고 동일 기사를 다시 읽으며 툴팁을 활용한다. 이후 이해도, UX, 시간 절감 등을 묻는 사후 설문과 ‘CPU’ 정의를 구글 검색으로 찾는 수동 시간 측정을 진행했다. 또한 10회 반복 실행을 통해 사전 경로와 AI 경로의 정의 반환 시간을 측정했다. 결과는 다음과 같다. 이해도 향상 질문에서는 92%가 ‘중간 이상’ 개선을 보고했으며, 시간 절감 질문에서는 96%가 긍정적으로 답했다. 모든 참가자는 툴팁이 독서 흐름을 방해하지 않았다고 답했다. 정의 반환 시간은 사전 경로 평균 2 135 ms, AI 경로 평균 16 429 ms였으며, 이는 수동 구글 검색 평균 17 200 ms보다 빠르다. 정성 인터뷰에서는 AI 정의가 간결하고 상황에 맞다는 평가가 많았고, 정의 길이 선택(짧은·긴) 기능, UI 색·폰트 커스터마이징 요구가 제기되었다. 한 참가자는 자폐 스펙트럼과 단기 기억 어려움을 겪으며, 현재는 용어를 적고 검색하는 번거로움을 토로했으며, Acro Helper가 이러한 작업 흐름을 크게 개선할 것이라 기대를 표명했다. 논의에서는 RQ1에 대해 92%의 긍정적 응답으로 이해도 향상이 입증되었으며, RQ2에 대해 정의 반환 시간이 수동 검색보다 빠르고, 여러 약어를 동시에 처리함으로써 전체 세션 시간 절감 효과가 있음을 확인했다. RQ3에 대해서는 이중 AI 분류가 비기술 문맥에서도 기술 페이지를 정확히 식별했으며, 오탐지(예: “POST” 오인) 문제는 아직 남아 있어 향후 경량 온디바이스 NLP 모델 도입으로 해결 가능성을 제시한다. 제한점으로는 표본 규모와 실험실 환경으로 인한 외적 타당성 부족, 참가자들의 자기 선택 편향, 그리고 사전 매칭 오류가 있다. 미래 작업에서는 정의 캐시를 로컬에 저장해 AI 호출을 최소화하고, 온디바이스 경량 NLP 모델을 탑재해 다의어 해석과 오탐지를 개선한다. 또한 의료·법률·금융 등 다른 전문 분야로 확장하기 위해 도메인별 사전과 분류 카테고리를 교체하는 모듈형 설계를 제안한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기