데이터 비전 알고리즘 추상화를 넘어 보는 방법
본 논문은 데이터 분석 학습 환경에서 알고리즘 적용이 기계적 규칙 수행과 상황적 판단 사이에서 어떻게 조율되는지를 탐구한다. 규칙‑기반(rule‑based)과 규칙‑구속(rule‑bound) 개념을 구분하고, ‘데이터 비전’이라는 개념을 통해 학습자들이 추상적 모델과 경험적 변동성을 동시에 다루는 과정을 조명한다.
저자: Samir Passi, Steven J. Jackson
본 논문은 현대 데이터 분석이 알고리즘이라는 형식적 규칙 체계와 현장의 복합적 상황 사이에서 어떻게 조화되는지를 탐구한다. 서론에서는 알고리즘이 지식 생산에 핵심적인 역할을 수행하지만, 동시에 선택적·주관적·편향적 특성을 지니며, 이러한 특성을 극복하기 위해서는 ‘상황적 작업(situated work)’이 필수적이라고 주장한다. 저자는 이를 ‘데이터 비전(data vision)’이라는 개념으로 정의한다. 데이터 비전은 데이터를 통해 세계를 조직하고 조작하는 능력과, 언제·어떻게 기존 방법을 즉흥적으로 변형·보완할지를 판단하는 능력의 결합이다.
이론적 배경으로는 Goodwin의 ‘전문가 시각’, Abbott의 ‘문제 상황의 위치짓기’, Dewey와 Cohen의 ‘루틴과 변동성’ 등을 검토한다. 특히 ‘규칙‑기반(rule‑based)’과 ‘규칙‑구속(rule‑bound)’의 구분을 통해, 알고리즘이 제공하는 형식적 틀은 존재하지만 실제 적용 단계에서는 상황에 따라 유연하게 해석·조정된다는 점을 강조한다. 이러한 논의는 기존 CSCW·HCI 연구에서 인간‑기계 협업, 대표성 장치, 데이터 수집의 사회적 차원 등을 다룬 사례와 연결된다.
연구 방법은 두 개의 데이터 학습 환경에 대한 심층 현장 연구이다. 첫 번째 현장은 대학 수준의 머신러닝 강의실이며, 강의자는 알고리즘 선택, 파라미터 튜닝, 모델 평가 과정을 교재와 슬라이드에 따라 순차적으로 제시한다. 그러나 학생들은 데이터 전처리 단계에서 결측치 처리, 이상치 제거, 변수 변환 등 교재에 명시되지 않은 문제에 직면한다. 이때 학생들은 동료와 토론하거나 온라인 포럼을 참고해 ‘임시적 해결책’을 도입하고, 때로는 기존 파이프라인을 재구성한다. 이러한 과정은 규칙‑기반 프레임워크 안에서 상황적 판단이 어떻게 작동하는지를 보여준다.
두 번째 현장은 디지털 인문학 워크숍이다. 참가자들은 텍스트 코퍼스를 정제하고 시각화하는 과제를 수행한다. 워크숍 진행자는 OCR 도구와 메타데이터 스키마를 미리 정의하지만, 실제 데이터는 스캔 품질 저하, 언어 변형, 메타데이터 누락 등 다양한 오류를 포함한다. 참가자들은 파이썬 스크립트를 직접 수정하거나 새로운 정제 파이프라인을 설계함으로써, 규칙‑기반 절차를 넘어서는 ‘즉흥적 재구성’를 수행한다. 이 과정에서 발생한 오류와 ‘재시도(take)’는 새로운 학습 포인트가 되며, 참가자들은 이를 공동의 지식 자산으로 기록한다.
논의 부분에서는 이러한 사례들을 바탕으로 데이터 비전이 ‘규칙‑기반’이면서도 ‘규칙‑구속’에서 벗어나야 함을 강조한다. 교육 설계자는 학습자에게 알고리즘의 형식적 구조를 가르치는 동시에, 현장에서 발생하는 불확실성과 오류를 탐색하고 기록하도록 장려해야 한다. 또한, 오류를 숨기기보다 공개하고 공동으로 해결책을 모색하는 메타‑학습 활동이 중요하다고 제언한다. 이는 학습자에게 데이터와 알고리즘을 단순히 적용하는 기술을 넘어, 상황에 맞게 재구성하고 창의적으로 문제를 해결하는 ‘전문가 시각’을 함양하게 한다.
결론에서는 데이터 비전 개념이 CSCW·HCI 연구에 새로운 분석 틀을 제공한다는 점을 강조한다. 데이터 분석이 단순히 자동화된 절차가 아니라, 추상적 모델과 구체적 세계 사이의 긴장을 관리하는 사회문화적 실천임을 인식함으로써, 향후 연구는 인간‑기계 협업 설계, 교육 커리큘럼 개발, 그리고 데이터 윤리·투명성 논의에 이 개념을 적용할 수 있을 것이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기