소프트웨어 공학과 인문학이 바라보는 공정성의 차이

본 논문은 소프트웨어 공학 분야에서 알고리즘 공정성을 정의·측정하는 형식·통계적 접근과, 인문·사회과학에서 공정성을 역사·구조적 불평등과 권력 관계에 기반한 맥락적 개념으로 바라보는 차이를 비교한다. 45편의 공학 리뷰와 25편의 인문학 연구를 2차 검토한 결과, 기술적 공정성은 측정 가능성에 초점을 맞추는 반면, 인문학적 공정성은 정의·참여·정당성을 강조한다는 점을 확인한다.

저자: Lucas Valenca, Ronnie de Souza Santos

본 논문은 디지털 기술이 의료, 공공 안전, 교육 등 사회 전반에 깊숙이 침투함에 따라 소프트웨어 공학과 인문·사회과학이 공정성을 어떻게 정의하고 다루는지를 비교·분석한다. 연구자는 두 차례의 2차 문헌 검토를 수행했으며, 첫 번째는 2017년 이후 발표된 45편의 소프트웨어 공학 분야 체계적 리뷰를 대상으로, 두 번째는 인문·사회과학 분야에서 알고리즘 공정성을 다룬 25편의 연구를 대상으로 했다. 서론에서는 현재 AI·ML 시스템이 의사결정에 미치는 사회적 영향을 강조하고, 소프트웨어 공학이 ‘공정성’을 비기능적 요구사항으로 채택하면서도 주로 통계적·수학적 메트릭에 의존하고 있음을 지적한다. 반면 인문·사회과학은 공정성을 문화·역사적 맥락에 따라 변동하는 가치로 보고, 정의·참여·정당성 등 다차원적 요소를 강조한다는 점을 제시한다. 배경 부분에서는 소프트웨어 공학에서 그룹, 개인, 인과적 공정성 등 다양한 형식적 정의가 등장하고, 이를 통해 편향을 탐지·완화하는 방법론이 발전했지만, 이러한 접근이 사회적·제도적 배경을 간과한다는 비판을 인용한다. 동시에 인문학적 연구는 ‘공정성 부채(fairness debt)’ 개념을 도입해 설계 단계에서 발생하는 윤리적 부채를 강조하고, 공정성을 조직 문화·법적 규제와 연결한다. 방법론에서는 두 리뷰가 각각 ‘시스템적 리뷰’와 ‘빠른 리뷰’라는 서로 다른 절차를 사용했음을 설명한다. 소프트웨어 공학 리뷰는 기존 체계적 리뷰를 메타 분석해 정의·측정·평가·제한점을 도출했으며, 인문학 리뷰는 검색어를 넓게 설정해 최신 이론·실증 연구를 포괄적으로 수집했다. 선정 기준과 제외 기준을 표 1에 정리하고, 최종 70편을 포함했다. 데이터 추출은 정의, 차원, 적용 사례, 방법론 등을 구조화된 표에 기록했으며, 정량적 통계와 질적 테마 분석을 병행했다. 결과 섹션에서는 소프트웨어 공학 연구가 ‘공정성 = 차별 없음·결과 분배 균등’이라는 정의에 머무르고, 주로 정확도·편향 메트릭, 알고리즘 테스트, 보정 기법을 제시한다는 점을 밝힌다. 반면 인문학 연구는 공정성을 ‘구조적 불평등·권력 관계·문화적 규범과 얽힌 사회적 가치’로 보고, 정량적 메트릭보다는 정책·법·사회적 대화에 초점을 맞춘다. 두 분야 모두 공정성 향상이 사회적 이익(신뢰, 포용, 정의)과 연결된다고 주장하지만, 접근 방식과 강조점이 다르다. 위협 요인으로는 데이터베이스 커버리지 편향, 연구자 주관적 코딩, 분야별 보고 형식 차이 등을 들며, 이를 완화하기 위해 다중 데이터베이스 검색, 이중 코딩, 회의적 검토를 수행했음을 언급한다. 논의에서는 기술적 공정성의 한계—즉, 메트릭이 사회적 맥락을 충분히 반영하지 못함—을 지적하고, 인문학적 통찰이 설계·배포 단계에 통합될 때 보다 포괄적이고 책임감 있는 AI 시스템이 구현될 수 있다고 주장한다. 구체적으로는 (1) 구조적 불평등을 진단하는 사회과학적 프레임워크를 공학 메트릭에 보완, (2) 정책·법적 요구사항을 설계 사양에 명시, (3) 다학제 팀 구성을 통한 지속적 윤리 검토를 제안한다. 결론에서는 인문·사회과학의 ‘맥락적·다차원적’ 공정성 개념이 소프트웨어 공학에 중요한 보완 역할을 할 수 있음을 강조한다. 향후 연구는 정량적 메트릭과 질적 평가를 통합한 혼합 방법론을 개발하고, 실제 산업 현장에서의 적용 사례를 통해 공정성 부채를 최소화하는 실천적 가이드를 제시해야 한다고 제언한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기