AI 마스크 제거는 생체인식에 부적합
본 연구는 상용 생성형 AI 도구(Gemini, ChatGPT, GrokAI)를 이용해 마스크를 제거한 얼굴 이미지가 실제 신원 확인에 얼마나 신뢰할 수 있는지를 대규모 실험으로 평가하였다. ArcFace 기반 유사도 점수를 통해 원본 얼굴과 재구성 얼굴 간의 생체학적 일치도를 측정했으며, 모든 모델이 동일 인물 간의 매칭 수준에 크게 못 미치고, 오히려 ‘도플갱어’ 수준에 근접함을 확인하였다. 성별·인종 차이와 모델 간 변동성도 존재했지만, …
저자: Emily A Cooper, Hany Farid
본 논문은 “AI‑Powered Facial Mask Removal Is Not Suitable For Biometric Identification”이라는 제목 아래, 최근 소셜 미디어에서 발생한 AI 기반 마스크 제거 이미지가 잘못된 신원 추정으로 이어진 사례들을 계기로, 상용 생성형 AI가 마스크를 제거한 후 생성된 얼굴이 실제 인물과 얼마나 일치하는지를 체계적으로 평가한다.
**연구 배경**
2025년 ‘Charlie Kirk’ 사건과 2026년 ‘ICE 에이전트’ 사건에서, 일반 사용자가 AI를 이용해 저해상도 혹은 마스크가 씌어진 사진을 ‘unmask’하고 이를 역 이미지 검색에 활용하면서 잘못된 인물 식별이 발생했다. 이러한 오용 위험성을 인식하고, 연구팀은 AI‑마스크 제거가 실제 생체인식에 활용될 수 있는지를 검증하고자 했다.
**데이터셋**
1. **Different‑ID**: 400명(남·여 각각 200명)·인종 4가지(흑인, 백인, 동아시아, 남아시아) 각각 100명, 고해상도 정면 사진.
2. **Same‑ID**: VGGFace2에서 추출한 100명의 동일 인물 두 장(조명·포즈 차이).
3. **US‑Senators**: 91명의 상원의원 사진, 마스크 착용 사진과 공식 무마스크 초상화 쌍.
4. **Doppelgangers**: 유명인 ‘도플갱어’ 63쌍(성·인종 일치).
**AI 마스크 제거 방법**
- **시뮬레이티드 마스크**: Different‑ID 얼굴의 하반부를 고정 좌표(y=550)에서 절단, 하반부를 완전 삭제.
- **실제 마스크**: US‑Senators의 코로나 마스크 사진.
세 모델을 사용: OpenAI ChatGPT‑image‑1.5, Google Gemini‑2.5‑flash‑image, X의 GrokAI. 각각 API 혹은 웹 인터페이스를 통해 “위 얼굴 상반부를 주면 전체 얼굴을 반환해 주세요” 혹은 “마스크 아래 얼굴을 현실적으로 복원해 주세요”라는 프롬프트를 전달했다.
**생체학적 유사도 측정**
ArcFace 임베딩(512‑D) 기반 코사인 유사도를 사용. 동일 인물(Same‑ID) 평균 0.71 ± 0.07, 다른 인물(Different‑ID) 평균 0.04 ± 0.08, 도플갱어 평균 0.15 ± 0.09를 기준점으로 설정했다.
**실험 결과**
- **하반부 제거**: Gemini 0.52 ± 0.10, GrokAI 0.51 ± 0.10, ChatGPT 0.34 ± 0.10. 모두 Same‑ID 수준보다 현저히 낮으며, 도플갱어보다 높은 정도(하지만 차이는 작음). Cohen’s D는 GrokAI –2.3, ChatGPT –4.1, Gemini –2.1.
- **실제 마스크 제거**: ChatGPT 0.41 ± 0.16, Gemini 0.38 ± 0.09. 하반부 제거보다 낮은 점수, 이는 포즈·조명·수염 차이와 마스크가 제공하는 하부 구조 정보가 제한적임을 의미한다.
- **성별·인종 효과**: 여성 얼굴에서 전반적으로 낮은 유사도(F = 14.2, p = 0.0002). 인종별 차이도 유의미(F = 10.3, p < 0.0001). ChatGPT는 남아시아 얼굴에서 높은 점수, Gemini는 동아시아 얼굴에서 낮은 점수를 보였다.
- **모델 변동성**: 동일 인물(US‑Senator) 100번 생성 시 ChatGPT 유사도 0.29~0.54, 평균 0.42 ± 0.05; Gemini 0.21~0.36, 평균 0.28 ± 0.04. 모델 간 상관계수 0.18.
**논의**
생성형 AI는 시각적으로 설득력 있는 이미지를 만들지만, 현재는 통계적 추론에 기반한 ‘추정’에 불과하다. 따라서 재구성된 얼굴은 실제 신체적 특성을 정확히 반영하지 못한다. 연구 결과는 AI‑마스크 제거가 법의학·보안·수사 분야에서 신원 확인에 사용되기에 부적합함을 명확히 보여준다. 향후 모델이 구조적 얼굴 정보를 정확히 복원할 수 있을 때까지는 이러한 활용을 금지하거나 엄격히 제한해야 한다는 정책적 제언을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기