편향된 전형 간단한 수학 모델
본 논문은 집단의 상대적 분산을 최소·최대화하는 점을 각각 “인포커스(in‑focus)”와 “아웃포커스(out‑focus)”라 정의한다. 인포커스는 전체 표본 대비 집단의 관성(분산)을 가장 크게 감소시키는 위치이며, 이는 전형적(스테레오타입) 특성을 과장하는 편향을 나타낸다. 반대로 아웃포커스는 상대적 분산을 최대화해 반대 방향으로 극단화된 반전형(anti‑stereotype) 위치가 된다. 두 점은 전체 중심과 집단 중심을 잇는 직선상에 존…
저자: Franc{c}ois Bavaud
본 논문은 “Stereotype bias: a simple formal model”이라는 제목 아래, 통계적 집단의 전형(스테레오타입) 현상을 수학적으로 모델링한다. 저자는 먼저 n명의 개체를 p차원 특징 벡터 \(x_i\) 로 표현하고, 두 개체 사이의 제곱 유클리드 거리 \(D_{ij}\) 를 정의한다. 각 개체는 가중치 \(f_i>0\) (합이 1) 로 표시되며, 전체 표본의 중심 \(\bar x_f=\sum_i f_i x_i\) 와 관성 \(\Delta_f=\frac12\sum_{i,j}f_i f_j D_{ij}\) 를 구한다. Huygens 원리에 따라 임의의 점 a에 대한 관성 \(\Delta_{af}\) 는 \(\Delta_f + D_{fa}\) 로 분해된다.
다음으로, 특정 집단 g (가중치 \(g_i\), 합이 1) 를 정의하고, 집단 중심 \(\bar x_g\) 와 관성 \(\Delta_g\) 를 구한다. 집단 g와 전체 f 사이의 거리 \(D_{fg}\) 가 양수라고 가정한다(즉, 두 중심이 겹치지 않음).
핵심 개념은 ‘상대적 분산’ \(\delta(a)=\frac{\Delta_{ag}}{\Delta_{af}} = \frac{\Delta_g + D_{ga}}{\Delta_f + D_{fa}}\) 로, 점 a를 기준으로 집단 g의 이질성을 전체 표본 대비 비율로 나타낸다. \(\delta(a)\) 는 a에 대해 연속적이며, 최소값과 최대값을 각각 갖는다.
정리 1은 \(\delta(a)\) 의 최소값을 주는 점을 ‘인포커스(in‑focus)’ \(a^{-}\), 최대값을 주는 점을 ‘아웃포커스(out‑focus)’ \(a^{+}\) 라 정의하고, 두 점이 \(\bar x_f\) 와 \(\bar x_g\) 를 잇는 직선 위에 존재함을 보인다. 구체적으로
\(a(\varepsilon)=\bar x_f + \varepsilon(\bar x_f-\bar x_g)\) 로 두고, \(\varepsilon_{\pm}\) 를
\(\varepsilon_{\pm}= \frac{b_{fg}\pm\sqrt{b_{fg}^2+4\Delta_f D_{fg}}}{2D_{fg}}\)
(여기서 \(b_{fg}= \Delta_f-\Delta_g-D_{fg}\)) 로 정의한다.
정리 2는 \(\varepsilon_{-}\le -1\) 그리고 \(\varepsilon_{+}\ge 0\) 임을 증명한다. 즉 인포커스는 집단 중심 쪽에, 아웃포커스는 전체 중심 쪽에 위치한다. 특히 \(\Delta_g=0\) (집단이 단일 원소)이면 \(\varepsilon_{-}=-1, \varepsilon_{+}=0\) 가 되어 인포커스와 아웃포커스가 각각 \(\bar x_g\) 와 \(\bar x_f\) 로 수렴한다. 이는 전형 편향이 ‘집단이 하나의 원소일 때 사라진다’는 직관과 일치한다.
편향 정도는 ‘극화 비율’ \((\varepsilon_{+}-\varepsilon_{-})^2 = \left(1+\frac{\Delta_f+\Delta_g}{D_{fg}}\right)^2 - 4\frac{\Delta_f\Delta_g}{D_{fg}^2}\) 로 정의되며, \(\Delta_f\) 와 \(\Delta_g\) 가 클수록 증가한다. 즉 전체와 집단의 변동성이 클수록 전형 편향이 강해진다.
다음으로 보완 집단 \(\bar g\) 를 정의한다. \(\bar g\) 는 \(\rho g + (1-\rho)\bar g = f\) 를 만족하는 분포이며, \(\rho\) 는 \(\rho_{\max}= \min_i (f_i/g_i)\) 이하의 값이다. 정리 3은 집단 g의 아웃포커스 \(a^{+}_g\) 가 보완 집단 \(\bar g\) 의 인포커스 \(a^{-}_{\bar g}\) 와 동일함을 증명한다. 이는 ‘반전형(anti‑stereotype)’이 실제로는 다른 집단의 전형과 같은 위치에 있음을 수학적으로 보여준다.
실증 부분에서는 1984년 미국 의회 의원 435명을 16개의 투표 변수(1/0) 로 표현하고, 공화당(R)과 민주당(D) 두 집단으로 나누었다. 결측값은 해당 집단 평균으로 대체하였다. 전체 중심과 각 집단 중심을 구한 뒤, MDS(다차원 척도법)로 2차원 좌표를 얻었다. 계산된 \(\Delta_f=3.67\), \(\Delta_g=1.89\), \(D_{fg}=1.98\) 로부터 극화 비율 \(|\varepsilon_{+}-\varepsilon_{-}|=2.72\) 를 얻었다. 그래프에서 인포커스는 각 집단 중심에서 외부 중심 방향으로 이동한 점이며, 공화당의 아웃포커스는 민주당의 인포커스와 일치함을 확인했다. 이는 정리 3의 구체적 사례이며, 정치적 스테레오타입 현상을 수학적으로 재현한다.
마지막으로 결정 이론적 해석을 제시한다. 점 a에 대해 개별 i를 집단 g에 할당할 확률을 \(P(g|i)=\exp(-\beta D_{ia})\) 로 두고, 전체 표본에 대한 할당 확률을 \(P(f|i)=1-P(g|i)\) 로 정의한다. β→0 한계에서 ‘오분류/정정률’ 비율이 \(\delta(a)\) 와 동일해진다. 따라서 인포커스는 오분류를 최소화하는 위치와 연결된다.
부가적으로, 상대적 분산 대신 선형 결합 \(\gamma(a)=A\Delta_{ag}-B\Delta_{af}\) 를 고려하면 파라미터에 따라 유일한 극값이 존재하지만, 그 위치는 \(\Delta_f,\Delta_g\) 에 의존하지 않는다. 또한, Salzarulo(2006)의 메타‑대조 비율을 확장한 프로토타입 함수 \(\Gamma(a)=(1-\lambda)\Delta_{ag}-\lambda\Delta_{\bar g a}\) 를 소개하며, 이는 군집 형성·소멸 시뮬레이션에 활용될 수 있음을 언급한다.
결론적으로, 이 논문은 집단의 상대적 분산 최소·최대화가 전형 편향과 반전형을 동시에 설명하는 단순하면서도 강력한 수학적 프레임워크를 제공한다. Euclidean 거리와 Huygens 원리를 기반으로 하여, 가중치가 있는 ‘퍼지’ 집단까지 일반화 가능하고, 비유클리드 거리나 강인성(robustness) 고려도 가능함을 제시한다. 사회심리학의 ‘외집단 동질성’·‘전형 과장’ 현상과의 연계는 이론적·실증적 의미를 동시에 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기