학술지 임팩트 팩터 분포를 위한 새로운 통계 모델링

본 논문은 기존의 두 지수 법칙이 임팩트 팩터 분포를 설명하는 데 한계가 있음을 지적하고, 경제학에서 널리 사용되는 Dagum와 Singh‑Maddala 분포를 적용한다. 최대우도 추정과 부트스트랩 기반 Kolmogorov‑Smirnov 검정을 통해 8개 학문 분야의 데이터를 분석한 결과, 두 새로운 모델이 동일하거나 더 나은 적합도를 보이며, 폐쇄형 확률밀도와 누적분포함수를 제공해 불평등 지표 계산을 용이하게 한다는 장점을 확인하였다.

저자: Michal Brzezinski

학술지 임팩트 팩터 분포를 위한 새로운 통계 모델링
본 논문은 학술지 임팩트 팩터의 분포를 정량적으로 모델링하는 새로운 접근법을 제시한다. 기존 연구에서는 Mansilla 등(2007)이 제안한 두 지수 법칙(two‑exponent law)을 이용해 임팩트 팩터의 rank‑frequency 관계를 설명했으며, Sarabia 등(2012)도 이를 실증적으로 검증하였다. 그러나 두 지수 법칙은 파라미터 a와 b만으로 꼬리 형태를 조절할 수 있지만, 폐쇄형 확률밀도함수(pdf)와 누적분포함수(cdf)가 존재하지 않아 수치적 역함수 계산에 의존해야 하는 실용적 한계가 있다. 또한, 불평등 지표(Lorenz curve, Gini index 등)의 해석에 필요한 수식이 제한적이다. 이에 저자는 경제학에서 소득 분포를 모델링할 때 널리 사용되는 Singh‑Maddala와 Dagum 두 3‑parameter 분포를 도입한다. 두 모델은 Burr 계열의 특수 형태로, 파라미터 a, b, q(또는 p)를 통해 상위·하위 꼬리를 독립적으로 조절한다. 특히 Singh‑Maddala는 상위 꼬리를 a와 q가, 하위 꼬리를 a만이 지배하고, Dagum은 그 반대로 하위 꼬리를 b와 p가, 상위 꼬리를 a가 지배한다. 이러한 구조적 차이는 두 모델을 상호 보완적으로 활용할 수 있게 한다. 또한, 두 모델 모두 pdf와 cdf가 명시적 식으로 제공되어 최대우도 추정(ML)과 불평등 지표 계산이 용이하다. 데이터는 2012년 Thomson Reuters Journal Citation Reports(JCR)에서 추출한 8개 과학 분야(화학, 경제학, 교육학, 정보과학·도서관학, 수학, 신경과학, 심리학, 물리학)의 임팩트 팩터이다. 각 분야별 저널 수는 84에서 573까지 다양하며, 5 이하의 임팩트 팩터를 가진 저널은 제외하였다. 기술통계는 평균, 중앙값, 표준편차, Gini 계수를 포함한다. 분석 절차는 다음과 같다. 첫째, 두 지수 법칙, Singh‑Maddala, Dagum 모델을 각각 최대우도 추정으로 파라미터를 추정한다. 두 지수 법칙의 로그우도는 양자화 함수(2)를 수치적으로 역전시켜 계산하고, Singh‑Maddala와 Dagum의 로그우도는 기존 문헌(Kleiber & Kotz, 2003)에서 제공되는 식을 사용한다. 둘째, 부트스트랩 기반 Kolmogorov‑Smirnov(KS) 검정을 통해 각 모델의 적합도를 평가한다. KS 통계량은 실제 데이터와 추정된 모델의 cdf 차이의 최대값이며, 파라미터 추정 후 시뮬레이션을 통해 p‑값을 산출한다. p‑값이 0.1보다 크면 모델이 데이터에 적합하다고 판단한다. 셋째, 비중첩 모델 간 비교를 위해 Vuong의 정규화 로그우도비(NLR)를 사용한다. NLR이 표준 정규분포를 따르므로, 양측 검정으로 두 모델 중 어느 것이 더 우수한지 판단한다. 두 지수 법칙에 대한 결과는 다음과 같다. 화학, 경제학, 수학, 심리학에서 KS p‑값이 0.1 이상으로 모델이 통계적으로 타당함을 보였으며, 라발레트 법칙(a = b)에 대한 Wald 검정에서는 화학(0.048), 수학(0.063), 물리학(0.075)에서 5% 유의수준 이하로 기각되지 않았다. 그러나 다른 분야에서는 a ≠ b가 강하게 기각되었다. Singh‑Maddala와 Dagum 모델의 적합도는 전반적으로 두 지수 법칙과 동등하거나 더 우수했다. KS 검정에서 화학과 경제학은 두 모델 모두 p‑값이 0.1 이상으로 적합성을 인정받았다. 로그우도 값은 두 모델이 대부분의 분야에서 두 지수 법칙보다 높았으며, Vuong 테스트에서도 유의하게 더 나은 모델로 평가되었다. 특히 Dagum 모델은 하위 꼬리(낮은 임팩트 팩터) 설명에 강점을 보여, 저인용 저널이 많은 분야에서 더 높은 적합도를 보였다. Singh‑Maddala 모델은 상위 꼬리(고인용 저널)에서 더 정확한 적합을 제공하였다. 이러한 결과는 몇 가지 중요한 시사점을 제공한다. 첫째, 임팩트 팩터 분포를 설명하는 데 있어 두 지수 법칙보다 더 일반적이고 해석 가능한 모델이 존재한다는 점이다. 둘째, 폐쇄형 pdf와 cdf를 갖는 모델을 사용하면 불평등 지표(예: Lorenz curve, Gini index)의 정확한 계산이 가능해, 학술지 영향력의 불평등 구조를 정량적으로 분석할 수 있다. 셋째, 경제학에서 소득 분포를 모델링하던 기존 통계 모델을 학술지 평가 메트릭에 직접 적용함으로써 분야 간 비교와 정책적 활용이 용이해진다. 결론적으로, 본 연구는 임팩트 팩터의 통계적 특성을 보다 정교하게 포착할 수 있는 Dagum와 Singh‑Maddala 분포를 제안하고, 최대우도 추정 및 부트스트랩 기반 적합도 검정을 통해 실증적으로 그 우수성을 입증하였다. 향후 연구에서는 4‑parameter GB2 모델이나 다른 확장형 분포를 고려해 추가적인 적합도 향상을 모색하거나, 시간에 따른 임팩트 팩터 변화 동역학을 모델링하는 데 이들 분포를 적용할 수 있을 것이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기