슬로베니아 40년 연구 성과의 지프 법칙과 로그정규 분포 분석
** 슬로베니아 연구정보시스템(SICRIS)에서 86 443편의 논문과 8 359명의 연구자를 대상으로 한 분석 결과, 논문별 인용 횟수는 지프 법칙을 따르는 파워‑로우(α≈2.4∼3.1) 분포를 보이며, 연구자 수준의 g‑지수와 h‑지수는 로그정규(또는 특정 경우 지수) 분포에 적합한다. 두 지수는 통계적 특성이 동일하지만 개별 순위에서는 차이를 만든다. **
저자: ** Matjaž Perc (Department of Physics, Faculty of Natural Sciences, Mathematics
**
이 논문은 슬로베니아 전역의 학술 생산성을 40년에 걸쳐 체계적으로 분석한 연구이다. 슬로베니아 현재 연구정보시스템(SICRIS)에서 제공하는 86 443편의 논문 데이터와 8 359명의 연구자 프로필을 기반으로, 두 가지 수준의 인용 분포를 정량적으로 검증하였다.
첫 번째 분석 단계에서는 개별 논문의 인용 횟수 분포를 조사하였다. 논문별 인용 횟수 xₖ를 순위 k에 따라 정렬한 뒤, 로그‑로그 스케일의 Zipf 플롯을 작성하였다. 각 데이터셋(전국 전체, 류블랴나 대학교, 조제프 스테판 연구소, 의학 분야, 화학 분야)에 대해 기울기 γ를 최소제곱법과 Levenberg‑Marquardt 알고리즘으로 추정하였다. γ값은 0.47∼0.71 사이에 분포했으며, 이는 파워‑로우 확률밀도 \(P(x)\sim x^{-\alpha}\)의 지수 α=1+1/γ가 2.41∼3.13, 누적 분포 \(Q(x)\sim x^{-\beta}\)의 지수 β=1/γ가 1.41∼2.13임을 의미한다. 파워‑로우는 고인용 논문 구간에서만 뚜렷하게 나타났으며, 저인용 논문은 다른 메커니즘(예: 무작위적 인용, 분야별 인용 문화)으로 설명된다.
두 번째 단계에서는 연구자 수준의 성과 지표인 Egghe의 g‑지수와 Hirsch의 h‑지수를 분석하였다. 연구자들을 g‑지수와 h‑지수에 따라 순위 매긴 뒤, 동일한 Zipf 기법을 적용하였다. 결과는 로그‑로그 플롯에서 곡률이 나타나 파워‑로우가 부적합함을 보여주며, 반면 반로그(semilog) 플롯에서는 직선에 가까운 형태를 보였다. 이를 통해 두 지수의 확률밀도는 로그정규 분포
\(P(x)\sim \exp
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기