Title: Full and Fractional Counting in Bibliometric Networks
ArXiv ID: 1611.06943
발행일: 2016-11-29
저자: Loet Leydesdorff and Han Woo Park
📝 초록 (Abstract)
이 논문에서는 공동 저자 네트워크에서의 정규화된 합산 및 분수적 계산 방법을 제시하고, 이를 구현하는 데 사용되는 알고리즘과 모델을 설명합니다. 논문은 Eq. 1을 통해 분모를 정규화하며, 이는 공동 저자 수에 따라 수행됩니다. 또한, 자기 링크 보정을 위해 분모에서 *n* 대신 *(n - 1)*을 사용하는 방법도 제시합니다. 논문에서는 공동 저자 행렬의 예시와 이를 통해 얻어진 결과를 상세히 설명하며, 이론적 배경과 경험적 적용 사례를 통해 이러한 접근 방식의 유효성을 검증합니다.
💡 논문 핵심 해설 (Deep Analysis)
이 논문은 공동 저자 네트워크 분석에서 정규화된 합산 및 분수적 계산 방법을 제시하며, 이를 통해 공동 저자 관계를 보다 정확하게 측정하고 이해할 수 있는 새로운 접근 방식을 제공합니다. 논문의 주요 내용은 다음과 같습니다.
1. 정규화된 합산과 분수적 계산
논문에서는 Eq. 1을 통해 공동 저자 네트워크에서의 정규화된 합산 방법을 제시합니다. 이는 공동 저자의 수에 따라 수행되며, 자기 링크를 보정하기 위해 분모에서 n 대신 *(n - 1)*을 사용하는 방식이 포함됩니다. 이러한 접근은 공동 저자 관계의 정확성을 높이는 동시에 네트워크 내의 연결성과 중요도를 더욱 명확하게 표현할 수 있게 합니다.
2. 모델 및 경험적 예시
논문에서는 공동 저자 행렬을 통해 이론적인 배경을 설명하고, 이를 실제 데이터에 적용한 결과를 상세히 제시합니다. 특히 표 2와 표 3에서 보여지는 예시는 가정된 저자 행렬을 기반으로 하며, 각 저자의 합산 및 분수적 계산 값을 구체적으로 보여줍니다.
3. 분모의 정규화
논문에서는 분모를 정규화하는 방법에 대해 상세히 설명합니다. 이는 공동 저자 관계에서 자기 링크를 보정하고, 네트워크 내의 연결성을 더욱 정확하게 표현하기 위한 것입니다. Eq. 2와 Eq. 3을 통해 이러한 접근 방식이 공식화되며, 각각의 방법론은 분모를 다르게 설정하여 결과에 영향을 미칩니다.
4. SNA와 문헌 측정학의 차이
논문에서는 사회 네트워크 분석(SNA)과 문헌 측정학 간의 차이점을 강조합니다. 특히, 양방향 화살표와 비대칭 네트워크의 구분은 중복 값을 어떻게 보정할 것인지에 대한 중요한 질문을 제기하며, 이는 공현성 행렬에서 상단 삼각형과 하단 삼각형의 동등성을 통해 표현됩니다.
5. 다양한 집계 수준에서의 적용
논문에서는 분수적 계산 알고리즘이 저자, 기관, 국가 등 다양한 집계 수준에서 사용될 수 있음을 강조합니다. 이는 Eq. 1을 통해 제곱 수를 분모의 선형 함수로 나누어 구현되며, 비이진 경우 차원 불일치로 인해 의도하지 않은 효과가 발생할 수 있으므로 Eqs. 2 또는 3을 사용하여 이러한 잠재적 불균형을 보정합니다.
6. 실제 데이터 적용
논문에서는 웹 오브 사이언스에서 다운로드한 데이터에 대해 Eq. 1, 2 또는 3을 사용할 수 있는 루틴을 구현하고, 이를 통해 공동 저자 네트워크 분석의 정확성을 향상시킬 수 있음을 보여줍니다.
7. 학술적 의의
논문은 공동 저자 네트워크 분석에서 정규화된 합산 및 분수적 계산 방법을 제시함으로써, 이론적인 배경과 실제 적용 사례를 통해 이러한 접근 방식의 유효성을 검증합니다. 특히, 모듈러티가 감소하고 클러스터가 더 명확하게 구분되는 결과를 얻을 수 있음을 강조하며, 이를 통해 공동 저자 네트워크 분석의 정확성과 신뢰성이 향상될 것으로 기대됩니다.
이 논문은 공동 저자 네트워크 분석에서 새로운 접근 방식을 제시함으로써 학술적 연구에 중요한 이론적 및 실용적인 가치를 제공합니다. 그러나 경험적 검증을 위한 추가 연구가 필요하며, 이를 통해 더욱 정확하고 신뢰할 수 있는 결과를 얻을 수 있을 것으로 기대됩니다.
📄 논문 본문 발췌 (Excerpt)
## 정규화된 공동 저자 관계 분석: 방법론 및 구현
전체 합산에서 분수적 계산이 이루어질 때, 분모는 1로 설정됩니다. 그러나 본 논문에서는 Eq. 1을 통해 이러한 분모를 정규화합니다. 이 정규화는 논문의 수준(k)에 따라 수행되며, *nk*는 논문 k의 공동 저자 수를 나타내고, N은 집합 내 출판물의 총 수를 의미합니다. 분모에서 n 대신 *(n - 1)*를 사용하는 것은 자기 링크를 보정하기 위함입니다. 각 저자는 (n - 1)명의 공동 저자를 가집니다 (Newman, 2001, p. 016132-5).
저자들은 모델과 경험적 예시를 통해 이러한 논의를 구체화합니다. 본문에서는 공동 저자 행렬의 첫 번째 예시(표 2 및 3 참조)에 초점을 맞춥니다. 이 행렬은 가정한 저자 행렬을 기반으로 합니다:
R1
R2
R3
R4
총계
0.5
1.5
0.0
2.0
2.0
0.5
0.5
1.0
2.0
2.0
1.5
0.5
0.0
2.0
2.0
0.0
1.0
0.0
1.0
1.0
총계
7
7
문서 P1은 세 명의 저자가 공동 집필한 것으로, 각 저자는 분수적 신용 배분에서 1/3의 점수를 받습니다(표 4). 분산된 공동 저자 행렬에서 셀 값 {R1, R2}는 1/3 * 1/3 = 1/9 또는 0.11로 계산됩니다(표 5). Eq. 2는 이러한 접근 방식을 공식화합니다:
(2)
참고로, 저희 값은 PWvE의 값보다 작습니다. 이는 분모의 값 (n²)이 (n - 1)보다 크기 때문입니다. PWvE는 세 개의 문서에 대해 총 일곱 점을 부여하는 반면, 저희는 세 점을 부여합니다(반올림 후). 즉, 이 방법은 일관성을 지닙니다. 표 5는 또한 PWvE의 부록(p. 1194)에서 표 A1로 제공되지만, 대각선 값을 제외하여 이러한 일관성이 눈에 띄지 않도록 합니다.
두 방법 모두에서, 분자 (aijk)는 논문 k의 저자 i와 j에 대한 가정을 기반으로 합니다. 즉, i와 j 간의 관계는 한 화살표로 계산되며, j와 i 간의 역관계도 포함됩니다. SNA에서는 관계를 양방향으로 계산하지만, 문헌 측정학 관점에서는 공동 저자를 단일 엣지로 개념화합니다. PWvE의 자기 관계 보정 논리에 동의한다면, 오직 한 화살표만 수정됩니다.
분모는 *n * (n - 1)로 변경됩니다. 그 결과 행렬(여기서는 제시되지 않지만 표 6 참조)은 표 5보다 값이 약간 높으며, 합계가 3.35가 됩니다.
SNA에서 양방향 화살표와 문헌 측정학에서 비대칭 네트워크의 구분은 두 방향의 화살표 중복 값을 어떻게 보정할 것인지에 대한 질문을 제기합니다. 공현성 행렬에서는 이러한 중복이 상단 삼각형과 하단 삼각형의 동등성에 의해 표현됩니다. 이 삼각형은 n * (n - 1) / 2 셀을 포함하므로, 연구 질문에 따라 이 값을 분모로 사용하는 것을 권장합니다. 주의할 점은 이러한 곱하기 2가 행렬 구조에 영향을 미치지 않는다는 것입니다. 모든 셀에 동일하게 적용됩니다. 표 6은 결과 행렬을 보여주며, Eq. 3는 공식화합니다(Cerinšek & Batagelj, 2015, p. 987). 예상대로 값이 두 배로 커집니다.
분수적 계산 알고리즘은 저자, 기관, 국가 등 다양한 집계 수준에서 사용될 수 있습니다. 저자-문서 행렬은 저수준의 경우 이진이지만, 다른 집계 수준에서는 값을 가질 수 있습니다. 이러한 경우, Eq. 1을 사용하여 제곱 수를 분모의 선형 함수로 나눕니다. 이진 경우(예: 1² = 1, 0² = 0)에는 문제가 없지만, 비이진 경우 차원 불일치로 인해 의도하지 않은 효과가 발생할 수 있습니다. Eqs. 2 또는 3을 사용하여 이러한 잠재적 불균형을 보정합니다. 오직 Eq. 2만이 일관성을 유지하지만, 이 방정식은 자기 관계 포함이라는 개념적 단점을 가지고 있습니다.
저희는 웹 오브 사이언스에서 다운로드한 데이터에 대해 Eq. 1, 2 또는 3을 사용할 수 있는 루틴을 구현했습니다(http://www.leydesdorff.net/software/fractionate/index.htm)
. 기본적으로 Eq. 3를 사용합니다. 사용자에게는 집계 수준(저자, 기관 또는 국가)을 입력하라는 메시지가 표시됩니다. 결과 파일 mtrx.net에는 전체 합산된 공동 발생 행렬이 포함되어 있으며, fmtrx1.n은 분수적 계산 결과를 포함합니다.
…(본문이 길어 생략되었습니다. 전체 내용은 원문 PDF를 참고하세요.)…