Title: Measuring Social Media Polarization Using Large Language Models and Heuristic Rules
ArXiv ID: 2601.00927
발행일: 2026-01-02
저자: Jawad Chowdhury, Rezaur Rashid, Gabriel Terejanu
📝 초록 (Abstract)
온라인 담론에서 감정적 양극화를 파악하는 것은 소셜미디어 상호작용이 사회에 미치는 영향을 평가하는 데 필수적이다. 본 연구는 대형 언어 모델(LLM)과 분야 지식 기반 휴리스틱을 결합한 새로운 프레임워크를 제시한다. LLM을 활용해 기후변화·총기 규제 등 논쟁적인 주제에 대한 토론에서 발언자의 입장, 감정적 어조, 합의 패턴을 자동 추출하고, 이를 바탕으로 입장 일치도·감정 내용·상호작용 역학을 고려한 규칙 기반 점수 체계를 적용한다. 이 점수 체계는 단일 발언 수준의 소규모 대화에서도 감정적 양극화를 정량화할 수 있다. 분석 결과는 양극화 양상이 사건에 따라 달라짐을 보여준다: (i) 대규모 공개 이벤트 전에는 기대감에 의해 양극화가 급증하는 ‘예측‑주도 양극화’, (ii) 급작스러운 고충격 사건 직후에 급격히 상승하는 ‘반응‑주도 양극화’가 존재한다.
💡 논문 핵심 해설 (Deep Analysis)
이 논문은 기존 감성 분석이나 사전 학습된 분류기 중심의 양극화 연구와 차별화되는 두 가지 핵심 요소를 제시한다. 첫째, 대형 언어 모델을 활용해 텍스트에서 ‘입장(stance)’, ‘감정적 어조(affective tone)’, ‘동의·반대 패턴(agreement dynamics)’을 다층적으로 추출한다는 점이다. 기존 방법은 주로 단일 차원의 감성 점수(긍정/부정) 혹은 사전 정의된 레이블(찬성/반대)만을 제공했지만, LLM은 문맥을 고려해 미묘한 입장 변화를 포착하고, 감정의 강도와 유형(분노, 슬픔, 혐오 등)까지 세분화한다. 이는 특히 논쟁적 이슈에서 ‘동의하지만 감정은 다르다’는 복합적인 현상을 정량화하는 데 유리하다.
둘째, 추출된 특성을 기반으로 한 규칙 기반 점수 체계는 ‘입장 정렬도’, ‘감정 강도·극성’, ‘상호작용 구조(예: 일방적 공격 vs. 상호 토론)’를 가중치로 결합한다. 특히 단일 발언 수준에서도 점수를 산출할 수 있도록 설계된 점수 함수는 데이터 양이 제한된 상황에서도 의미 있는 양극화 지표를 제공한다는 실용적 장점을 가진다.
방법론적 강점 외에도 연구는 ‘예측‑주도 양극화’와 ‘반응‑주도 양극화’라는 두 가지 시간적 양극화 패턴을 제시한다. 전자는 대규모 이벤트(예: 선거, 정책 발표) 전의 기대와 불안이 소셜미디어 상에서 극단적인 감정 대립을 촉발한다는 가설을 뒷받침한다. 후자는 자연재해, 총격 사건 등 급작스러운 충격이 발생했을 때 즉각적인 감정 폭발과 함께 양극화가 급등한다는 점을 보여준다. 이러한 구분은 정책 입안자와 플랫폼 운영자가 사전 예방적 조치와 사후 대응 전략을 차별화하는 데 활용될 수 있다.
하지만 몇 가지 한계도 존재한다. LLM 기반 추출은 모델의 사전 학습 데이터와 프롬프트 설계에 민감하며, 편향된 학습 데이터가 입장·감정 판단에 영향을 미칠 위험이 있다. 또한 규칙 기반 점수 체계는 가중치 설정이 주관적일 수 있어, 다른 도메인이나 문화권에 적용하려면 재조정이 필요하다. 마지막으로, 단일 인터랙션에 대한 양극화 점수는 통계적 신뢰도가 낮을 수 있으므로, 장기적인 트렌드와 결합해 해석해야 한다.
전반적으로 이 연구는 LLM과 도메인 휴리스틱을 결합한 혼합형 접근법을 통해 소셜미디어 양극화 분석의 정밀도와 적용 범위를 크게 확장하였다. 향후 연구에서는 다언어 모델 적용, 가중치 자동 최적화, 그리고 실제 정책·플랫폼 운영에의 연계 방안을 탐색함으로써 실용성을 더욱 강화할 수 있을 것이다.
📄 논문 본문 발췌 (Excerpt)
## 측정: 소셜 미디어 내 사회적 분열을 위한 대규모 언어 모델과 규칙이 결합된 접근 방식
최근 몇 년간 소셜 미디어 플랫폼의 부상은 정치적 담론을 변화시켰습니다. 실시간 정보 교환과 더 넓은 참여를 가능하게 함으로써 말이죠. 그러나 이러한 변화는 정치적인 이념적 분열을 심화시키는 알고리즘 콘텐츠 큐레이션과 같은 부정적인 측면도 함께 가져왔습니다. 알고리즘은 사용자의 기존 신념에 부합하는 콘텐츠를 우선시함으로써, 사용자는 자신의 관점에 일치하는 정보만 접하게 되고, 다양한 관점과의 노출이 제한됩니다. 이는 감정적 편향을 강화하고, 이념적 집단 내 긍정적인 감정을 증진시키지만, 반대 집단이나 다른 견해를 가진 사람들에 대해서는 적대감을 조장할 수 있습니다.
이러한 현상은 ‘감정적 분열’로 알려져 있으며, 정치적 극단주의, 협업 감소, 가짜 정보 확산과 같은 사회적 문제에 기여합니다. 따라서 소셜 미디어 내 감정적 분열의 역동성을 이해하는 것은 온라인 담론의 더 넓은 사회적 영향에 대한 평가에 필수적입니다.
기존의 감정 분석, 입장 탐지, 네트워크 기반 극단주의 지수 등 다양한 접근 방식이 감정적 분열을 측정하기 위해 사용되어 왔습니다. 그러나 이러한 방법들은 종종 복잡한 정치 담론을 포착하는 데 실패하거나, 특히 극단적인 논쟁에서 입장의 미묘함을 파악하는 데 어려움을 겪습니다.
본 연구는 기존 방법론에 대한 획기적인 접근 방식을 제시하며, 소셜 미디어 내 감정적 분열을 측정하기 위해 대규모 언어 모델(LLM)과 규칙이 결합된 새로운 프레임워크를 개발했습니다. 이전 연구인 Rashid 외 (2023)는 네트워크 기반 극단주의 지수를 활용하여 영향력 있는 사용자의 역할이 트위터에서 감정적 분열에 미치는 영향을 조사했습니다. 그러나 그들의 연구는 사전 정의된 감정 분류기 의존적이고, 세부적인 담론 역동성을 포착하는 데 한계가 있었습니다.
본 연구의 기여는 다음과 같습니다:
LLM 기반 프레임워크: 기존 방법론의 한계를 극복하기 위해 LLM을 사용하여 대량 토론에서 입장의 분류, 감정 콘텐츠 추출 및 동의 패턴을 자동으로 추출합니다.
규칙 기반 점수 시스템: 감성 분석에 대한 LLM의 이해를 보완하기 위해, 감정적 분열을 체계적으로 측정하기 위한 규칙이 적용됩니다. 이 시스템은 입장의 일치, 감정 강도, 의견 불일치 패턴을 평가하여 감정적 분열 지수를 계산합니다.
설명 가능한 접근 방식: 네트워크 기반 방법과 달리, 본 연구의 점수 시스템은 해석 가능하며, 심지어 매우 작은 대화에서도 극단주의 측정을 효과적으로 수행할 수 있습니다.
방법론
본 연구는 트위터에서 감정적 분열을 측정하기 위한 프레임워크를 제안합니다. 이 프레임워크는 다음과 같은 단계로 구성됩니다:
데이터 수집: 기후 변화와 총기 통제와 같은 사회적 논쟁 주제에 대한 트위터 대화 스레드를 수집합니다.
LLM 기반 주석: LLaMA 3.1 70B 오픈 소스 사전 학습 언어 모델을 사용하여 각 트윗의 입장을 분류하고, 감정 콘텐츠를 추출하며, 동의 수준을 파악합니다.
규칙 적용: LLM에서 추출한 정보에 기반하여, 감정적 분열 점수를 계산하기 위한 사전 정의된 규칙을 적용합니다.
집계 및 분석: 대화 수준의 감정적 분열 점수를 계산하고, 시간에 따른 변화 추이를 분석합니다.
데이터셋
본 연구는 두 가지 사회적 논쟁 주제 - 기후 변화와 총기 통제에 초점을 맞춘 대규모 데이터셋을 사용했습니다.
…(본문이 길어 생략되었습니다. 전체 내용은 원문 PDF를 참고하세요.)…