주의력 침수: 중간 레이어에서 나타나는 새로운 주의력 패턴
읽는 시간: 2 분
...
📝 원문 정보
- Title: On the Existence and Behaviour of Secondary Attention Sinks
- ArXiv ID: 2512.22213
- 발행일: 2025-12-22
- 저자: Jeffrey T. H. Wong, Cheng Zhang, Louis Mahon, Wayne Luk, Anton Isopoussu, Yiren Zhao
📝 초록 (Abstract)
주의력 침수는 BOS 토큰과 같은 토큰으로, 그들은 제한된 의미적 관련성에도 불구하고 과도하게 많은 주의력을 받습니다. 이 연구에서는 기존 연구에서 다루어진 주요 침수와 근본적으로 다른 새로운 클래스의 주의력 침수를 식별합니다. 이러한 새로운 침수는 중간 레이어에서 주로 발생하며, 다양한 수의 레이어에 걸쳐 존재하고 상대적으로 작은 양의 주의력을 받습니다. 11개 모델 가족을 대상으로 실험을 통해 이러한 부차적 침수가 어디서 나타나는지, 그 특성은 무엇인지, 어떻게 형성되는지 그리고 주의력 메커니즘에 어떤 영향을 미치는지를 분석합니다.💡 논문 핵심 해설 (Deep Analysis)
이 논문은 기존 연구에서 다루어진 '주요 침수'와 구별되는 새로운 형태의 '부차적 침수'를 식별하고 그 특성과 형성 과정을 분석한다. 부차적 침수는 중간 레이어에서 주로 발생하며, 다양한 수의 레이어에 걸쳐 존재하고 상대적으로 작은 양의 주의력을 받는다. 이 연구에서는 11개 모델 가족을 대상으로 실험을 통해 이러한 부차적 침수의 형성 과정과 특성을 분석한다. 특히, 중간 레이어의 MLP 모듈에서 토큰 표현을 주요 침수 방향에 맞게 매핑하는 것을 발견하고, 이 벡터들의 2-노름이 부차적 침수의 점수와 지속 기간을 결정한다는 사실을 밝혀냈다. 또한, 모델 규모가 커질수록 이러한 침수의 위치와 지속 기간이 더 결정적이며 자주 나타난다는 것을 관찰했다.📄 논문 본문 발췌 (Excerpt)
Reference
이 글은 ArXiv의 공개 자료를 바탕으로 AI가 자동 번역 및 요약한 내용입니다.
저작권은 원저자에게 있으며, 인류 지식 발전에 기여한 연구자분들께 감사드립니다.