HL‑LHC를 위한 물리‑가이드 하이퍼그래프 트랜스포머와 Pileup 억제 게이트

본 논문은 HL‑LHC에서 200에 달하는 초고밀도 pile‑up 환경 속에서 신호 입자를 정밀히 복원하기 위해, 거리‑인식 그래프 어텐션과 전역 트랜스포머를 결합한 하이퍼그래프 트랜스포머(PhyGHT)와 물리적 제약을 갖는 Pileup Suppression Gate(PSG)를 제안한다. 공개된 top‑quark 쌍 생성 데이터셋을 이용해 에너지·질량 보정 계수를 예측하는 태스크에서 기존 ATLAS·CMS 베이스라인을 크게 능가함을 실증한다.

저자: Mohammed Rakib, Luke Vaughan, Shivang Patel

HL‑LHC를 위한 물리‑가이드 하이퍼그래프 트랜스포머와 Pileup 억제 게이트
본 논문은 HL‑LHC(High‑Luminosity Large Hadron Collider)에서 평균 200개의 pile‑up 충돌이 동시에 발생하는 극한 환경에서, 희귀 신호를 정확히 복원하기 위한 새로운 머신러닝 프레임워크인 Physics‑Guided HyperGraph Transformer(PhyGHT)를 제안한다. 기존의 pile‑up 완화 방법은 주로 젯 수준 혹은 트랙 수준에서 각각 전역·국부 정보를 독립적으로 처리했으며, 이는 물리적 구조를 충분히 반영하지 못한다는 한계가 있었다. PhyGHT는 이러한 한계를 극복하기 위해 (1) 거리‑인식 그래프 어텐션(Distance‑Aware Graph Attention, DA‑GAT)으로 로컬 기하학적 관계를 모델링하고, (2) 전역 트랜스포머 인코더로 이벤트 전체의 물리적 제약을 학습하며, (3) Pileup Suppression Gate(PSG)라는 물리‑제약 기반 마스크를 도입해 소프트하게 pile‑up 트랙을 억제한다. 데이터 구성은 top‑quark 쌍(t t̄) 생산을 시뮬레이션한 공개 데이터셋으로, MadGraph5_aMC@NLO와 Pythia 8을 사용해 ⟨μ⟩ = 60(현행 LHC)와 ⟨μ⟩ = 200(HL‑LHC) 두 가지 조건을 생성하였다. 트랙은 6차원 피처( p_T, η, φ, 전하 q, 전이 d₀, z₀)로, 젯은 4차원 피처( p_T, η, φ, 질량 m)로 표현한다. 각 트랙은 신호(하드‑스캐터)와 pile‑up을 구분하는 이진 라벨 y_label을 갖고, 젯별 에너지·질량 보정 계수 y_E, y_M을 진실 라벨로 제공한다. 모델 아키텍처는 네 단계로 구성된다. 첫 단계인 Local Geometric Block에서는 각 트랙을 고차원 임베딩으로 변환한 뒤, K‑nearest 이웃을 기반으로 거리‑가중 어텐션 α_ij를 계산한다. 여기서 α_ij는 특징 결합과 거리 제곱에 대한 가중치 w_d를 곱해 물리적 거리 감쇠를 구현한다. 두 번째 단계인 Global Context Block은 로컬 임베딩을 입력으로 완전 연결 트랜스포머 인코더를 적용해 전역적인 상관관계를 학습한다. 세 번째 단계인 PSG는 로컬·전역 특징을 결합해 per‑track 신호 확률 p_i를 예측하고, 이를 0~1 마스크로 곱해 하이퍼그래프 집계 전에 소프트하게 pile‑up을 억제한다. 마지막 단계인 Hypergraph Attention Block은 트랙과 젯을 이분 그래프(하이퍼엣지) 형태로 연결하고, 양방향 어텐션을 통해 트랙을 동적으로 가중합해 젯 표현을 업데이트한다. 최종적으로 각 젯에 대해 에너지·질량 보정 계수 ˆy_E, ˆy_M을 회귀한다. 학습 목표는 두 가지 손실을 결합한다. (1) 메인 회귀 손실은 보정 계수에 대한 MSE이며, (2) 보조 이진 분류 손실은 트랙 라벨 y_label에 대한 BCE이다. 두 손실을 가중합함으로써 PSG가 물리적으로 의미 있는 신호 확률을 학습하도록 유도한다. 실험에서는 PhyGHT를 ATLAS SoftKiller, CMS PUPPI, GraphSAGE, DeepSets, 그리고 Transformer‑only 베이스라인과 비교하였다. 주요 평가지표는 (a) 에너지·질량 보정 계수의 평균 절대 오차(MAE), (b) 재구성된 top‑quark 불변 질량의 RMS 차이, (c) 신호 트랙 식별 정확도이다. PhyGHT는 MAE에서 0.07~0.09(≈15 % 개선), 질량 재구성 RMS에서 1.2 GeV 이하(≈30 % 개선)를 달성했으며, 트랙 식별 정확도에서도 3 %~5 % 상승하였다. 또한, ablation study를 통해 PSG와 DA‑GAT 각각이 성능 향상에 기여함을 확인했으며, PSG 없이 모델을 학습하면 전역 트랜스포머만으로는 충분히 pile‑up을 억제하지 못함을 보였다. 한계점으로는 (i) 모델 규모가 크고 학습에 GPU 메모리가 많이 소모돼 실시간 트리거 적용에 제약이 있다, (ii) 시뮬레이션 기반 라벨에 의존하므로 실제 실험 데이터에서의 도메인 갭이 존재한다, (iii) 하이퍼파라미터 K와 트랜스포머 레이어 수가 데이터 특성에 민감해 일반화가 어려울 수 있다. 저자들은 향후 연구로 (1) 경량화된 하이퍼그래프 변형, (2) 도메인 적응 기법을 통한 실험 데이터 적용, (3) 다중 물리량(예: b‑tag, τ‑identification) 동시 학습을 제안한다. 결론적으로 PhyGHT는 물리적 토폴로지를 그래프·트랜스포머 구조에 명시적으로 인코딩하고, 해석 가능한 PSG를 통해 pile‑up 억제 과정을 투명하게 만든 최초의 통합 프레임워크이며, 공개 데이터셋과 코드 제공을 통해 HEP·ML 커뮤니티가 향후 HL‑LHC 분석 파이프라인에 바로 적용하고 확장할 수 있는 기반을 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기