스마트 계약 취약점 탐지를 위한 설명 가능한 다중모달 그래프 프레임워크 ORACAL

ORACAL은 제어 흐름 그래프(CFG), 데이터 흐름 그래프(DFG), 호출 그래프(CG)를 결합한 이종 멀티모달 그래프에 Retrieval‑Augmented Generation(RAG)과 대형 언어 모델(LLM) 기반 보안 컨텍스트를 선택적으로 주입하고, 인과주의 기반 어텐션으로 진짜 취약점 패턴을 추출한다. PGExplainer를 이용해 서브그래프 수준 설명을 제공하며, 주요 벤치마크에서 Macro F1 91.28%를 달성하고, 외부 데이…

저자: Tran Duong Minh Dai, Triet Huynh Minh Le, M. Ali Babar

스마트 계약 취약점 탐지를 위한 설명 가능한 다중모달 그래프 프레임워크 ORACAL
본 논문은 스마트 계약 취약점 탐지 분야에서 그래프 신경망(GNN)의 한계를 명확히 짚고, 이를 보완하기 위한 새로운 프레임워크 ORACAL을 제안한다. 기존 연구는 크게 정적 분석 도구(예: Slither, Mythril)와 동질 그래프 기반 딥러닝 모델, 그리고 이종 그래프 기반 모델로 구분된다. 정적 분석은 규칙 기반이라 새로운 취약점에 취약하고, 동질 그래프는 제어 흐름이나 데이터 흐름 중 하나만을 포착해 복합적인 논리를 놓친다. 이종 그래프 모델은 여러 관계를 동시에 다루지만, 여전히 구조적 정보에만 의존해 의미적 깊이가 부족하고, 구조 변조에 민감해 적대적 공격에 취약한 것이 문제점으로 지적된다. ORACAL은 이러한 문제를 해결하기 위해 네 단계 파이프라인을 설계한다. 첫 번째 단계에서는 Solidity 소스코드로부터 CFG, DFG, Call Graph를 추출하고, 이를 이종 계약 그래프(Heterogeneous Contract Graph)로 통합한다. 두 번째 단계에서는 그래프 내 각 노드의 중요도를 계산해 상위 k개의 노드를 포함하는 연결 서브그래프를 선택한다. 이때 선택된 서브그래프는 잠재적인 취약점이 집중된 실행 경로를 의미한다. 세 번째 단계에서는 선택된 서브그래프에 Retrieval‑Augmented Generation(RAG)과 대형 언어 모델(LLM, 예: GPT‑4, CodeBERT) 기반의 보안 지식을 주입한다. 구체적으로 ‘운영 컨텍스트’와 ‘보안 분석’이라는 두 종류의 메타 정보를 생성하고, 이를 노드 임베딩에 결합한다. 이 과정은 기존 그래프가 갖는 의미적 공백을 메우며, 전문가 수준의 보안 지식을 그래프 구조에 직접 녹여낸다. 네 번째 단계는 인과주의 기반 어텐션 메커니즘이다. 모델은 두 개의 병렬 브랜치를 통해 (1) RAG‑강화된 의미적 특징과 (2) 기존 구조적·텍스트 특징을 각각 학습한다. 이후 인과 어텐션 레이어가 두 브랜치의 정보를 가중합해, 진정한 취약점 원인에 해당하는 인과적 패턴을 강조한다. 이 설계는 ‘Clever Hans’ 현상을 방지하고, 구조적 변조가 발생해도 의미적 신호를 유지하도록 만든다. 설명 가능성을 위해 ORACAL은 PGExplainer를 적용한다. PGExplainer는 각 예측에 기여한 서브그래프를 추출하고, 이를 시각화해 감사자가 모델의 판단 근거를 검증할 수 있게 한다. 논문에서는 수동 라벨링된 취약점 트리거 경로와 비교해 평균 Intersection over Union(MIoU) 32.51%를 기록, 기존 설명 기법보다 현저히 높은 일치도를 보였다. 실험은 크게 네 가지 데이터셋을 사용했다. 주요 벤치마크인 SoliAudit(다양한 Solidity 계약)에서는 Macro F1 91.28%를 달성했으며, 이는 기존 최고 성능인 MANDO‑HGT(82.63%)보다 10% 이상 향상된 수치다. 외부 데이터셋인 CGT Weakness와 DAppScan에서도 각각 91.8%와 77.1%의 Macro F1를 기록, 실제 DeFi·NFT 환경에서도 강인한 일반화 능력을 입증했다. 적대적 공격 실험에서는 그래프 구조를 교란하는 변조(노드 삽입·삭제·속성 변경)를 가했을 때, ORACAL의 F1 감소는 2.35%에 머물렀으며, Attack Success Rate(ASR)은 3%에 불과했다. 이는 기존 이종 그래프 모델인 SCVHunter(ASR 18.73%)와 MANDO‑HGT(ASR 12.41%)에 비해 현저히 낮은 수치다. 결론적으로 ORACAL은 (1) 이종 멀티모달 그래프를 통한 구조적 풍부함, (2) RAG와 LLM을 활용한 동적 보안 지식 주입, (3) 인과주의 어텐션을 통한 스팸 특징 억제, (4) PGExplainer 기반 서브그래프 설명이라는 네 가지 핵심 요소를 결합해, 스마트 계약 취약점 탐지에서 정확도·설명성·견고성을 동시에 달성한 최초의 프레임워크로 자리매김한다. 향후 연구에서는 더 큰 규모의 LLM과 자동화된 지식베이스 구축, 그리고 실시간 온체인 모니터링과의 연계가 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기