과학 자동 목표 진화 에이전트 SAGA

읽는 시간: 5 분
...

📝 원문 정보

  • Title: Accelerating Scientific Discovery with Autonomous Goal-evolving Agents
  • ArXiv ID: 2512.21782
  • 발행일: 2025-12-25
  • 저자: Yuanqi Du, Botao Yu, Tianyu Liu, Tony Shen, Junwu Chen, Jan G. Rittig, Kunyang Sun, Yikun Zhang, Zhangde Song, Bo Zhou, Cassandra Masschelein, Yingze Wang, Haorui Wang, Haojun Jia, Chao Zhang, Hongyu Zhao, Martin Ester, Teresa Head-Gordon, Carla P. Gomes, Huan Sun, Chenru Duan, Philippe Schwaller, Wengong Jin

📝 초록 (Abstract)

과학적 발견을 확장하는 에이전트에 대한 관심이 전례 없이 높아지고 있지만, 대부분은 과학자가 정의한 정량적 목표 함수에만 의존한다. 그러나 대규모 과학적 과제에서는 이러한 목표가 불완전한 대리 변수에 불과하다. 우리는 목표 함수 설계 자동화가 과학적 발견 에이전트에 필수적이지만 아직 충족되지 않은 요구라고 주장한다. 이를 해결하기 위해 우리는 Scientific Autonomous Goal‑evolving Agent (SAGA)를 제안한다. SAGA는 외부 루프에서 대형 언어 모델(LLM) 에이전트가 최적화 결과를 분석하고 새로운 목표를 제안·컴퓨팅 가능한 점수 함수로 변환하는 반면, 내부 루프에서는 현재 목표 하에 솔루션 최적화를 수행한다. 이 이중 구조는 목표 공간과 그 트레이드오프를 체계적으로 탐색하게 하며, 목표를 고정된 입력으로 취급하지 않는다. 우리는 항생제 설계, 무기 재료 설계, 기능성 DNA 서열 설계, 화학 공정 설계 등 다양한 분야에 적용해 자동 목표 설계가 과학적 발견 에이전트의 효율성을 크게 향상시킴을 입증한다. 예를 들어, 기능성 DNA 설계에서는 HepG2 세포주에 특이적인 강화자를 제시해 기존 최고 성능 대비 약 50 % 개선을 달성했으며, 화학 공정 설계에서는 처음부터 흐름도를 자동으로 설계하는 데 성공했다. 이러한 결과는 SAGA가 여러 학문 분야에 폭넓게 적용 가능함을 보여주며, 적응형 목표 함수 설계가 과학적 발견 에이전트에 제공하는 가치를 강조한다.

💡 논문 핵심 해설 (Deep Analysis)

Figure 1
SAGA는 기존 과학 자동화 프레임워크가 직면한 근본적인 한계를 뛰어넘는다. 전통적인 접근법은 사전에 정의된 목표 함수를 고정하고, 그 함수에 맞춰 후보 물질이나 설계안을 탐색한다. 그러나 복잡한 과학 문제에서는 목표 자체가 불완전하거나 상충되는 경우가 많아, 고정된 목표에 최적화된 솔루션이 실제로는 비현실적이거나 활용도가 낮을 수 있다. SAGA는 이러한 문제를 ‘목표 자체를 진화시키는’ 메커니즘으로 해결한다.

첫 번째 핵심은 이중 루프 구조이다. 외부 루프는 LLM 기반 에이전트가 현재 최적화 결과를 메타‑분석하고, 발견된 부족점이나 새로운 과학적 통찰을 바탕으로 목표 함수를 재구성한다. 여기서 LLM은 방대한 문헌 지식과 실험 데이터를 활용해 “왜 현재 목표가 부족한가?”를 스스로 질문하고, 이를 정량화 가능한 점수 함수로 변환한다. 두 번째 내부 루프는 기존의 분자 생성 모델, 재료 탐색 알고리즘, DNA 설계 툴 등과 결합해 현재 정의된 목표를 최대화한다. 이렇게 목표와 솔루션이 교차적으로 진화함으로써, 탐색 공간은 단순히 후보 물질의 다양성에 국한되지 않고 목표 공간 자체의 다양성까지 포괄한다.

두 번째로 주목할 점은 해석 가능성과 인간‑AI 협업이다. SAGA가 생성한 보조 목표는 과학자에게 새로운 제약 조건이나 설계 원칙을 제시한다. 예를 들어 항생제 설계에서 ‘Gram‑negative 특이성’이라는 숨은 제약을 자동으로 발견하고, 이를 QED·SA·독성 등 기존 점수와 결합한다. 이는 인간 전문가가 사후 검증하고, 필요 시 목표를 조정하는 피드백 루프를 가능하게 한다.

세 번째는 다양한 도메인 적용 가능성이다. 논문에서는 항생제, 무기 재료, 기능성 DNA, 화학 공정 네 가지 사례를 제시했는데, 각각 목표가 전혀 다른 차원을 가진다(생물학적 활성, 합성 가능성, 세포 특이성, 공정 효율 등). SAGA는 동일한 프레임워크 안에서 이러한 이질적인 목표를 동시에 다룰 수 있다는 점에서 범용 AI‑driven 과학 플랫폼으로서의 잠재력을 보여준다.

마지막으로 제한점과 향후 과제도 존재한다. 현재 LLM이 목표를 생성하는 과정은 프롬프트 설계와 모델 파라미터에 크게 의존한다. 목표가 과도하게 복잡해지면 내부 최적화가 수렴하지 않을 위험이 있다. 또한, 자동 생성된 목표의 신뢰성을 검증하기 위한 실험적 피드백 루프가 충분히 구축되지 않으면, ‘목표의 목표’가 되지 않을 수도 있다. 따라서 실험 데이터와의 지속적인 통합, 목표 평가 메트릭의 표준화, 그리고 인간 전문가와의 인터페이스 설계가 향후 연구의 핵심 과제로 남는다.

요약하면, SAGA는 목표 설계 자동화를 통해 과학적 탐색의 ‘목표‑솔루션’ 순환을 닫음으로써, 기존 최적화 기반 접근법이 놓치던 창의적·전략적 차원을 보완한다. 이는 궁극적으로 과학적 발견 속도를 가속화하고, 복잡한 다목표 문제에 대한 새로운 해결책을 제시한다.

📄 논문 본문 발췌 (Excerpt)

과학적 발견의 경계를 확장하는 에이전트에 대한 관심이 전례 없이 높아지고 있다. 그러나 이러한 에이전트는 주로 과학자가 지정한 정량적 목표 함수를 최적화한다. 대규모 과학적 도전 과제에서는 이러한 목표가 불완전한 대리 변수에 불과하다. 우리는 목표 함수 설계 자동화가 과학적 발견 에이전트에 필수적이지만 아직 충족되지 않은 요구라고 주장한다. 이를 해결하기 위해 우리는 Scientific Autonomous Goal‑evolving Agent (SAGA)를 도입한다. SAGA는 외부 루프에서 LLM 에이전트가 최적화 결과를 분석하고 새로운 목표를 제안하며 이를 계산 가능한 점수 함수로 변환하고, 내부 루프에서 현재 목표 하에 솔루션 최적화를 수행하는 이중 구조를 갖는다. 이 이중 설계는 목표와 그 트레이드오프 공간을 체계적으로 탐색하게 하며, 목표를 고정된 입력으로 취급하지 않는다. 우리는 항생제 설계, 무기 재료 설계, 기능성 DNA 서열 설계, 화학 공정 설계 등 다양한 분야에 프레임워크를 적용하여 자동 목표 공식화가 과학적 발견 에이전트의 효과성을 크게 향상시킬 수 있음을 보여준다. 기능성 DNA 서열 설계에서는 HepG2 세포주에 특이적인 강화자를 제시해 기존 최고 기준 대비 거의 50 % 개선을 달성했으며, 화학 공정 설계에서는 처음부터 흐름도를 자동으로 설계하는 데 성공했다. 요약하면, 이러한 결과는 SAGA가 여러 학문 분야에 폭넓게 적용 가능함을 강조하고, 과학적 발견 에이전트에서 적응형 목표 함수 설계의 가치를 부각한다.

결과

SAGA를 이용한 항생제 설계
항생제 내성(AMR)은 흔한 그람음성 감염을 치료할 수 있는 능력을 급격히 감소시키고 있다. 그 중 하나가 세계보건기구(WHO)에서 중요한 우선순위 병원체로 지정한 Klebsiella pneumoniae(K. pneumoniae)이다. 그러나 그람음성 박테리아에 대한 새로운 억제제를 설계하는 것은 매우 어려운 과제이며, 최적화 에이전트가 목표를 해킹하는 비현실적인 화합물을 생성하기 쉽다. 이를 해결하기 위해 우리는 SAGA를 사용해 새로운 K. pneumoniae 억제제를 설계한다. 초기에는 효능을 최대화하고 독성을 최소화하는 기본 생물학적 목표와 기존 스캐폴드를 회피하는 제약만을 설정한다. 이 기반 위에서 SAGA는 보조 목표들을 동적으로 구성해 생성 과정을 화학적으로 합리적인 공간으로 유도한다. 이 전략은 SAGA가 그람음성 환경의 구체적 제약을 해석 가능하고 반복적인 방식으로 학습하게 한다. 최종적으로 SAGA는 외부 평가에서 엄격한 기준을 만족하고 과학자의 직관과 일치하는 더 많은 유효 후보를 생산한다.

SAGA가 계산적으로 선택적이며 화학적으로 합리적인 후보를 발견
우리는 동일한 프롬프트와 기본 생물학적 목표로 세 가지 자동화 수준에서 SAGA를 실행하였다. SAGA는 최적화가 완료될 때까지 다양한 자동화 수준에서 반복한다. 제안된 후보의 품질을 평가하기 위해 우리는 세 가지 생물학적 평가(항생제 활성 점수인 KP Activity, Novelty 점수, 독성 점수의 1‑minus인 Safety)와 두 가지 화학적 평가(Quantitative Estimate of Drug‑likeness(QED) 점수인 Drug likeness와 Synthetic Accessibility(SA) 점수인 Synthesizability)를 선택하였다. 이러한 점수는 섹션 S2.2에서 자세히 설명한다.

Drug likeness
새로운 항생제 약물을 생성하라: K. pneumoniae를 표적으로 하는 새로운 항생제 약물을 생성하라.

📸 추가 이미지 갤러리

candidate_analysis_plots.png

Reference

이 글은 ArXiv의 공개 자료를 바탕으로 AI가 자동 번역 및 요약한 내용입니다. 저작권은 원저자에게 있으며, 인류 지식 발전에 기여한 연구자분들께 감사드립니다.

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키