생물학적 제약을 강화한 가상 세포 모델링: 강화학습 기반 CellFluxRL

CellFluxRL은 기존 흐름 매칭 기반 가상 세포 모델 CellFlux에 강화학습(RL)을 적용해 생물학적·구조적 제약을 보상 함수로 사용함으로써, 시각적으로는 물론 물리·생물학적으로도 타당한 세포 이미지를 생성한다. 7개의 보상 함수를 가중합해 최적화하고, 테스트 시 다중 샘플 중 최고 보상을 선택하는 스케일링 기법을 도입해 성능을 추가로 향상시킨다.

저자: Dongxia Wu, Shiye Su, Yuhui Zhang

생물학적 제약을 강화한 가상 세포 모델링: 강화학습 기반 CellFluxRL
본 논문은 고해상도 형광 현미경 이미지를 기반으로 세포의 약물 처리 후 형태 변화를 시뮬레이션하는 가상 세포 모델링 문제에 초점을 맞춘다. 기존의 이미지‑기반 생성 모델, 특히 흐름 매칭(flow‑matching) 기반 CellFlux는 픽셀‑레벨 손실을 최소화함으로써 시각적 유사성을 확보했지만, 핵이 세포질 밖에 위치하거나 비정상적인 세포 크기·형태를 보이는 등 물리·생물학적 타당성을 위배하는 사례가 빈번히 발생한다. 이러한 한계는 “시각적으로는 괜찮지만 실제 생물학적 현상을 반영하지 못한다”는 근본적인 문제에서 비롯된다. 이를 해결하기 위해 저자들은 사후 학습(post‑training) 단계에서 강화학습(RL)을 도입한다. 핵심 아이디어는 **생물학적으로 의미 있는 평가 함수(evaluator)** 를 보상 함수로 활용해, 모델이 고보상 샘플을 더 높은 확률로 생성하도록 확률 분포를 재조정하는 것이다. 이러한 평가 함수는 일반적으로 비분화 가능(non‑differentiable)하지만, 강화학습에서는 직접적인 그래디언트가 필요 없으므로 그대로 보상으로 사용할 수 있다. ### 1. 문제 정의 및 기본 모델 - 입력: 제어 상태 이미지 \(x_0 \in \mathbb{R}^{H \times W \times C}\)와 약물 교란 \(c\) (화합물 라벨). - 목표: 조건부 분포 \(p(x_1|x_0,c)\)에서 샘플링해, 약물 처리 후 세포 형태 \(x_1\)를 예측. - 데이터 특성: 고속 스크리닝으로 수집된 대규모 이미지 집합은 **배치 효과(batch effect)** 가 존재하고, 동일 세포에 대한 전·후 이미지가 존재하지 않아 **비쌍(pair‑less)** 형태이다. 따라서 모델은 **분포‑대‑분포 변환**을 학습해야 한다. CellFlux는 이러한 요구를 충족시키는 흐름 매칭 기반 모델로, 제어 이미지와 교란 이미지 사이를 연속적인 속도장 \(v_\theta(x_t,t,c)\)으로 연결한다. 학습 목표는 \

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기