생물학적 제약을 강화한 가상 세포 모델링: 강화학습 기반 CellFluxRL

본 논문은 고해상도 형광 현미경 이미지를 기반으로 세포의 약물 처리 후 형태 변화를 시뮬레이션하는 가상 세포 모델링 문제에 초점을 맞춘다. 기존의 이미지‑기반 생성 모델, 특히 흐름 매칭(flow‑matching) 기반 CellFlux는 픽셀‑레벨 손실을 최소화함으로써 시각적 유사성을 확보했지만, 핵이 세포질 밖에 위치하거나 비정상적인 세포 크기·형태를 보이는 등 물리·생물학적 타당성을 위배하는 사례가 빈번히 발생한다. 이러한 한계는 “시각적으로는 괜찮지만 실제 생물학적 현상을 반영하지 못한다”는 근본적인 문제에서 비롯된다. 이를 해결하기 위해 저자들은 사후 학습(post‑training) 단계에서 강화학습(RL)을 도입한다. 핵심 아이디어는 **생물학적으로 의미 있는 평가 함수(evaluator)** 를 보상 함수로 활용해, 모델이 고보상 샘플을 더 높은 확률로 생성하도록 확률 분포를 재조정하는 것이다. 이러한 평가 함수는 일반적으로 비분화 가능(non‑differentiable)하지만, 강화학습에서는 직접적인 그래디언트가 필요 없으므로 그대로 보상으로 사용할 수 있다. ### 1. 문제 정의 및 기본 모델 - 입력: 제어 상태 이미지 \(x_0 \in \mathbb{R}^{H \times W \times C}\)와 약물 교란 \(c\) (화합물 라벨). - 목표: 조건부 분포 \(p(x_1|x_0,c)\)에서 샘플링해, 약물 처리 후 세포 형태 \(x_1\)를 예측. - 데이터 특성: 고속 스크리닝으로 수집된 대규모 이미지 집합은 **배치 효과(batch effect)** 가 존재하고, 동일 세포에 대한 전·후 이미지가 존재하지 않아 **비쌍(pair‑less)** 형태이다. 따라서 모델은 **분포‑대‑분포 변환**을 학습해야 한다. CellFlux는 이러한 요구를 충족시키는 흐름 매칭 기반 모델로, 제어 이미지와 교란 이미지 사이를 연속적인 속도장 \(v_\theta(x_t,t,c)\)으로 연결한다. 학습 목표는 \

생물학적 제약을 강화한 가상 세포 모델링: 강화학습 기반 CellFluxRL

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기