해석 가능한 바이오제조 공정 위험·민감도 분석과 품질 설계

본 논문은 바이오제조 공정의 복잡성과 데이터 부족 문제를 해결하기 위해, CPP(핵심 공정 변수)와 CQA(핵심 품질 속성) 간 인과관계를 베이지안 네트워크 형태의 확률적 지식 그래프로 모델링한다. 이후 게임 이론의 샤플리 값(Shapley value)을 이용해 각 입력 요인이 생산성·품질 변동에 기여하는 정도를 정량화하고, 모델 파라미터 추정의 불확실성을 베이지안 사후분포로 표현하여 모델 위험을 함께 평가한다. 제안 방법은 병목 요인 식별, …

저자: Wei Xie, Bo Wang, Cheng Li

해석 가능한 바이오제조 공정 위험·민감도 분석과 품질 설계
본 논문은 바이오제조 공정이 직면한 ‘복잡성·고변동성·긴 리드 타임·데이터 부족’이라는 네 가지 핵심 문제를 해결하기 위한 통합 프레임워크를 제안한다. 먼저, 저자는 CPP(핵심 공정 변수)와 CQA(핵심 품질 속성) 사이의 인과관계를 도메인 전문가 지식과 제한된 실험 데이터를 결합해 베이지안 네트워크(BN) 형태의 확률적 지식 그래프(Knowledge Graph)로 모델링한다. 이 그래프는 각 노드가 확률 변수이며, 조건부 확률표(CPT)를 통해 변수 간 의존성을 정량화한다. BN은 공정 전반에 걸친 불확실성을 자연스럽게 포함하고, 새로운 데이터가 추가될 때 베이지안 업데이트를 통해 쉽게 갱신될 수 있다. 다음 단계에서는 게임 이론에서 유래한 샤플리 값(Shapley Value, SV)을 이용해 전역 민감도 분석을 수행한다. 샤플리 값은 모든 변수 조합에 대한 평균 기여도를 계산함으로써, 변수 간 상호작용을 완전하게 반영한다. 기존의 Sobol 지수와 달리, SV는 입력 변수들의 순서에 무관하게 공정 출력(생산성 Y 및 품질 지표)의 분산 감소에 대한 기여도를 정확히 측정한다. 논문에서는 Monte‑Carlo 시뮬레이션과 베이지안 추정치를 결합한 효율적인 알고리즘을 제시해, 대규모 변수 집합에서도 실용적인 계산 시간을 확보한다. 또한, 모델 파라미터 θ(베이지안 네트워크의 CPT 파라미터)의 추정 불확실성을 베이지안 사후분포 p(θ|데이터)로 표현하고, 이를 샤플리 값 계산에 통합한다. 이를 ‘모델 위험(Model Risk)’이라고 정의하고, 각 파라미터 집합이 민감도 결과에 미치는 영향을 정량화한다. 결과적으로, 어느 파라미터가 추정 오차에 가장 민감한지 파악함으로써, 추가 실험이나 데이터 수집이 가장 큰 정보 이득을 제공할 수 있는 ‘정보 가치가 높은’ 변수와 실험 설계를 제시한다. 실험 부분에서는 두 가지 시나리오를 다룬다. 첫 번째는 인공적으로 생성한 시뮬레이션 데이터로, 복잡한 인과 구조와 다양한 상호작용을 포함시켜 제안 방법의 정확성을 검증한다. 두 번째는 실제 세포·유전자 치료제 생산 공정에서 수집된 제한된 관측 데이터를 이용한다. 두 경우 모두, 기존의 PLS, ANN, PCA 기반 민감도 분석과 비교했을 때, BN‑SV 프레임워크는 (1) 변수 중요도 순위가 실제 공정 변동과 높은 상관성을 보이며, (2) 모델 불확실성을 반영한 결과가 공정 변동을 더 잘 설명한다는 점에서 우수함을 입증한다. 특히, 원료 배합 비율, 배양 pH, 산소 공급량 등이 생산성 감소와 품질 저하에 가장 큰 기여를 하는 것으로 밝혀졌으며, 해당 변수에 대한 정밀 제어와 추가 데이터 수집이 공정 안정성을 크게 향상시킬 수 있음을 확인한다. 논문의 주요 기여는 다음과 같다. 첫째, 인과관계를 명시적으로 포함한 베이지안 네트워크 기반 확률적 지식 그래프를 구축함으로써, 제한된 데이터 환경에서도 해석 가능한 모델을 제공한다. 둘째, 샤플리 값 기반 전역 민감도 분석을 도입해 변수 간 복합 상호작용을 정량화하고, 공정 위험을 정확히 평가한다. 셋째, 베이지안 사후분포를 활용해 모델 파라미터 추정 불확실성을 민감도 분석에 통합함으로써, 모델 위험을 동시에 관리한다. 마지막으로, 이러한 통합 프레임워크를 통해 QbD(Quality‑by‑Design) 원칙에 부합하는 공정 사양 설정, 실시간 모니터링, 정보 가치가 높은 데이터 수집 전략을 제시한다. 향후 연구에서는 다변량 출력(여러 CQA 동시 최적화)과 실시간 데이터 스트리밍을 통한 온라인 업데이트, 그리고 다른 제조 분야(예: 백신, 항체)로의 확장 가능성을 탐색할 계획이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기