AI 기반 이중모드 적응형 인슐린 베이스·볼루스 조절기

본 논문은 강화학습(Actor‑Critic) 기반의 적응형 베이스·볼루스 알고리즘(ABBA)을 제안한다. ABBA는 SMBG 혹은 CGM 데이터를 입력으로 받아 전날 혈당을 기반으로 다음 날의 일일 basal rate와 세 끼 식사별 insulin‑to‑carbohydrate ratio(CIR)를 자동 조정한다. FDA 승인 당뇨 시뮬레이터에서 100명의 성인 T1D 환자를 3개월간 시뮬레이션했으며, CGM·SMBG 두 모드 모두 시간‑내‑범위…

저자: Qingnan Sun, Marko V. Jankovic, Jo~ao Budzinski

AI 기반 이중모드 적응형 인슐린 베이스·볼루스 조절기
본 연구는 제1형 당뇨병(T1D) 환자를 위한 인슐린 펌프 기반 베이스·볼루스 조절 시스템인 Adaptive Basal‑Bolus Advisor(ABBA)를 제안한다. ABBA는 기존의 정적 베이스 인슐린 및 고정된 insulin‑to‑carbohydrate ratio(CIR)를 개인 맞춤형으로 동적으로 업데이트하는 것을 목표로 한다. 핵심 기술은 강화학습(Reinforcement Learning, RL) 중 Actor‑Critic(AC) 알고리즘을 적용한 데이터‑드리븐 제어기로, 환자의 전날 혈당 패턴을 입력으로 받아 다음 날의 일일 basal rate와 세 끼 식사별 CIR(아침, 점심, 저녁)를 자동으로 산출한다. ABBA는 두 가지 입력 모드를 지원한다. 첫 번째는 전통적인 Self‑Monitoring of Blood Glucose(SMBG) 방식으로, 하루 네 번(아침·점심·저녁·취침 전) 혈당을 측정한다. 두 번째는 Continuous Glucose Monitoring(CGM) 방식으로, 수분당 수십 번의 연속 혈당 데이터를 활용한다. 두 모드 모두 혈당이 목표 범위(90‑150 mg/dL) 위·아래에 머무는 횟수와 비율을 각각 hyper‑feature와 hypo‑feature로 정의한다. 이 피처는 0~1 사이로 정규화되어 로컬 비용 c를 계산하는 데 사용되며, λ_h와 λ_l이라는 가중치로 hyper·hypo 비용을 조합한다. AC 구조는 다음과 같이 동작한다. Critic은 선형 베이시스 함수를 이용해 가치함수 V(s)≈wᵀφ(s)를 근사하고, TD‑error δ_t = r_t + γV(s_{t+1}) – V(s_t) 를 계산한다. 이 δ_t를 이용해 파라미터 w와 θ를 각각 학습률 β, α로 업데이트한다. Actor는 정책 파라미터 θ를 직접 최적화하며, 정책은 Gaussian 분포 π(a|s;θ)=𝒩(μ(s;θ),σ²) 형태를 취한다. 탐색 노이즈 σ는 로컬 비용 c에 비례하여 σ = 0.05·√c 로 설정되며, 정책이 안정화될수록 σ가 감소한다. 베이스 인슐린은 하루 동안 일정하게 유지하되, 전날의 피처를 기반으로 새로운 basal rate B_R^{k}를 계산한다. 세 끼 식사별 CIR_i^{k}(i=1,2,3)는 각각 독립적인 피처와 업데이트 규칙을 적용해, basal과 bolus가 동시에 증감하는 현상을 방지한다. 업데이트는 이전 값과 새 값을 0.5 비율로 융합(fusion)한 뒤, 최대 5 % 변동 제한을 두어 급격한 변화를 억제한다. 또한, CIR 업데이트 시 l 스위치 파라미터(0 또는 1)를 도입해, 필요 시 기존 값을 유지하도록 설계하였다. 알고리즘의 전체 제어 신호는 선형 결정 행동 P_a = φ(s)ᵀθ와 감독 행동 P_s(피처 기반 규칙)로 구성된 P_d와 탐색 노이즈 N을 합산한 형태이다. 최종 제어 신호는 P = P_d + N 로 표현되며, 이는 베이스와 CIR 모두에 적용된다. 성능 검증은 FDA 승인 UVA/Padova T1D 시뮬레이터를 사용해 100명의 가상 성인 환자를 3개월(90일) 동안 시뮬레이션하였다. 시나리오는 세 끼 식사와 취침 전 스낵, 인슐린 감수성, 식사 시점·탄수화물 양, 측정 시점의 변동성을 포함한 8가지 현실적인 변동성을 포함한다. 주요 평가지표는 시간‑내‑범위(TIR, 70‑180 mg/dL), 저혈당(<70 mg/dL) 및 고혈당(>180 mg/dL) 비율, 그리고 총 일일 인슐린 용량(TDD)이다. 결과는 CGM 모드와 SMBG 모드 모두 평균 TIR 71 % 수준, 저혈당 4 %, 고혈당 5 % 정도로 차이가 없었으며, TDD는 평균 42 U로 변동이 없었다. 이는 ABBA가 입력 데이터 종류에 관계없이 혈당 조절 성능을 유지함을 보여준다. 논문의 한계점으로는 전적으로 시뮬레이션 기반 검증에 머물러 실제 임상 적용을 위한 추가 연구가 필요하다는 점, 베이스 인슐린을 하루 단위로만 조정함으로써 새벽 현상과 같은 급격한 일중 변동을 완전히 반영하지 못한다는 점, 그리고 CGM 데이터의 지연·노이즈와 SMBG 측정 오류가 알고리즘에 미치는 영향을 정량화하지 못했다는 점을 들 수 있다. 향후 연구에서는 실제 환자를 대상으로 한 임상시험, 베이스 인슐린의 시간‑세분화 조정, 그리고 다양한 센서 품질에 대한 강인성 검증이 필요하다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기