체인래더를 넘어 개별 청구 예측으로

본 논문은 전통적인 체인래더(Chain‑Ladder) 방법을 재구성하여, 누적 손해액을 단계별로 전진하는 대신 최신 관측치를 바로 궁극 손해액으로 연결하는 ‘프로젝션‑투‑얼티밋(PtU)’ 요인을 추정한다. 이 새로운 구조는 개별 청구 수준에서 다기간 예측을 수행할 수 있는 기반을 제공하며, 이를 입증하기 위해 간단한 신경망을 활용한 실증 사례를 제시한다.

저자: Ronald Richman, Mario V. Wüthrich

체인래더를 넘어 개별 청구 예측으로
본 논문은 비모수 체인래더(Chain‑Ladder, CL) 모델을 재구성하여, 전통적인 단계별 전진 방식이 아닌 ‘프로젝션‑투‑얼티밋(Projection‑to‑Ultimate, PtU)’ 요인 추정을 통해 최신 관측치를 바로 궁극 손해액으로 연결하는 새로운 접근법을 제시한다. 기존 CL은 누적 지급 C_{i,j}에 대해 개발 기간 j마다 추정된 f_j 요인을 곱해가며 궁극 손해액 C_{i,J}를 예측한다(식 2.3). 이때 f_j는 과거 삼각형 데이터에서 비율로 추정되며, 단계별 전진 과정을 거쳐 최종 예측값을 산출한다. 논문은 동일한 최종 예측값을 제공하지만, 한 번에 궁극 손해액을 직접 예측하는 PtU 요인 F_j = ∏_{l=j}^{J‑1} f_l 를 도입한다. PtU 요인은 관측 삼각형의 오른쪽 위 모서리(가장 최신 개발 기간)부터 시작해 대각선 방향으로 역방향( j + 1 → j )으로 추정한다. 구체적으로, 초기화 단계에서 가장 늦은 개발 기간 j = J‑1에 대해 bF_{J‑1}=b f_{J‑1}=∑_{i=1}^{I‑J} C_{i,J}/∑_{i=1}^{I‑J} C_{i,J‑1} 로 계산하고, 이후 j를 감소시키며 bF_j = ∑_{i=1}^{I‑j‑1} bC^*_i,J / ∑_{i=1}^{I‑j‑1} C_{i,j} 로 재귀적으로 추정한다. 여기서 bC^*_i,J는 이미 관측된 궁극 손해액(완전 개발된 사고 연도)이다. 이 과정을 통해 얻어진 bF_j는 기존 CL 요인과 동일한 정보를 담고 있지만, “한 번에” 궁극 손해액을 예측하는 형태로 변환된다. 이러한 재구성은 두 가지 중요한 의미를 가진다. 첫째, PtU 요인 추정 과정 자체가 전체 삼각형 정보를 최적 활용한다는 점이다. 관측된 모든 누적 지급 C_{i,j}가 적절한 시점에 사용되므로, 정보 손실이 최소화된다. 둘째, PtU 요인을 개별 청구 수준으로 확장할 수 있다는 점이다. 개별 청구 ν에 대해 C_{i,j|ν}를 사용해 동일한 PtU 추정식을 적용하면, 각 청구마다 별도의 궁극 손해액 예측 bC_{i,J|ν}를 얻을 수 있다. 이는 기존 CL이 집계 수준에서만 작동하던 한계를 넘어, 개별 청구 데이터를 직접 활용하는 기반을 제공한다. 논문은 현재 개별 청구 예측에 사용되는 네 가지 전통적 다기간 예측 방법을 비판한다. (1) 재귀적 1‑기간 예측을 누적하는 방식은 예측값을 입력으로 사용할 때 모델이 학습되지 않은 연속적인 값을 마주하게 된다. (2) 전체 시뮬레이션 모델을 구축하는 방법은 복잡한 지급 구조를 정확히 모사하기 어려워 실무 적용이 제한된다. (3) 시퀀스‑투‑시퀀스 마스킹 기법은 편향 제어가 어려워 전문가 개입이 필요하다. (4) 궁극 손해액을 직접 예측하는 방법은 생존 분석이나 강화학습을 활용하지만, CL과 같은 검증된 가이드라인이 부족하다. 제안된 PtU 기반 접근은 (4)와 유사하지만, CL의 간단하고 편향에 강한 특성을 그대로 유지한다는 점에서 차별화된다. 특히, PtU 요인은 전체 삼각형 정보를 최적 활용하므로, 개별 청구 데이터가 부분적으로 관측되더라도 일관된 추정이 가능하다. 또한, PtU 요인을 머신러닝 모델의 목표 변수로 설정하면, 모델은 ‘최종 손해액’을 직접 학습하게 되며, 이는 기존의 1‑기간 예측을 여러 번 반복하는 복잡성을 제거한다. 실증 연구에서는 제한된 실제 데이터셋을 사용해 간단한 피드포워드 신경망을 훈련시켰다. 입력 변수로는 보고 시점까지의 누적 지급, 보고 지연, 사고 연령 등 전통적인 CL 요인과 개별 청구 특성을 포함했으며, 출력은 각 청구의 궁극 손해액이었다. 결과는 기존 CL 예측과 비교해 평균 절대 오차가 소폭 개선되었으며, 특히 장기 개발 기간에서 더 큰 이점을 보였다. 이는 PtU 요인 기반 구조가 머신러닝 모델에 충분한 ‘신호’를 제공함을 시사한다. 논문은 현재 한계점도 명시한다. 제안된 방법은 RBNS(Reported But Not Settled) 청구만을 대상으로 하며, IBNR(Incured But Not Reported) 청구는 별도의 빈도‑심각도 모델이 필요하다. 또한, 대규모 데이터와 다양한 보험 라인에 일반화될 수 있는지는 추가 연구가 필요하다. 그럼에도 불구하고, 검증된 CL 베이스라인 위에 머신러닝을 자연스럽게 결합할 수 있는 프레임워크를 제시함으로써, 개별 청구 수준의 실무 적용 가능성을 크게 확대한다는 점에서 의의가 크다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기