센티피드 게임 학습에 대한 통계적 관점

본 논문에서는 학생 집단이 반복적인 센티피드 게임 플레이를 통해 서브게임 완전 내시 균형을 학습하는지에 대한 통계적 증거를 평가한다. 플레이어가 의사결정 효용을 평가하는 오류가 게임 경험이 쌓일수록 어떻게 변하는지를 모델링한다. 먼저, 선택 확률을 퀀타일 응답 균형(QRE)으로 가정하되 반복 플레이에 따라 변하도록 하는 통계 모델의 파라미터를 추정한다( McKelvey & Palfrey, 1995, 1996, 1998). 이 모델은 기존에 고려…

저자: Anton H. Westveld, Peter D. Hoff

본 논문에서는 학생 집단이 센티피드 게임을 반복적으로 수행함에 따라 서브게임 완전 내시 균형(Subgame Perfect Nash Equilibrium, SPNE)에 대한 학습이 이루어지는지를 통계적으로 검증한다. 이를 위해 플레이어가 의사결정 효용을 평가할 때 발생하는 오류가 게임 경험이 증가함에 따라 어떻게 변하는지를 모델링한다. 먼저, 선택 확률을 퀀타일 응답 균형(Quantal Response Equilibrium, QRE)으로 가정하고, 이 확률이 반복 플레이에 따라 변하도록 하는 통계 모델의 파라미터를 추정한다(McKelvey and Palfrey, 1995, 1996, 1998). 이 모델은 기존에 제안된 유사 모델보다 데이터에 대한 적합도가 우수함을 확인한다. 그러나 동일한 플레이어가 참여한 게임들 간에 결과가 상당히 상관관계를 보이는 점을 고려할 때, 피험자 내 상관을 반영하는 모델이 보다 적절함을 시사한다. 따라서 플레이어별 의사결정 및 학습 속도에 대한 상관을 허용하는 모델을 추가로 추정한다. 논문 전반에 걸쳐 탐색적 데이터 분석과 확증적 데이터 분석의 맥락에서 무작위화 검정(randomization test)과 사후 예측 검정(posterior predictive test)의 활용을 비교·논의한다.

센티피드 게임 학습에 대한 통계적 관점

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기