스프레드시트와 데이터베이스의 융합, 금융 분석 혁신
본 논문은 스프레드시트의 편리함을 유지하면서 데이터를 중앙 데이터베이스에 보관하고, 서버‑사이드에서 계산을 수행하도록 설계된 ‘Formula Grid’ 방식을 소개한다. 이를 통해 대용량 시계열 데이터의 셀 내 배열 저장·연산이 가능해지고, VWAP와 같은 금융 분석을 일관되고 투명하게 배포할 수 있다.
저자: Brian Sentence
논문은 금융 시장에서 스프레드시트가 데이터베이스, 계산기, 보고서 작성 도구로 동시에 활용되는 현실을 출발점으로 삼는다. 이러한 다목적 사용은 빠른 의사결정과 복잡한 파생상품 분석에 유리하지만, 작은 오류가 대규모 손실을 초래하거나, 데이터 투명성이 부족해 내부 사기 위험을 높이는 등 운영·규제 위험을 내포한다. 이를 해결하기 위해 저자는 ‘Formula Grid’라는 새로운 설계 패러다임을 제시한다. 핵심 아이디어는 스프레드시트 인터페이스는 유지하되, 실제 데이터와 계산 로직을 중앙 데이터베이스와 서버‑사이드 계산 엔진에 옮기는 것이다.
첫 번째 설계 목표는 사용자 친화성이다. 금융 현장의 트레이더·리스크 매니저는 전문적인 비즈니스 지식은 갖추고 있으나, 시스템 설계자에게 요구되는 상세 요구사항을 전달하기 어려운 경우가 많다. 따라서 Formula Grid는 사용자가 기존 스프레드시트처럼 셀에 수식을 입력하고, 이를 ‘Formula Grid Editor’를 통해 편집하도록 허용한다. 동시에 이 수식은 백그라운드에서 중앙 데이터베이스에 저장되고, 계산 서버에서 실행된다.
두 번째는 데이터 중앙화이다. 전통적인 DBMS는 배열·리스트·매트릭스와 같은 복합 타입을 기본적으로 지원하지 않지만, 본 시스템은 이러한 타입을 셀 안에 직접 저장할 수 있게 확장한다. 예를 들어, ‘A1 = Closing Price Series’와 같이 전체 시계열 데이터를 하나의 셀에 담는다. 이렇게 하면 수천 개의 개별 셀에 데이터를 분산시키는 대신, 셀 하나에 전체 데이터를 보관하고 벡터 연산을 수행할 수 있다.
세 번째는 계산 중앙화이다. 사용자가 정의한 수식은 데이터베이스에 메타데이터 형태로 보관되고, 계산 서버가 이를 해석해 실행한다. 결과는 동일한 데이터베이스에 저장되므로, 조직 내 모든 사용자는 동일한 로직과 최신 데이터를 즉시 조회할 수 있다. 이는 버전 관리와 감사 추적을 용이하게 만든다.
논문은 구체적인 예시로 VWAP(Volume Weighted Average Price) 계산을 제시한다. 먼저 ‘Equity’ 데이터 스키마에 ‘VWAP’라는 새로운 속성을 Formula Grid 타입으로 추가한다. 이후 ‘TradePrice’와 ‘TradeSize’ 시계열을 각각 셀 A1, A2에 할당하고, A3에서 두 벡터를 곱한 뒤, A4와 A5에서 각각 가격·거래량의 합을 구한다. 마지막으로 A6에서 A3의 합을 A5의 합으로 나누어 VWAP 값을 산출한다. 중간 결과 셀(A1~A5)은 ‘숨김’ 처리해 최종 사용자는 A6만 확인하면 된다. 이 과정은 백그라운드에서 자동으로 모든 주식 종목에 적용되며, 사용자는 별도의 프로그래밍 없이도 결과를 조회할 수 있다.
결론에서는 이 접근법이 현재 상용 데이터 관리 시스템에 적용 중이며, 고빈도·고용량 시장 데이터 분석에 특히 유용함을 강조한다. 스프레드시트의 생산성을 유지하면서 데이터베이스와 서버‑사이드 계산의 장점을 결합함으로써, 운영 위험을 감소시키고 규제 요구사항을 충족한다. 다만 초기 인프라 구축 비용, 사용자 교육, 기존 레거시 시스템과의 통합 문제 등 실무 적용 시 해결해야 할 과제도 존재한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기