멀티라벨 제한볼츠만머신을 활용한 완전 비침입형 가전부하 모니터링
본 논문은 가전별 개별 센서를 설치하지 않고도 가정 전체 전력 데이터를 이용해 각 가전의 ON/OFF 상태를 추정하는 비침입형 부하 모니터링(NILM) 문제를 다중라벨 분류로 재구성하고, 이를 해결하기 위해 라벨 유닛을 추가한 제한볼츠만머신(ML‑RBM)을 제안한다. REDD와 Pecan Street 두 공개 데이터셋에서 기존의 ML‑kNN, RakEl, LC‑DDL과 비교 실험을 수행했으며, 제안 모델이 매크로·마이크로 F1 점수에서 가장 높…
저자: Sagar Verma, Shikha Singh, Angshul Majumdar
본 논문은 가정용 전력 소비를 세부 가전별로 분리하는 비침입형 부하 모니터링(NILM) 문제를 새로운 관점에서 접근한다. 기존 NILM 연구는 각 가전의 개별 전력 데이터를 사전에 수집하기 위해 센서를 설치하는 ‘침입형’ 방법에 의존했으며, 이는 비용과 설치 복잡성 측면에서 실용성이 떨어졌다. 최근 몇몇 연구가 NILM을 다중라벨 분류 문제로 재구성해, 집합 전력 데이터와 가전의 ON/OFF 라벨만을 이용해 학습할 수 있음을 보였지만, 이들 방법은 전통적인 머신러닝 분류기(ML‑kNN, RakEl, LC‑DDL 등)를 사용했다.
저자들은 이러한 흐름을 이어 받아, 제한볼츠만머신(RBM)에 라벨 유닛을 추가한 ‘멀티라벨 제한볼츠만머신(ML‑RBM)’을 제안한다. 기본 RBM은 가시층 x (집합 전력 시계열)와 은닉층 h 사이에 이중 연결을 두어, 은닉층이 입력 데이터의 고차 비선형 구조를 학습한다. 여기서 라벨 벡터 y 를 추가하고, 라벨‑은닉 가중치 U 를 도입함으로써, 은닉층이 입력 전력과 라벨 사이의 상관관계를 동시에 모델링하도록 설계하였다. 에너지 함수는 E(y,x,h)=−hᵀWx−aᵀx−bᵀh−cᵀy−hᵀUy 로 정의되며, 파라미터 Θ=(W,a,b,c,U)를 대조발산(Contrastive Divergence, CD‑k) 알고리즘을 통해 학습한다. 라벨이 다중(2^C) 가능한 점 때문에 정확한 후방분포 p(y|x)를 계산하기는 어렵다. 따라서 저자들은 평균장(mean‑field) 메시지 패싱을 이용해 근사적인 q(y,h)=∏_l μ_l^{y_l}(1−μ_l)^{1−y_l}∏_j τ_j^{h_j}(1−τ_j)^{1−h_j} 를 정의하고, KL 발산을 최소화하는 반복식 μ_l←σ(c_l+∑_j U_{jl}τ_j), τ_j←σ(b_j+∑_i W_{ji}x_i+∑_l U_{jl}μ_l) 를 수행한다. 최종적으로 μ_l은 각 가전이 켜져 있을 확률을 나타내며, 0.5 임계값을 적용해 이진 라벨을 얻는다.
실험은 두 개의 공개 NILM 데이터셋, REDD와 Pecan Street(일명 Dataport)에서 수행되었다. REDD는 6가구의 1 Hz 전력 데이터를 제공하고, Pecan Street은 240가구의 1 분 단위 회로별 전력 데이터를 제공한다. 각 데이터셋을 50 % 학습, 30 % 테스트, 20 % 검증 비율로 분할했으며, 입력은 1 Hz 샘플링된 60 초 구간(총 60개의 샘플)이다. 은닉 유닛 수는 32, 64, 128, 256을 시험했으며, 128이 가장 좋은 성능을 보였다. 학습률은 0.001, CD‑2, 배치 크기 등은 모두 동일하게 설정하였다.
비교 대상은 기존 다중라벨 NILM 방법인 ML‑kNN, RakEl, 그리고 최신 딥러닝 기반 LC‑DDL이다. 평가 지표는 다중라벨 분류에서 흔히 쓰이는 매크로 F1, 마이크로 F1와, 각 가전별 정규화 에너지 오류(NEE)이다. 결과는 다음과 같다. REDD 데이터셋에서 ML‑RBM은 매크로 F1 0.708, 마이크로 F1 0.716을 기록해, ML‑kNN(0.609/0.614)과 RakEl(0.629/0.629)을 크게 앞섰다. Pecan Street에서도 매크로 0.708, 마이크로 0.712로 동일하게 우수했다. 에너지 오류 측면에서는 LC‑DDL이 가장 낮은 값을 보였지만, ML‑RBM도 경쟁적인 수준을 유지했다.
특히 저자들은 라벨 정확도와 에너지 재구성 오류가 반드시 일치하지 않을 수 있음을 강조한다. 라벨이 완전히 틀리더라도 활성 가전 수가 일치하면 재구성 오류는 0%가 되며, 반대로 라벨이 일부만 맞아도 재구성 오류가 크게 감소할 수 있다. 따라서 NILM 알고리즘을 평가할 때는 두 지표를 동시에 고려해야 함을 제안한다.
논문의 결론은 다음과 같다. 라벨이 포함된 제한볼츠만머신은 기존 다중라벨 분류기보다 높은 라벨 예측 정확도를 제공하면서, 비침입형 NILM이라는 목표를 유지한다. 또한 RBM의 생성‑재구성 능력이 라벨 감독과 결합될 때, 전력 데이터의 복잡한 상관관계를 효과적으로 학습한다는 점을 확인하였다. 한계점으로는 라벨이 필요한 점, 평균장 근사의 정확도, 실시간 적용을 위한 연산 비용 등에 대한 추가 연구가 필요함을 언급한다. 향후 연구에서는 라벨 프리 학습, 보다 정교한 추론 알고리즘, 그리고 다양한 다중라벨 벤치마크와의 비교를 통해 ML‑RBM의 일반화 가능성을 검증하고자 한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기