페이스봇: 소셜 네트워크와 공유 기억으로 인간‑로봇 장기 관계 강화

본 논문은 얼굴 인식과 자연어 대화를 갖춘 이동형 로봇을 Facebook과 연동시켜, 인간과 로봇이 공유 기억과 공동 친구 네트워크를 축적하도록 설계하였다. 이를 통해 장기적인 인간‑로봇 관계 형성을 촉진하고, 로봇이 온라인 사회 정보를 생성·활용하는 최초 사례를 제시한다.

저자: ** - Nikolaos Mavridis* - Shervin Emami* - Ch, an Datta* - Wajahat Kazmi* - Chiraz BenAbdelkader† - Panos Toulis‡ - Andry Tanoto§ - Tamer Rabie* \* Interactive Robots, Media Lab

페이스봇: 소셜 네트워크와 공유 기억으로 인간‑로봇 장기 관계 강화
본 논문은 인간‑로봇 장기 관계 형성을 목표로, 얼굴 인식과 자연어 대화 기능을 갖춘 이동형 로봇을 설계·구현하고, 이를 Facebook과 연동시켜 사회적 정보를 실시간으로 활용·생성하는 시스템을 제시한다. 연구 배경으로는 기존 인간‑로봇 인터랙션 시스템이 초기 흥미는 유발하지만 수주에서 수개월에 걸쳐 사용자의 관심이 급감한다는 실증적 증거가 있다. 이를 극복하기 위해 저자들은 두 가지 핵심 요소, 즉 ‘공유 기억(shared episodic memories)’과 ‘공동 친구(shared friends)’를 제안한다. 공유 기억은 로봇과 인간이 공동으로 겪은 사건을 데이터베이스에 저장하고, 대화 중에 이를 재언급함으로써 친밀감과 지속성을 부여한다. 공동 친구는 로봇이 인간의 온라인 소셜 그래프에 접속해 친구 관계, 상태 업데이트, 사진 등을 실시간으로 획득·발신함으로써 대화에 사회적 맥락을 제공한다. 시스템 아키텍처는 모듈형 설계이며, ICE 기반의 인터프로세스 커뮤니케이션(IPC)으로 각 모듈이 독립적으로 동작한다. 주요 모듈은 다음과 같다. 1. **Vision Module**: 카메라와 Facebook 사진을 입력으로 받아 OpenCV 기반 얼굴 검출 후 피부색 필터링, 타원 마스크, 히스토그램 정규화 등 전처리를 수행한다. 검출된 얼굴은 사람당 HMM 기반 분류기로 전달되며, 로그 확률을 시간 창(window) 안에서 평균화해 신뢰도를 높인다. Facebook 사진은 태그 정보를 활용해 대략적인 중심 좌표를 기준으로 얼굴 영역을 추정하고, 정면·측면 검출기를 병렬로 적용해 오류를 최소화한다. 2. **Natural Language Dialogue Module**: Sphinx4를 이용한 음성 인식과 Cepstral TTS를 이용한 음성 합성을 제공한다. 언어 모델은 상황에 따라 실시간 전환 가능하며, Java와 C++ 혼합 구현으로 유연성을 확보한다. 3. **Social Database Module**: MySQL 기반의 로컬 데이터베이스와 Facebook API를 연동한다. ‘Social DB’는 프로필, 친구 리스트, 이벤트, 사진 메타데이터를 저장하고, 프라이버시 제한을 고려한 질의를 지원한다. ‘Interaction DB’는 타임스탬프 기반 에피소드 메모리를 제공해 과거 대화, 로봇이 보낸 메시지, 사용자의 반응 등을 기록한다. API는 데이터 읽기·쓰기, 친구 관계 질의, 이벤트 조회, 사진 태깅, 직접 메시지 전송 등을 제공한다. 4. **Navigation & Motion Module**: ARIA 기반의 지도 작성·경로 계획·장애물 회피 기능을 제공한다. 카메라 팬‑틸트 제어도 포함한다. 5. **Controller Module**: 고수준 스크립트를 통해 전체 로봇 동작을 오케스트레이션한다. 얼굴 인식, 대화 흐름, 소셜 정보 조회·게시, 이동 행동 등을 순차적으로 제어한다. 운용 흐름은 다음과 같다. 로봇은 실내를 무작위 탐색하면서 사람을 감지하면 Vision Module을 통해 얼굴을 인식한다. 인식이 충분히 확신될 경우, Controller는 사용자에게 이름 확인을 요청하고, 인식이 틀렸을 경우 두 번째 후보를 제시한다. 이후 로봇은 사진을 촬영해 해당 인물의 학습 데이터에 추가하거나, 새로운 인물이라면 이름을 물어 새로운 클래스와 학습 세트를 생성한다. 새로운 인물에 대해 Facebook에 이미 존재하는 경우, 로봇은 해당 인물의 친구 관계를 조회해 “당신은 X의 친구군요”와 같은 정보를 제공한다. 이미 알려진 인물과 대화할 때는 다음과 같은 대화 패턴이 적용된다. 로봇은 인사 후 현재 상태를 물으며, Facebook에서 가져온 최신 뉴스, 공동 친구의 상태 업데이트, 사진 등을 자연스럽게 삽입한다. 예를 들어, “우리 친구 Shervin이 오늘 새로운 사진을 올렸어요”라며 정보를 제공하고, 필요 시 해당 친구에게 메시지를 전송한다. 또한 로봇은 과거에 해당 인물과 나눈 대화를 Interaction DB에서 검색해 “지난번에 X와 만났던 기억이 나요”와 같이 과거 경험을 언급한다. 대화 종료 시 로봇은 “다음에 또 뵙겠습니다”라고 인사하고, 자체 Facebook 페이지에 상호작용 기록을 게시한다. 시스템 튜닝 및 평가에서는 얼굴 인식 윈도우 크기, 신뢰도 임계값, HMM 파라미터 등을 실험적으로 조정하였다. 논문에 제시된 데모 영상(HRI 2009)에서는 로봇이 실제 사용자와 자연스러운 대화를 수행하고, Facebook을 통한 실시간 정보 교환이 가능함을 보여준다. 비록 장기 사용자 연구가 아직 진행 중이 아니지만, 초기 사용자 반응은 긍정적이며, 로봇이 사회적 존재로 인식되는 효과가 관찰되었다. 핵심 기여는 (1) 로봇을 최초로 광범위한 온라인 소셜 네트워크(Facebook)에 연결하여 인간과의 사회적 맥락을 실시간으로 파악·활용하게 한 점, (2) 로봇이 자체적으로 온라인에 정보를 생성·게시함으로써 인간과의 관계 지속성을 높인 점이다. 이러한 접근은 로봇이 개인 비서, 교육 보조, 노인 돌봄 등 다양한 분야에서 인간의 사회적 네트워크와 연계되어 보다 풍부하고 지속 가능한 상호작용을 제공하도록 하는 기반이 될 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기