게시글

지식 기반에 의한 엔티티 집합의 구동

본 연구는 지식 기반(Knowledge Base)이 어떻게 다양한 엔티티 집합을 구동하는지에 대한 심층적인 분석을 제공합니다. 이 논문은 아마도 데이터 관리, 정보 검색, 또는 인공지능 시스템의 개선과 관련된 주제를 다루고 있을 것입니다. 지식 기반은 특정 도메인에서 수집된 정보와 그 정보 간의 관계를 저장하는 구조로, 이는 엔티티 집합을 효과적으로 관리하고 활용하는 데 중요한 역할을 합니다. 연구자들은 아마도 이러한 시스템이 어떻게 효율성을 향상시키고 새로운 인사이트를 제공하는지에 대해 탐구했을 것입니다.

2025년 12월 17일

ELVIS: 비디오 스트리밍 품질과 재생의 균형

ELVIS 아키텍처는 전통적인 코드크와의 차별화된 접근법으로 주목할 만합니다. 이 논문은 서버 측 인코딩 최적화와 클라이언트 측 생성형 인페인팅을 결합하여 중복 데이터를 제거하고 재구성하는 방법을 제시합니다. 이러한 접근법은 대역폭 사용을 줄이면서도 높은 화질을 유지할 수 있는 새로운 가능성을 열어줍니다. ELVIS의 모듈식 설계는 다양한 코드크, 인페인팅 모델, 품질 지표를 쉽게 통합할 수 있게 하며, 이는 미래 기술 발전에 대한 유연성과 확장성을 제공합니다. 또한, 현재 기술이 베이스라인보다 최대 11 VMAF 점을 개선한 결과

강화학습 에이전트의 안정적 학습을 위한 하이퍼볼릭 특징 공간 활용

본 논문은 강화학습(Reinforcement Learning, RL) 에이전트의 성능 향상을 위해 하이퍼볼릭 특징 공간을 활용하는 방법에 대해 깊게 분석하고 있다. 특히, 포앙카레 공(Poincaré Ball)과 하이퍼볼로이드(Hyperboloid) 모델에서 핵심 연산들의 그래디언트를 분석함으로써, 큰 노름(embedding norm)은 그래디언트 기반 훈련을 불안정하게 만들고 근접 정책 최적화(Proximal Policy Optimization, PPO)의 신뢰 영역 위반(trust region violation)을 초래한다는 것

모델 간 추론 연쇄 교환 가능성 탐구

본 논문은 추론 연쇄의 중간 산출물을 다른 모델이 이어받을 수 있는지를 실험적으로 검증함으로써, LLM 연구 분야에 새로운 시각을 제공한다. 첫 번째 핵심 기여는 ‘추론 교환 가능성’이라는 개념을 정의하고, 이를 정량화하기 위한 평가 프레임워크를 구축한 점이다. 저자들은 토큰‑레벨 로그‑확률을 기준으로 추론을 세 단계(초기, 중간, 후기)로 트렁케이트하고, 각 단계마다 프로세스 보상 모델(PRM)을 적용해 논리적 일관성과 정답 정확도를 측정한다. 이때 사용된 두 베이스 모델인 Gemma‑3‑4B‑IT와 LLaMA‑3.1‑70B‑In

Model

문제 모델링을 통한 안정적인 계획 수립

이 논문은 대형 언어 모델(LLMs)이 복잡한 계획 작업에서 제약 위반, 일관성 없는 상태 추적 및 취약한 솔루션을 생성하는 문제를 해결하기 위해 Model First Reasoning(MFR)이라는 새로운 접근법을 제안합니다. MFR은 두 단계로 구성되는데, 첫 번째 단계에서는 LLM이 문제의 구조화된 모델을 명시적으로 구성하고, 두 번째 단계에서는 이 모델에 대한 추론 및 계획을 수행합니다. 이러한 방법은 인간의 과학적 추론, 고전 AI 계획, 그리고 의사결정 인지 모델에서 영감을 받아 제안되었습니다. 실험 결과 MFR은 다양한

Model

시간 렌즈 멀티모달 대형 언어 모델의 비디오 시간 정렬을 위한 고품질 데이터와 효율적 알고리즘 설계

Time‑Lens 논문은 비디오 시간 정렬(VTG)이라는 비교적 좁은 영역에 초점을 맞추면서도, 현재 멀티모달 대형 언어 모델(MLLM) 연구에서 간과되고 있는 두 가지 핵심 요소—데이터 품질과 알고리즘 설계—를 체계적으로 조명한다. 첫 번째 기여는 기존 VTG 벤치마크가 갖는 ‘라벨 노이즈’와 ‘주석 불일치’ 문제를 정량적으로 분석하고, 이를 해결하기 위해 재주석 작업을 수행한 TimeLens‑Bench이다. 재주석 과정에서는 시간 구간의 경계 정확도, 언어 표현의 일관성, 그리고 시각‑언어 연관성 등을 엄격히 검증했으며, 그 결

양자 신경망 개발을 위한 시각화 도구 XQAI Eyes

이 논문은 양자 신경망(QNNs) 개발에서 중요한 역할을 하는 인코더 선택에 초점을 맞추고 있습니다. QNNs는 양자 컴퓨팅과 뉴럴 네트워크 아키텍처를 결합한 것으로, 고차원 데이터와 얽힘된 데이터의 처리 속도 향상 및 효율성을 제공합니다. 그러나 적절한 인코더 선택은 시스템적인 지침 부족과 실험적 접근 방식 때문에 어려움을 겪고 있습니다. 이 논문에서는 이러한 문제를 해결하기 위해 XQAI Eyes라는 새로운 시각화 도구를 제안하고 있습니다. XQAI Eyes는 QNN 개발자가 클래식 데이터 특징과 해당 양자 상태 사이의 비교를

Network

역인과성 초점 알고리즘으로 대규모 후보 공간 탐색 혁신

이 논문은 “희귀하지만 가치 있는 솔루션을 찾는 문제”를 기존의 탐색‑최적화 접근법과는 다른 관점에서 접근한다는 점에서 의미가 크다. 전통적인 방법은 보통 목표 함수를 직접 최적화하거나, 강화 학습에서는 보상을 최대화하도록 정책을 학습한다. 그러나 후보 공간이 천문학적으로 클 경우, 특히 목표가 희박하게 분포하거나 제약 조건이 복잡하게 얽혀 있을 때, 이러한 방식은 샘플 효율성이 급격히 떨어진다. ICFA는 이러한 상황을 “목표‑조건부 재가중”이라는 개념으로 재구성한다. 구체적으로, 먼저 기존의 제안 샘플러(예: 언어 모델, 무작위

의료 AI의 진화: Ophiuchus로 시각적 사고 혁신

이 논문은 의료 AI 분야에서 중요한 발전을 제시하고 있다. Ophiuchus 프레임워크는 MLLMs가 복잡한 시각적 정보를 처리하는 데 필요한 세 가지 핵심 기능을 제공한다: 추가적인 시각적 증거의 필요성을 판단할 수 있는 능력, 의료 이미지 내에서 정확하게 탐사해야 할 위치를 결정할 수 있는 능력, 그리고 이들 정보를 다중 모달 추론 체인에 통합하는 능력. 이러한 기능은 MLLMs가 복잡한 시각적 데이터를 처리하고 분석하는 데 있어 중요한 도약을 이루게 한다. Ophiuchus의 핵심은 세 단계로 구성된 훈련 전략이다: 첫째,

Analysis

카디널리티 추정을 개선하는 TiCard: 데이터베이스 최적화의 새로운 지평

이 논문은 카디널리티 추정 문제를 해결하기 위해 TiCard라는 새로운 프레임워크를 소개하고 있습니다. 카디널리티 추정은 데이터베이스 쿼리 최적화에서 중요한 역할을 하지만, 기존의 방법들은 상관관계를 고려하지 못하거나 특정 작업 부하에 맞는 별도의 훈련 파이프라인과 통합이 필요하다는 문제점이 있습니다. TiCard는 이러한 제약을 극복하기 위해 데이터베이스의 원래 추정기를 보완하는 방식으로 설계되었습니다. TiCard는 두 가지 주요 구성 요소를 사용합니다: 그레디언트 부스팅 회귀기(Gradient Boosting Regressor

터널 결함 자동 검사 위한 새로운 데이터셋 소개

본 논문은 터널 결함 검사를 위한 새로운 데이터셋을 소개하며, 이는 딥러닝 모델의 학습과 성능 개선에 중요한 역할을 합니다. 터널은 교통 인프라의 주요 구성 요소로, 안전성을 유지하기 위해 정기적인 점검이 필수적입니다. 하지만 전통적인 수동 검사 방법은 시간 소모가 많고 비용이 높으며 주관적이어서 제한점이 있습니다. 모바일 매핑 시스템과 딥러닝의 발전으로 자동화된 시각 검사가 가능해졌지만, 이를 위한 충분한 데이터셋이 부족하여 그 효과가 제한되어 왔습니다. 본 논문에서 소개하는 새로운 데이터셋은 세 가지 다른 종류의 터널 라이닝에

Learning Data Detection

해석 가능한 결정트리 기반 선호 베이지안 최적화

본 논문은 베이지안 최적화의 한계점을 극복하고자 결정트리를 새로운 대리 모델로 제시한다. 이는 가우시안 프로세스(GP)를 사용하는 기존 방법과 달리 해석성이 뛰어나며, 연속형 및 범주형 데이터 처리 능력이 강화되어 실제 적용에 유용하다. 결정트리는 복잡한 모델을 이해하기 쉽게 시각화할 수 있어, 최적화 과정에서 얻은 결과를 직관적으로 해석하고 활용하는 데 도움이 된다. 특히, 본 논문의 실험에서는 날카로운 함수에 대한 성능 향상이 확인되었으며, 이는 실제 세계에서 자주 발생하는 불규칙적인 데이터 분포에 효과적일 수 있음을 시사한다.

Learning Model

현대 프로세서 설계에서의 정확하고 효율적인 전력 모델링: ReadyPower 프레임워크

본 논문의 핵심은 현대 프로세서 설계에서 전력 모델링의 중요성을 강조하고, 이를 위해 고전적인 분석형 아키텍처 수준의 전력 모델과 ML 기반 전력 모델의 한계를 지적하며 새로운 접근 방식을 제안하는 것입니다. ReadyPower 프레임워크는 기존의 문제점을 해결하기 위해 다양한 수준의 매개변수를 도입하여 McPAT 분석 모델에 통합함으로써, 고정밀도와 신뢰성을 제공합니다. ReadyPower의 주요 장점은 세 가지입니다: 첫째, 신뢰성. ReadyPower는 실제 프로세서 구현과 아키텍처 수준의 분석 모델 간의 불일치를 해결함으로써

Framework Model

확산모델을 이용한 텍스트 지도 이미지 편집의 면역화: 시맨틱 불일치와 인식적 저하를 통한 보호

이 논문은 텍스트 지시 이미지 편집에 대한 악용 가능성과 그로 인한 우려를 다루며, 이를 방어하기 위한 새로운 접근법을 제안합니다. 기존의 면역화 성공 평가 방법은 주로 시각적 유사성에 초점을 맞추고 있지만, 이는 공격자의 의도와의 시맨틱 불일치라는 본질적인 문제를 해결하지 못한다는 점에서 한계가 있습니다. 논문에서는 이러한 문제를 해결하기 위해 Synergistic Intermediate Feature Manipulation (SIFM) 방법을 제안합니다. SIFM은 중간 확산 특징을 전략적으로 변형하여 원래 편집 경로와의 시맨틱

고주파 신호 학습을 강화하는 쿼리 컨볼루션

본 논문은 고주파 신호 학습의 어려움을 해결하기 위해 Qonvolutions이라는 새로운 접근법을 제시합니다. 이 방법은 기존의 신경망이 고주파 정보를 처리하는 데 어려움을 겪는 문제를 해결하고자 저주파 신호와 쿼리(예: 좌표)를 합성하여 고주파 신호를 더 잘 학습할 수 있게 합니다. Qonvolutions은 간단한 방법임에도 불구하고, 1D 회귀, 2D 초해상도, 2D 이미지 회귀 및 새로운 시점 합성(NVS)과 같은 다양한 작업에서 우수한 성능을 보여줍니다. 특히 NVS에서는 가우시안 스팟팅과 결합하여 실제 복잡한 장면에서도 라

대형 언어 모델의 낙태 낙인 인식 한계와 다층적 일관성 부재

이 논문은 인공지능 윤리와 인간‑컴퓨터 상호작용 분야에서 매우 시의적절한 질문을 제기한다. 낙태와 같이 사회적·문화적 갈등이 심한 주제는 개인의 내면적 판단, 주변인과의 관계, 그리고 사회 구조적 압력이라는 세 층위에서 복합적으로 작동한다. 저자들은 이러한 다층적 구조를 정량화한 ILAS(Individual Level Abortion Stigma Scale)를 기준으로, GPT‑4, Claude, Llama 2 등 현재 가장 널리 사용되는 다섯 개 LLM을 627명의 가상 페르소나에 적용해 체계적인 실험을 설계했다. 첫 번째 핵심

대화 분기: AI와의 효율적인 프로그래밍 탐색

이 논문은 대형 언어 모델(LLMs)의 한계를 극복하기 위해 ContextBranch라는 새로운 시스템을 제시하고 있습니다. LLMs는 여러 차례에 걸친 대화에서 성능이 크게 저하되며, 이로 인해 개발자가 다양한 접근 방식을 탐색하는 데 어려움을 겪습니다. ContextBranch는 체크포인트, 분기, 전환, 주입이라는 네 가지 핵심 기능을 제공하여 사용자가 대화 상태를 캡처하고 고립된 환경에서 다양한 접근 방식을 탐색하며 통합할 수 있도록 합니다. 실험 결과, ContextBranch는 선형 대화보다 2.5% 더 높은 응답 품질을

말ayer 주의 풀링을 활용한 음성 인식 기술 혁신

본 연구에서는 Layer Attentive Pooling (LAP)이라는 새로운 접근법을 제안하고, 이를 통해 사전 학습된 Transformer 모델로부터 얻은 계층별 출력을 효과적으로 통합하는 방법론을 개발했다. LAP의 핵심 아이디어는 각 계층의 중요성을 시간 동적으로 평가하고, 이에 따라 최대 풀링(max pooling)을 사용하여 특징들을 통합하는 것이다. 이 접근법은 기존의 정적 가중 평균 방법보다 더 유연하게 화자 특성의 변화를 포착할 수 있는 장점을 가지고 있다. 또한, 본 논문에서는 LAP과 Attentive Stat

반응형 학습을 통한 수학적 추론 모델의 효율적인 훈련: TRAPO 알고리즘

본 논문은 강화학습과 준감독 학습을 결합하여 대규모 추론 모델(LRMs)을 효율적으로 훈련하는 방법을 제안하고 있습니다. 특히, TRAPO 알고리즘을 통해 소량의 라벨링 데이터와 많은 비라벨 데이터를 활용해 모델을 안정화시키고, 이를 통해 높은 정확도와 강력한 일반화 성능을 달성할 수 있음을 보여주었습니다. 이 연구는 기존 무감독 RLVR 방법들이 훈련 후기 단계에서 일관성을 유지하지 못하고 모델 붕괴를 겪는 문제를 해결하는 데 중점을 두고 있습니다. TRAPO 알고리즘은 학습 경로 유사성 분석을 통해 신뢰할 수 있는 비라벨 샘플을

Framework Learning

시뮬레이션 기반 컴퓨터 아키텍처 연구 재현성을 위한 gem5와 gem5 Resources 확장

본 논문은 현재 컴퓨터 아키텍처 연구에서 널리 사용되는 전 시스템 시뮬레이터인 gem5가 직면한 재현성 문제를 체계적으로 진단하고, 이를 해결하기 위한 실질적인 개선안을 제시한다. 첫 번째 문제는 디스크 이미지와 커널, 벤치마크 등 필수 아티팩트를 개별 연구자가 직접 구축해야 하는 비효율성이다. 특히 ISA마다 이미지 생성 절차가 달라 협업과 공유가 어려웠으며, 이미지 품질 검증이 부족해 결과의 신뢰성이 저하될 위험이 있었다. 저자들은 Packer라는 자동화 도구를 도입해 x86, ARM, RISC‑V 세 ISA에 대해 동일한 워크

실시간 다중 사용자 영상 번역을 위한 선형 복합 AI 파이프라인 설계와 평가

본 논문이 다루는 핵심 문제는 “실시간”이라는 엄격한 시간 제약 하에 복수의 생성형 AI 모델을 연속적으로 실행해야 하는 상황에서 발생하는 시스템 레벨의 병목 현상이다. 전통적인 파이프라인 방식은 각 프레임 혹은 영상 세그먼트에 대해 음성 인식, 번역, 텍스트‑투‑스피치, 영상 합성 등 여러 모델을 순차적으로 호출한다. 이러한 순차 호출은 모델마다 수백 밀리초에서 수초에 이르는 추론 지연을 유발하고, 특히 다중 사용자가 동시에 참여하는 화상 회의에서는 각 사용자의 스트림에 대해 동일한 파이프라인을 독립적으로 적용해야 하므로 전체 연

인간감독의 핵심: AI 윤리와 인간의 번영을 위한 새로운 접근법

이 논문은 AI 윤리와 인간감독 사이의 연결고리를 탐색하며, 그 중요성을 강조하고 있습니다. EU AI Act를 포함한 여러 지침과 법률들이 인간감독에 대한 명확한 정의나 구체적인 발전 방향을 제시하지 못하는 상황에서, 저자들은 이 개념을 '번영 효능성' 프레임워크 내에서 재정의하고 있습니다. 번영 효능성은 AI 리터러시와 윤리적 판단력을 포함하며, 인간의 필요를 인식하면서도 그 중 일부가 충돌하거나 해롭게 될 수 있다는 점을 인정하는 포괄적인 접근법입니다. 논문은 또한 사람들이 자신의 욕구나 두려움을 AI 시스템에 투영할 가능성을

질문을 통한 인터랙티브 추론 결과 기반 질문 최적화 전략

본 논문은 “질문”이라는 행동을 LLM의 핵심 능력으로 재정의하고, 이를 학습 가능한 정책으로 전환하는 혁신적인 프레임워크를 제시한다. 전통적인 LLM 활용 방식은 주어진 프롬프트에 대해 가능한 한 정확한 답을 생성하는 데 초점을 맞추지만, 실제 고위험 응용에서는 사용자가 제공한 정보가 불완전하거나 모호할 때 추가적인 질의가 필요하다. 이러한 상황을 모델이 스스로 인식하고, 교사 모델(보다 강력한 LLM)에게 보완 정보를 요청하도록 학습시키는 것이 핵심 아이디어이다. ODQS는 두 단계 학습 파이프라인을 사용한다. 첫 번째 단계는

Model

학습 성과와 연계된 교육 자료 자동 정렬을 위한 임베딩 기반 프레임워크

본 논문은 교육 기술 분야에서 ‘학습 목표와 교육 자료 간 정렬(alignment)’이라는 핵심 문제를 자동화하려는 시도로서, 텍스트 임베딩 모델을 활용한 프레임워크를 제시한다. 연구는 크게 세 단계로 구성된다. 첫 번째 단계에서는 인간이 직접 만든 교육 자료를 기준 데이터셋으로 활용해 여러 LLM 기반 임베딩 모델(Voyage, OpenAI‑Ada 등)을 비교 평가하였다. 여기서 ‘정렬’은 학습 목표와 자료 내용 사이의 의미적 유사성을 수치화한 점수로 정의되며, 인간 평가자들의 라벨링을 정답으로 삼아 모델의 정확도를 측정하였다.