게시글

모든 게시글 목록입니다. 최신순으로 정렬되어 있습니다.

총 829개의 게시글
총 17페이지
트리폭을 보존한 3‑다양체 삼각분할의 변환과 퀀텀 불변량의 고정‑파라미터 알고리즘

트리폭을 보존한 3‑다양체 삼각분할의 변환과 퀀텀 불변량의 고정‑파라미터 알고리즘

이 논문은 3‑다양체 위상학에서 가장 실용적인 데이터 구조인 삼각분할을 다루면서, 그래프 이론의 핵심 개념인 트리폭을 중심으로 알고리즘적 효율성을 극대화한다는 점에서 큰 의미를 가진다. 트리폭은 그래프가 트리와 얼마나 유사한지를 정량화하는 파라미터이며, 트리폭이 작을수록 동적 계획법이나 색칠 알고리즘 같은 전통적인 FPT 기법을 적용하기 용이하다. 기존 연구에서는 삼각분할 자체의 트리폭을 이용해 다양한 위상학적 문제(예: 매니폴드 동형판별, 코흐라 복합체 계산 등)를 FPT로 해결했지만, 히어로드 분할이라는 전혀 다른 표현으로 변환

확산 기반 통계 다운스케일링으로 고해상도 날씨 예보 구현

확산 기반 통계 다운스케일링으로 고해상도 날씨 예보 구현

본 연구는 수치예보 분야에서 고해상도 예보를 실시간으로 제공하기 위한 핵심 기술인 통계적 다운스케일링을 딥러닝 기반 확산 모델에 적용한 점에서 큰 의의를 가진다. 기존의 CorrDiff 프레임워크는 주로 표면 변수와 제한된 지역에 초점을 맞추었으나, 본 논문은 적용 영역을 약 40배 확대하여 중국 전역을 포괄하고, 6개의 기압 레벨에 해당하는 고층 변수까지 포함함으로써 모델의 일반화 능력을 크게 강화하였다. 이는 대기 현상이 수직적으로도 복잡하게 얽혀 있음을 고려한 설계로, 특히 강수·대류·제트 스트림 등 고층 동역학을 정확히 재현

Model
희소 사전학습이 드러내는 신경망 표현의 다중 의미와 식별 불가능성

희소 사전학습이 드러내는 신경망 표현의 다중 의미와 식별 불가능성

이 논문은 최근 인공지능 모델이 복잡한 개념을 어떻게 내부 표현에 담는지를 탐구하는 기계적 해석(mechanistic interpretability) 분야의 핵심 문제에 접근한다. 기존 연구들은 신경망이 의미 있는 개념을 고차원 표현 공간의 선형 방향으로 저장하고, 여러 개념이 동일한 뉴런 집합에 겹쳐서(superposition) 나타난다고 주장한다. 이러한 현상을 해소하기 위해 연구자들은 희소 사전학습(Sparse Dictionary Learning, SDL)이라는 방법론을 도입했으며, 여기에는 희소 자동인코더(sparse aut

Learning
AI 생성 이미지와 허위 정보의 확산 메커니즘 분석

AI 생성 이미지와 허위 정보의 확산 메커니즘 분석

본 논문은 AI‑생성 이미지와 허위 정보가 소셜 미디어, 특히 Reddit이라는 포럼 기반 플랫폼에서 어떻게 확산되는지를 정량적으로 규명한 최초의 대규모 연구로 평가할 수 있다. 연구자는 이념적 스펙트럼이 넓은 다섯 개 서브레딧을 선정함으로써, 좌파·우파·중도·대안·기술 중심 커뮤니티 등 다양한 정치·사회적 배경을 포괄하였다. 데이터 수집 단계에서는 2022‑2024년 사이에 게시된 1백만 건 이상의 포스트와 그에 연결된 재게시(cascade) 데이터를 크롤링했으며, 각 포스트에 포함된 이미지가 AI‑생성 여부를 판별하기 위해 최신

동작 확산 모델의 표현 방식과 손실 함수 선택이 성능에 미치는 영향에 대한 체계적 분석

동작 확산 모델의 표현 방식과 손실 함수 선택이 성능에 미치는 영향에 대한 체계적 분석

본 논문은 최근 급부상하고 있는 인간 동작 합성용 확산 모델의 핵심 설계 요소인 ‘동작 표현 방식’과 ‘손실 함수’를 체계적으로 검증한 점에서 학술적·실용적 의의가 크다. 먼저, 저자는 기존 연구에서 제안된 6가지 대표적인 동작 표현(예: 관절 각도, 관절 위치, 회전 행렬, 쿼터니언, 속도·가속도 기반 표현, 그리고 혼합형 표현)을 동일한 MDM 기반 프레임워크에 적용해 비교하였다. 이때 사용된 평가지표는 흔히 쓰이는 Frechet Inception Distance(FID)와 Diversity Score 등으로, 품질과 다양성을

Model
문화 지능과 가치 추론 품질 벤치마크: 미국 흑인 커뮤니티를 위한 CIVIQ 개발

문화 지능과 가치 추론 품질 벤치마크: 미국 흑인 커뮤니티를 위한 CIVIQ 개발

이 논문은 현재 AI·LLM 분야에서 급부상하고 있는 문화적 편향 문제를 실질적으로 해결하려는 시도로서 의미가 크다. 기존의 대부분 LLM은 대규모 인터넷 텍스트를 기반으로 학습되기 때문에 서구 중심의 언어·문화적 서술이 과다하게 반영된다. 결과적으로 비서구·소수자 집단이 겪는 경험이나 가치관이 제대로 반영되지 않아, 이들 집단이 LLM을 활용할 때 오해·불쾌감을 유발하거나, 중요한 의사결정에서 부정확한 정보를 제공할 위험이 있다. 이러한 문제를 인식하고 ‘문화‑인식’ LLM을 개발하려는 움직임은 필수적이며, 특히 ChatBlack

시각언어모델의 발화감정 모호성 해소와 심리대화 이해를 위한 다중수준 인사이트 네트워크

시각언어모델의 발화감정 모호성 해소와 심리대화 이해를 위한 다중수준 인사이트 네트워크

본 논문은 인간 대화의 비언어적 단서를 시각‑언어 모델에 통합하려는 시도 중 가장 포괄적인 접근법이라 할 수 있다. 첫 번째 문제인 ‘발화‑감정 모호성’은 입술 움직임이 감정 표현과 겹쳐 보이는 현상으로, 기존 VLM이 텍스트와 이미지 간의 연관성을 학습할 때 이중 의미를 구분하지 못해 심리적 추론에 오류를 일으킨다. MIND는 이러한 모호성을 해결하기 위해 계층적 구조를 채택하고, 각 레이어에서 시간적 특징 분산을 계산해 변동성이 낮은(즉, 감정과 무관한) 입술 패턴을 억제한다. 이 ‘상태 판단’ 모듈은 기존의 단순 attenti

Analysis Model
시간 영역 조건부 생성 모델을 이용한 지진 강진 합성 및 현장 특성 학습

시간 영역 조건부 생성 모델을 이용한 지진 강진 합성 및 현장 특성 학습

본 논문은 지진공학 분야에서 현장별 강진 기록을 인공적으로 생성할 수 있는 새로운 데이터‑드리븐 모델을 제시한다는 점에서 큰 의미를 가진다. 기존의 강진 합성 방법은 주로 스펙트럼 기반 혹은 물리‑기반 시뮬레이션에 의존했으며, 현장 특성을 충분히 반영하기 위해서는 복잡한 파라미터 튜닝이 필요했다. 반면 본 연구는 시간 영역에서 직접 가속도 신호를 다루는 TimesNet‑Gen을 도입함으로써, 현장별 고유의 “잠재적 병목”(latent bottleneck)이라는 작은 차원의 임베딩을 통해 현장 특성을 압축하고 재현한다. 이는 현장마다

Learning
양자 상대성 원리와 초광속 변환의 물리적 의미

양자 상대성 원리와 초광속 변환의 물리적 의미

이 논문은 양자역학과 상대성 이론 사이의 오래된 불일치를 새로운 관점에서 접근한다는 점에서 학술적 의미가 크다. 기존의 ‘양자 상대성 원리(QPR)’는 초광속 로렌츠 변환을 허용함으로써, 특수 상대성 이론의 기본 가정인 빛속도 상한을 형식적으로 깨뜨린다. 그러나 저자는 이 변환 자체가 물리적 실재를 의미하지 않으며, 실제 물리학은 실험적 운영 정의에 의해 규정된다고 강조한다. 특히 양자 중첩을 ‘다중 경로’를 그리는 행위가 아니라, 서로 다른 대안이 간섭 고리에서 재결합할 때 나타나는 관측 가능한 위상 차이와 확률 분포로 정의한다는

작은 건물 모델을 활용한 방 레이아웃 자동 생성 혁신

작은 건물 모델을 활용한 방 레이아웃 자동 생성 혁신

본 논문은 건축 설계 자동화라는 실용적 과제에 트랜스포머 기반의 시퀀스‑투‑시퀀스 모델을 적용한 점에서 의미가 크다. 기존 연구들은 주로 2D 평면도나 3D 모델을 직접 입력으로 사용하거나, 규칙 기반 시스템에 의존해 레이아웃을 생성하였다. 그러나 이러한 방식은 복잡한 공간 제약을 충분히 반영하기 어렵고, 데이터 요구량이 높으며, 일반화 능력이 제한적이다. SBM은 ‘룸 엔벨로프’라는 최소한의 입력만으로도 방 내부의 가구 배치, 동선, 기능 구역을 동시에 고려한 레이아웃을 생성한다는 점에서 입력 효율성이 뛰어나다. 모델 아키텍처는

JPEG DCT 기반 초고해상도 학습으로 데이터 로딩 2·5배 가속

JPEG DCT 기반 초고해상도 학습으로 데이터 로딩 2·5배 가속

본 논문은 딥러닝 기반 이미지 복원 분야에서 흔히 간과되는 데이터 전처리 단계, 즉 JPEG 디코딩 과정이 전체 파이프라인의 효율성을 크게 저해한다는 점을 정확히 짚어냈다. JPEG 포맷은 이미지 데이터를 8×8 블록 단위의 이산 코사인 변환(DCT) 계수와 양자화 테이블로 압축하는데, 이 과정에서 원본 픽셀값을 복원하기 위해서는 역변환과 역양자화가 필요하다. 이러한 연산은 CPU 중심의 작업으로, GPU 가속이 가능한 딥러닝 연산과는 별도로 수행되며 메모리 대역폭과 I/O 병목을 초래한다. 논문은 이러한 병목을 해소하기 위해, D

Learning
LLM 지식재산 보호를 위한 가중치 기반 지문 기술 SELF

LLM 지식재산 보호를 위한 가중치 기반 지문 기술 SELF

SELF 논문은 LLM의 지식재산 보호를 위한 근본적인 접근법을 제시한다는 점에서 의미가 크다. 기존 연구들은 주로 모델의 출력 행동(예: 특정 프롬프트에 대한 응답)이나 구조적 메타데이터(예: 레이어별 파라미터 분포)를 활용해 지문을 생성했으며, 이러한 방식은 공격자가 모델을 미세조정하거나 가중치를 재배열하는 경우 쉽게 회피될 수 있었다. SELF는 이러한 문제점을 해결하기 위해 ‘내재적 가중치 기반’이라는 새로운 패러다임을 도입한다. 구체적으로, 어텐션 메커니즘의 가중치 행렬을 특이값 분해(SVD)와 고유값 분해(EVD)로 분석

교육 난이도 분석을 위한 콘형 모델

교육 난이도 분석을 위한 콘형 모델

본 논문은 교육용 텍스트의 난이도 평가에 있어 기존의 단순 통계 기반 접근법이 갖는 한계를 지적하고, 의미론적 임베딩 공간을 활용한 새로운 프레임워크를 제시한다. 현재 자연어 처리 분야에서는 Word2Vec, GloVe, FastText, BERT, RoBERTa 등 수십 가지 임베딩 기법이 존재하며, 각각이 텍스트의 의미적 유사성을 다른 방식으로 포착한다. 그러나 교육 현장에서 요구되는 “난이도”라는 추상적 특성은 단순한 의미 유사도와는 별개의 차원을 가진다. 따라서 어떤 임베딩이 난이도 구분에 가장 적합한지를 사전에 알기 어렵다

Model
디퓨전 기반 지도 융합으로 실시간 HD 맵 생성

디퓨전 기반 지도 융합으로 실시간 HD 맵 생성

본 논문은 자율주행 차량이 필요로 하는 고정밀 지도(HD 맵)를 실시간으로 생성하기 위한 새로운 접근법을 제시한다. 기존의 HD 맵은 사전 구축된 정적 지도에 의존했으며, 도로 공사, 일시적 차선 변경 등 환경 변화에 즉각적으로 대응하지 못하는 한계가 있었다. 반면, 전 세계적으로 널리 배포되는 표준정밀 지도(SD 맵, 예: OpenStreetMap)는 최신성을 유지하기는 어려우나, 대략적인 도로 구조와 위치 정보를 제공한다는 점에서 유용한 ‘거친 사전(prior)’으로 활용될 수 있다. 논문은 이러한 저해상도 사전을 고해상도 센서

멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

본 연구는 최근 급부상하고 있는 멀티모달 기초 모델, 특히 비전‑언어 모델(Vision‑Language Model, VLM)의 기상 분야 적용 가능성을 최초로 시도한 사례라 할 수 있다. 전통적인 해상예보는 기상 관측값(위성, 레이더, 관측소 등)을 인간 기상학자가 해석하고, 정형화된 텍스트 형식으로 재작성하는 복합적인 워크플로우를 요구한다. 이러한 과정은 높은 인적 비용과 시간 지연을 초래하며, 특히 급변하는 기상 상황에 대한 실시간 대응력을 저해한다. 연구팀은 먼저 격자형 기상 데이터를 시간‑공간 차원을 포함한 비디오 시퀀스로

Model
의료 대화형 AI 안전성 향상을 위한 반복적 사후 정렬 프레임워크

의료 대화형 AI 안전성 향상을 위한 반복적 사후 정렬 프레임워크

본 논문은 의료 현장에서 LLM 기반 대화형 보조 시스템이 직면한 두 가지 핵심 과제—‘위험한 요청에 대한 과잉 순응’과 ‘무해한 요청에 대한 과잉 거부’를 동시에 해결하고자 하는 시도를 담고 있다. 이를 위해 저자들은 기존 사후 정렬(Post‑Deployment Alignment) 접근법에 Kahneman‑Tversky Optimization(KTO)과 Direct Preference Optimization(DPO)을 결합한 새로운 프레임워크를 설계하였다. KTO는 인간의 인지 편향을 모델링해 위험 신호에 대한 민감도를 조절하고,

텍스트 기반 훈련을 위한 텍스트 인쇄 이미지 활용 저비용 LVLM 데이터 생성 전략

텍스트 기반 훈련을 위한 텍스트 인쇄 이미지 활용 저비용 LVLM 데이터 생성 전략

본 논문은 대형 비전‑언어 모델(LVLM)의 학습 비용을 크게 낮출 수 있는 새로운 데이터 생성 방식을 제시한다는 점에서 의미가 크다. 기존 LVLM은 이미지‑텍스트 쌍을 대규모로 수집해야 하는데, 이는 촬영·저작권·프라이버시 등 여러 제약으로 인해 특히 의료·법률·산업 현장 등 특수 도메인에서 어려움을 겪는다. 반면 텍스트는 웹·논문·보고서 등에서 손쉽게 확보할 수 있으며, 대형 언어 모델(LLM)을 이용해 자동으로 변형·확장할 수 있다. 그러나 텍스트만으로 LVLM을 학습하면 ‘모달리티 격차(modality gap)’가 발생한다

Model
3D 공간 언어 이해를 위한 지시 기반 마스킹 전략

3D 공간 언어 이해를 위한 지시 기반 마스킹 전략

본 논문은 3D 장면‑언어 멀티모달 모델에서 디코더의 어텐션 마스크가 성능에 미치는 영향을 심도 있게 탐구한다는 점에서 큰 의의를 가진다. 기존의 LLM 기반 3D 추론 방법들은 자연어 처리에서 검증된 인과적(causal) 마스크를 그대로 차용했는데, 이는 텍스트가 순차적 구조를 갖는다는 전제에 기반한다. 그러나 3D 객체는 공간적 위치와 관계에 의해 정의되며, 객체 간 순서는 의미가 없거나 오히려 방해가 될 수 있다. 인과 마스크는 이러한 순서‑무관성을 무시하고, 객체 토큰이 이전 토큰에만 의존하도록 강제함으로써 공간적 상호작용을

LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

본 논문은 자연어‑논리 변환 작업에서 LLM의 환각 문제를 완화하기 위한 실용적인 접근법을 제시한다는 점에서 의미가 크다. 첫째, 저자는 “자연어 → 논리식 → CNF”라는 3단계 파이프라인을 명확히 정의하고, 각 단계에서 발생할 수 있는 오류 원인을 분석한다. 특히, 논리식 생성 단계에서 LLM이 문맥을 오해하거나 논리 연산자를 잘못 선택하는 경우가 빈번히 발생한다는 점을 지적하고, 이를 자체 정의 문법으로 제한함으로써 모델이 허용된 구조 내에서만 출력을 생성하도록 강제한다. 이러한 문법 기반 필터링은 기존의 후처리 방식보다 사전

Model
깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

본 논문은 현재 가장 널리 사용되는 트랜스포머 기반 대형 언어 모델(Large Language Model, LLM)이 “깊이 일반화(depth generalization)”라는 중요한 차원에서 한계를 보인다는 점을 명확히 규명한다. 기존 연구는 주로 시퀀스 길이가 훈련 데이터보다 길어질 때 모델이 어떻게 일반화되는지를 탐구했으며, 이를 “길이 일반화”라고 부른다. 그러나 실제 자연어와 수학·논리 문제에서는 단순히 시퀀스가 길어지는 것이 아니라, 괄호·연산자·논리 연산자의 중첩 구조가 깊어지는 경우가 빈번하다. 이러한 중첩 구조는 스

Model
비디오만으로 공간 인지와 행동 계획을 구현하는 비디오포스페이셜

비디오만으로 공간 인지와 행동 계획을 구현하는 비디오포스페이셜

VIDEO4SPATIAL은 최근 비디오 기반 인공지능 연구에서 눈에 띄는 전환점을 제공한다. 기존 연구들은 주로 RGB‑D, 포즈 추정, 혹은 3D 메쉬와 같은 다중 모달리티를 결합해 공간 정보를 보강했지만, 이 논문은 순수 비디오 프레임만으로 동일하거나 그 이상의 성능을 달성한다는 점에서 혁신적이다. 핵심은 두 가지 설계 선택에 있다. 첫째, 데이터 큐레이션 단계에서 ‘시공간 일관성’과 ‘다양한 시점 전이’를 강조한 고품질 시퀀스를 선별함으로써 모델이 자연스러운 움직임과 물체 변화를 학습하도록 유도했다. 둘째, 프레임워크 내부에

스파크 단계별 검증을 활용한 참조 없는 프로세스 보상 모델 학습

스파크 단계별 검증을 활용한 참조 없는 프로세스 보상 모델 학습

본 논문은 강화학습(RL)에서 핵심적인 보상 설계 문제를 새로운 관점에서 해결한다. 전통적인 PRM은 단계별 정답 레퍼런스나 인간 주석에 의존해 학습 데이터를 구축한다. 그러나 이러한 데이터는 비용이 많이 들고, 특히 수학·과학·코드와 같이 정답이 복잡하거나 존재하지 않을 때는 실용성이 떨어진다. SPARK는 이 한계를 “생성‑검증” 루프를 통해 극복한다. 첫 번째 단계에서 생성기 모델은 프롬프트에 따라 다채로운 풀이 경로를 생성한다. 여기서 중요한 점은 다양성을 확보하기 위해 온도 조절, 샘플링 기법 등을 활용해 다수의 후보 풀이

Learning
에너지 수율을 극대화하는 차세대 디지털 트윈 솔루션

에너지 수율을 극대화하는 차세대 디지털 트윈 솔루션

본 논문은 태양전지 연구에서 가장 실용적인 목표 중 하나인 연간 에너지 수율(EY) 최적화를 위한 통합 시뮬레이션 프레임워크를 제시한다. 기존의 계산 접근법은 광학, 전기, 열, 재료 과학 등 각각의 분야를 별도로 다루는 경우가 많아, 실제 현장 적용 시 발생하는 복합적인 변수들을 동시에 고려하기 어렵다. 이러한 한계를 극복하기 위해 저자들은 ‘차별 가능한 디지털 트윈(Differentiable Digital Twin)’이라는 개념을 도입하였다. 디지털 트윈은 물리적 시스템을 가상 공간에 정밀히 복제하는 기술이며, 여기서 차별 가능

패널투패치 계층적 구조를 활용한 바이오메디컬 비전 언어 사전학습 데이터 파이프라인

패널투패치 계층적 구조를 활용한 바이오메디컬 비전 언어 사전학습 데이터 파이프라인

Panel2Patch는 바이오메디컬 이미지‑텍스트 학습 분야에서 기존의 “그림‑전체” 접근법이 갖는 근본적인 한계를 뛰어넘는다. 전통적인 사전학습 파이프라인은 논문에 실린 복합적인 멀티패널 그림을 하나의 이미지‑캡션 쌍으로 단순화한다. 이 과정에서 각 패널이 전달하는 구체적인 실험 결과, 세포 구조, 혹은 마커 라벨링과 같은 미세한 의미가 손실된다. 임상의나 연구자는 실제 진단·분석 단계에서 특정 영역을 확대해 확인하므로, 이러한 미세 정보가 모델에 반영되지 않으면 실제 활용도는 제한적이다. Panel2Patch는 먼저 그림 레이아

프리리얼2i 사전 학습 실수형 모델을 복소수 형태로 변환한 초저비트 양자화

프리리얼2i 사전 학습 실수형 모델을 복소수 형태로 변환한 초저비트 양자화

Fairy2i 논문은 현재 LLM 양자화 연구에서 가장 중요한 두 가지 문제—메모리·연산 비용 절감과 기존 사전 학습 모델의 재활용—를 동시에 해결하려는 시도로 평가할 수 있다. 첫 번째 핵심 기여는 “실수형 레이어와 광선형 복소수 매핑 사이의 손실 없는 수학적 동등성”을 증명한 점이다. 기존의 복소수 신경망은 실수와 허수 성분을 별도로 학습해야 하는 구조적 제약이 있었으며, 이는 사전 학습된 실수형 가중치를 그대로 옮겨올 수 없게 만들었다. 저자들은 넓게 정의된 복소수 선형 연산(광선형 변환)을 이용해 실수 가중치를 두 개의 실수

LLM 기반 에이전트 프레임워크 현황과 개발자 요구 분석

LLM 기반 에이전트 프레임워크 현황과 개발자 요구 분석

본 논문은 LLM(대형 언어 모델) 기반 에이전트 프레임워크라는 비교적 새로운 연구 영역에 대한 포괄적인 실증 조사를 수행했다는 점에서 학술적·실무적 의미가 크다. 첫 번째 강점은 데이터 수집 규모이다. 1,575개의 실제 오픈소스 프로젝트와 8,710개의 개발자 토론을 메타데이터로 활용함으로써, 단순히 문헌 조사에 머무르지 않고 현장 실무에서 발생하는 구체적인 문제와 사용 패턴을 포착했다. 특히 10개의 대표 프레임워크를 선정하는 과정에서 ‘별(star)’·‘포크(fork)’·‘활동성’ 등 객관적인 지표와 함께 토론 내용의 질적

Framework
고밀도 레이스트랙 메모리를 위한 압축 기반 다중비트 오류 정정 기법

고밀도 레이스트랙 메모리를 위한 압축 기반 다중비트 오류 정정 기법

본 연구는 차세대 고밀도 비휘발성 메모리인 레이스트랙 메모리(RTM)의 신뢰성 문제를 근본적으로 해결하고자 하는 시도이다. RTM은 전통적인 SRAM에 비해 10배 이상 높은 집적도를 제공하면서도 읽기·쓰기 지연이 짧아 캐시 메모리 교체 후보로 적합하지만, 전류 흐름을 제어하기 위한 도메인 이동 과정에서 발생하는 스토캐스틱한 오류와 데이터 셔플링 오류가 다중 비트 오류를 초래한다. 이러한 오류는 기존의 단일 비트 ECC(예: SEC)나 2비트 정정 ECC(예: DECTED)로는 충분히 방어할 수 없으며, 다중 비트 정정을 위해서는

Data
뇌파로부터 제스처를 재구성하는 새로운 딥러닝 프레임워크

뇌파로부터 제스처를 재구성하는 새로운 딥러닝 프레임워크

본 논문은 뇌 영상(fMRI)과 언어, 그리고 몸짓(gesture)이라는 세 가지 서로 다른 모달리티 사이의 매핑을 직접 학습하기 어려운 현실적인 문제를 창의적으로 해결한다는 점에서 학술적 의의가 크다. 첫 번째 핵심은 ‘비연계 데이터’를 활용한다는 점이다. 기존의 뇌‑이미지 혹은 뇌‑언어 재구성 연구는 fMRI와 목표 출력(이미지, 텍스트) 사이에 1:1 매칭이 보장된 데이터셋을 전제로 한다. 그러나 뇌와 동시에 기록된 제스처 데이터는 실험 설계상의 제약과 비용 때문에 거의 존재하지 않는다. 저자들은 이러한 제약을 우회하기 위해

단답형 구성형 질문 자동 채점 근접 데이터 활용 프레임워크

단답형 구성형 질문 자동 채점 근접 데이터 활용 프레임워크

본 연구가 다루는 핵심 문제는 ‘구성형 짧은 답변 채점’이라는 교육 현장의 난제이다. 전통적인 자동 채점 시스템은 객관식처럼 정답이 명확히 정의된 경우에만 높은 정확도를 보이며, 자유 서술형 답변은 표현 다양성, 어휘 선택, 문맥적 의미 등 복합적인 변수를 포함한다. 따라서 사전 정의된 루브릭 없이도 정확히 채점하려면 방대한 학습 데이터와 정교한 의미 이해가 필요하다. 저자들은 이러한 난점을 극복하기 위해 ‘근접 데이터(near‑domain data)’라는 개념을 도입한다. 이는 동일하거나 유사한 주제·난이도의 과거 시험 문항과 학

Data
대규모 데이터베이스를 위한 단일 서버 PIR 가속기 IVE와 DRAM 기반 고처리량 설계

대규모 데이터베이스를 위한 단일 서버 PIR 가속기 IVE와 DRAM 기반 고처리량 설계

프라이빗 정보 검색(PIR)은 사용자가 어떤 레코드를 조회했는지 서버에 노출되지 않도록 하는 암호학적 프로토콜로, 특히 클라우드 서비스나 의료·금융 데이터베이스와 같이 개인정보 보호가 필수적인 분야에서 중요한 역할을 한다. 전통적인 다중 서버 PIR은 서버 간 협업을 전제로 하여 통신 오버헤드와 신뢰 관계 설정이 복잡하지만, 단일 서버 PIR은 서버 하나만 있으면 되므로 배포가 간단하고 비용 효율적이다. 최근 동형암호(Homomorphic Encryption, HE) 기반 단일 서버 PIR가 연구되면서, 암호문 상태에서 직접 연산이

모듈형 트랜스듀서 기반 세계 모델 분해 프레임워크

모듈형 트랜스듀서 기반 세계 모델 분해 프레임워크

이 논문이 제시하는 핵심 아이디어는 ‘트랜스듀서’를 이용해 세계 모델을 모듈화하고, 그 모듈들을 역으로 분해함으로써 병렬 처리와 해석 가능성을 동시에 확보한다는 점이다. 트랜스듀서는 관측·행동·보상 등 복합적인 상호작용을 하나의 입력‑출력 관계로 추상화한 구조로, POMDP(부분 관측 마코프 결정 과정)를 일반화한다. 기존 연구에서는 여러 트랜스듀서를 순차적으로 연결해 복잡한 시스템을 구성하는 ‘합성’ 방법이 주로 다루어졌으며, 이는 설계 단계에서는 직관적이지만 실제 운용 단계에서는 전체 모델이 거대해져 연산 비용이 급증하고, 내부

Model
법률 AI의 환각 방지를 위한 그래프 기반 정합성 평가 프레임워크

법률 AI의 환각 방지를 위한 그래프 기반 정합성 평가 프레임워크

본 논문은 법률 분야에서 인공지능 기반 자동 문서 생성이 직면한 가장 핵심적인 문제인 ‘환각(hallucination)’을 그래프 이론을 활용해 체계적으로 해결하려는 시도다. 기존의 환각 탐지 방법은 주로 텍스트 간 의미 유사도를 계산하는 방식에 의존한다. 이러한 접근법은 문맥상 유사해 보이지만 실제로는 중요한 엔터티(예: 당사자명, 사건 일자, 조항 번호)가 잘못 교체되거나 누락되는 경우를 포착하지 못한다. 법률 문서는 작은 엔터티의 변형만으로도 판결 결과에 큰 영향을 미칠 수 있기 때문에, 보다 정밀하고 해석 가능한 검증 메커니

System Detection
세계 정합성을 위한 강화학습과 그라운드 제어

세계 정합성을 위한 강화학습과 그라운드 제어

본 논문이 제시하는 “Reinforcement Learning with World Grounding”(RLWG) 접근법은 기존 비디오 기반 세계 모델이 겪는 기하학적 불일치 문제를 근본적으로 해결하려는 시도이다. 전통적인 비디오 세계 모델은 주로 프레임‑간 재구성 손실을 최소화함으로써 학습되는데, 이러한 손실은 시각적 일관성은 확보하지만 물리적·기하학적 제약을 충분히 반영하지 못한다. 결과적으로 모델이 생성한 가상 환경은 인간이 직관적으로 인식하는 물리 법칙과 어긋나는 경우가 빈번하다. RLWG는 이러한 한계를 극복하기 위해 두 가

Model
스페이시오템포럴 피라미드 플로우를 활용한 효율적 기후 에뮬레이션

스페이시오템포럴 피라미드 플로우를 활용한 효율적 기후 에뮬레이션

본 논문은 기후 과학과 머신러닝이 교차하는 최전선에서, 기존 생성 모델이 갖는 근본적인 한계를 뛰어넘는 혁신적인 프레임워크를 제시한다. 현재 대부분의 기후 에뮬레이션은 고해상도 물리 기반 모델을 직접 실행하거나, 저해상도 통계 모델에 의존한다. 전자는 계산 비용이 천문학적으로 높고, 후자는 복잡한 비선형 상호작용을 충분히 포착하지 못한다. 특히, 날씨 수준의 자기회귀 방식은 시간 단계마다 순차적으로 샘플링해야 하므로 장기 시뮬레이션(수십 년~수백 년)에서는 시간 복잡도가 선형적으로 증가한다. 이러한 구조적 제약은 비정상적인 외부 강

시뮬레이션‑실측 격차를 메우는 얕은 순환 디코더 기반 데이터 동화 프레임워크

시뮬레이션‑실측 격차를 메우는 얕은 순환 디코더 기반 데이터 동화 프레임워크

본 논문은 현대 센서 네트워크가 직면한 두 가지 근본적인 한계, 즉 측정 포인트의 희소성 및 시뮬레이션 모델의 불완전성을 동시에 해결하려는 시도로서, 머신러닝 기반 데이터 동화 프레임워크 DA‑SHRED 를 제시한다. 기존 데이터 동화 기법은 주로 칼만 필터, 변분 동화, 혹은 최근의 딥러닝 기반 접근법에 의존해 왔으며, 이들은 고차원 상태 공간을 직접 다루는 경우 계산 비용이 급격히 증가하거나, 물리적 제약을 충분히 반영하지 못한다는 문제점을 안고 있다. DA‑SHRED 는 이러한 문제점을 회피하기 위해 먼저 SHRED 라는 얕은

Data Model
신경연산자를 활용한 초대질량 블랙홀 서브그리드 모델링

신경연산자를 활용한 초대질량 블랙홀 서브그리드 모델링

초대질량 블랙홀(SMBH)과 그 숙주 은하의 공동 진화는 현대 천체물리학에서 가장 난제 중 하나이다. 물리적 과정이 블랙홀 주변의 밀리파섹 규모에서 은하 전체의 메가파섹 규모에 이르기까지 10⁹배에 달하는 거리와 시간 스케일을 포괄한다는 점에서, 전통적인 첫 원리 시뮬레이션은 계산 자원 한계로 인해 실현 불가능하다. 따라서 연구자들은 ‘서브그리드’ 접근법을 사용해 미세 스케일의 물리학을 거시 스케일 시뮬레이션에 삽입한다. 기존 서브그리드 모델은 보통 고정된 효율 파라미터(예: Eddington 제한, α 디스크 모델)나 이론적 추정

Framework
제로오버헤드 인트로스펙션으로 비용과 보상을 동시에 예측하는 ZIPRC

제로오버헤드 인트로스펙션으로 비용과 보상을 동시에 예측하는 ZIPRC

본 논문은 현재 대형 언어 모델(LLM)이 직면한 메타인지 부재 문제를 짚고, 이를 해결하기 위한 새로운 인프라스트럭처인 ZIP‑RC(Zero‑overhead Introspective Prediction of Reward and Cost)를 제시한다. 기존의 Best‑of‑N 방식은 고정된 샘플 수를 미리 정해두고 모든 후보에 대해 동일한 비용을 소모한다. 이는 생성 과정 중에 “이 정도면 충분한가?”라는 판단을 내릴 근거가 부족해, 실제로는 marginal benefit가 거의 없는 추가 샘플까지도 수행하게 만든다. 또한, 모델

지시와 정책의 공동 진화 기반 강화학습

지시와 정책의 공동 진화 기반 강화학습

본 논문은 RLVR(강화학습 기반 검증 보상) 시스템에서 지시문이 정적인 설계에 머무르는 한계를 정확히 짚어낸다. LLM은 사전 학습된 언어 모델이지만, 실제 환경에서의 행동 정책은 지속적으로 변화한다. 따라서 초기 설계된 프롬프트가 최적이 아닐 가능성이 크며, 정책이 진화함에 따라 지시문도 동적으로 조정될 필요가 있다. INSPO는 이러한 요구를 충족시키기 위해 ‘지시‑정책 공동 진화’라는 새로운 학습 루프를 도입한다. 핵심 아이디어는 지시문을 개별적인 개체로 보고, 강화학습 보상을 각 지시문에 귀속시켜 성능 기반 선택·삭제 과정

커뮤니티 품질이 인플루언스 최대화에 미치는 영향 α계층 군집 기반 확산 실험

커뮤니티 품질이 인플루언스 최대화에 미치는 영향 α계층 군집 기반 확산 실험

이 논문은 인플루언스 최대화 문제를 해결하기 위한 두 가지 접근법을 체계적으로 비교함으로써, 커뮤니티 탐지 품질이 실제 확산 성능에 미치는 영향을 실증적으로 규명한다. 첫 번째 접근법은 기존의 계층 군집(Hierarchical Clustering) 알고리즘을 사용해 얻은 비교적 저품질의 커뮤니티 구조를 기반으로 시드 노드를 선정한다. 두 번째 접근법은 저자들이 이전 연구에서 제안한 α‑계층 군집(α‑Hierarchical Clustering) 알고리즘을 적용해, 보다 명확한 모듈성(modularity)과 내부 결속력을 가진 고품질

혁신을 측정하는 AI 에이전트 벤치마크 인노짐

혁신을 측정하는 AI 에이전트 벤치마크 인노짐

InnoGym이 제시하는 가장 큰 혁신은 “혁신성”이라는 추상적 개념을 정량화하려는 시도에 있다. 기존의 LLM·에이전트 평가는 주로 정답률, 실행 시간, 토큰 비용 등 효율성 지표에 집중했으며, 이는 모델이 기존 지식을 재현하는 능력은 잘 측정하지만, 새로운 아이디어를 창출하는 능력은 거의 드러내지 못한다. InnoGym은 이를 보완하기 위해 두 축, 즉 performance gain과 novelty를 동시에 측정한다. performance gain은 현재까지 보고된 최적 솔루션 대비 얼마나 개선했는지를 백분율 혹은 절대값으로 나

희소 스펙 메모리 효율적인 자기 추측 디코딩

희소 스펙 메모리 효율적인 자기 추측 디코딩

이 논문은 최근 대형 언어 모델이 복잡한 문제를 해결하기 위해 체인‑오브‑쓰루(Chain‑of‑Thought)와 같은 긴 추론 과정을 거칠 때, 메모리 대역폭이 주요 병목으로 작용한다는 점을 정확히 짚어낸다. 전통적인 디코딩 방식에서는 매 토큰마다 KV‑Cache에 저장된 모든 이전 토큰에 대해 완전 어텐션을 수행한다. 토큰 수가 늘어날수록 KV‑Cache의 크기도 선형적으로 증가하고, 이에 따라 메모리 읽기·쓰기 비용이 급증한다. 특히 GPU 메모리 용량이 제한적인 상황에서 이러한 메모리‑바운드 특성은 실시간 응용에 큰 제약이 된

Model
극심한 비용 비대칭을 극복한 인과 기반 예측 유지보수

극심한 비용 비대칭을 극복한 인과 기반 예측 유지보수

예측 유지보수는 설비 고장을 사전에 감지해 생산 중단을 방지하고, 유지보수 비용을 최소화하려는 핵심 전략이다. 그러나 제조 현장에서는 고장을 놓치는 비용이 오경보(불필요한 정비) 비용보다 수십 배에서 수백 배까지 크게 차이 나는 ‘비용 비대칭’ 현상이 존재한다. 이 비대칭은 단순히 정확도(accuracy)나 AUC와 같은 통계적 지표만으로는 모델의 실제 가치를 평가하기 어렵게 만든다. 예를 들어, 고장 발생률이 3.3%에 불과한 상황에서 99% 정확도를 달성하더라도 오경보가 과다하면 전체 비용이 급증한다. 따라서 비용 기반 목표 함

색채 위장 이미지 이해를 위한 대규모 멀티태스크 벤치마크

색채 위장 이미지 이해를 위한 대규모 멀티태스크 벤치마크

본 논문은 현재 Vision‑Language Model(VLM)이 직면한 핵심 한계인 ‘피겨‑그라운드 구분’ 문제를 정량적으로 평가하기 위해 매우 체계적인 벤치마크를 설계했다는 점에서 의미가 크다. 기존 VLM 평가 데이터셋은 주로 명확한 객체와 배경을 구분할 수 있는 이미지에 초점을 맞추었으며, 색채 위장(camouflage)과 같이 인간의 시각 시스템조차도 인지하기 어려운 상황을 충분히 반영하지 못했다. ChromouVQA는 이러한 공백을 메우기 위해 이시하라 점 플레이트(Ishihara plates)를 변형한 색채 위장 이미지

Model
인과 머신러닝 기반 사전 유지보수 원인 규명과 최적 개입

인과 머신러닝 기반 사전 유지보수 원인 규명과 최적 개입

본 논문은 제조 현장에서 예측 중심의 유지보수에서 한 단계 나아가 인과관계를 명시적으로 모델링함으로써 ‘처방형 유지보수(prescriptive maintenance)’를 구현하려는 시도를 상세히 제시한다. 먼저 기존 예측 모델이 “스푸리어스(correlational) 패턴”에 의존한다는 비판은 실제 현장 사례와 일치한다. 센서 데이터가 풍부하지만, 고장 원인에 대한 도메인 지식이 부족한 경우 모델이 잡아내는 신호는 종종 우연히 발생한 상관관계에 불과하다. 이러한 상황에서 단순히 고장 확률만을 제공받아도, 현장 엔지니어는 “어디를 고

Framework Model
인도 수학 올림피아드 문제를 활용한 자동 형식화 벤치마크

인도 수학 올림피아드 문제를 활용한 자동 형식화 벤치마크

자동 형식화(auto‑formalization) 문제는 자연어로 서술된 수학 문제를 기계가 이해할 수 있는 형식 언어, 여기서는 Lean 4와 같은 정리 증명 시스템으로 변환하는 과정을 의미한다. 기존 연구에서는 주로 서양 수학 교과서나 공개된 정리 데이터베이스를 활용했지만, 이러한 자료는 이미 많은 자동 형식화 도구에 의해 학습되어 과적합(over‑fitting) 위험이 있다. 반면 INDIMATHBENCH는 인도 수학 올림피아드라는 비교적 독립적인 출처에서 312개의 문제를 수집함으로써 데이터 다양성을 크게 확대한다. 이는 LL

기계 학습 삭제의 프라이버시 위협과 텔레포테이션 방어: WARP의 실효성 분석

기계 학습 삭제의 프라이버시 위협과 텔레포테이션 방어: WARP의 실효성 분석

기계 학습 모델에서 특정 샘플을 ‘삭제’하는 작업은 실제 서비스 환경에서 개인정보 보호 규정을 준수하기 위해 필수적이다. 전통적인 완전 재학습 방식은 비용이 많이 들고 실시간 서비스에 적용하기 어렵다. 따라서 최근에는 근사 삭제(approximate unlearning) 기법이 활발히 연구되고 있다. 이들 기법은 원본 모델 파라미터를 약간만 조정하거나, 손실 함수에 삭제 대상 샘플을 제외한 형태로 재학습함으로써 빠른 삭제를 목표로 한다. 하지만 본 논문이 지적하듯, 근사 삭제는 두 가지 구조적 특성 때문에 프라이버시 위험을 내포한다

Learning
No Image

문서검색 알고리즘의 효율성 향상: 접미사 트리 최적화를 통한 혁신

이 논문은 텍스트 검색 알고리즘의 효율성을 크게 높이는 방법을 제시한다. 특히 접미사 트리를 최적화함으로써, 현대 데이터셋에서 발생하는 복잡성과 규모 문제를 해결하고자 한다. 전통적인 Naive Search, KMP, Boyer Moore 알고리즘들은 기본적이지만, 그 효율성이 현대의 방대한 데이터 처리 요구사항에 부합하지 못한다. 이 연구에서는 접미사 트리를 Splitting 및 Ukkonen 알고리즘을 통해 최적화하는 방법을 제시하며, 이를 통해 선형 시간과 공간 효율성을 달성할 수 있음을 보여준다. 특히, Ukkonen 알고리

다항식 신경 전단 사프 신경망 스펙트럼 기반 이질성 그래프 학습 혁신

다항식 신경 전단 사프 신경망 스펙트럼 기반 이질성 그래프 학습 혁신

Sheaf Neural Network(이하 SheafNN)는 전통적인 그래프 신경망이 정점마다 동일한 특성 공간을 가정하는 한계를 넘어, 각 정점에 독립적인 벡터 공간(스토크)을 할당하고, 인접 정점 사이에 선형 전송(제한) 맵을 학습함으로써 이질성(homophily)과 과평활(over‑smoothing) 문제를 구조적으로 해결한다는 점에서 혁신적이다. 그러나 현재 가장 널리 사용되는 확산 메커니즘인 Neural Sheaf Diffusion(NSD)은 두 가지 주요 병목을 가진다. 첫째, 정규화 과정에서 SVD(특이값 분해)를 사용

대규모 지역 에너지 소비 프로파일 모델링 및 계층적 분류 알고리즘

대규모 지역 에너지 소비 프로파일 모델링 및 계층적 분류 알고리즘

이 연구는 에너지 관리 분야에서 기존에 흔히 사용되던 개별 건물 단위의 현장 조사 방식이 갖는 비효율성을 근본적으로 해결하려는 시도로 평가할 수 있다. 저자는 프리토폴로지(pretopology)라는 수학적 프레임워크를 선택했는데, 이는 전통적인 위상수학이 제공하는 개념보다 더 유연하게 ‘근접성’과 ‘포함 관계’를 정의할 수 있다. 프리토폴로지 공간에서는 점들의 근접성을 나타내는 ‘프리클로저’ 연산과, 집합을 확장시키는 ‘프리내부’ 연산을 통해 데이터 간의 구조적 관계를 정량화한다. 이러한 연산을 기반으로 다중 기준(예: 위치, 크기

System

< 분야별 논문 현황 (Total: 829) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
9
HEP-EX
7
HEP-PH
12
HEP-TH
7
MATH-PH
4
NUCL-TH
1
Quantum Physics
12

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키