General

'General' 카테고리의 모든 글

총 273개의 글
시간순 정렬
작은 건물 모델을 활용한 방 레이아웃 자동 생성 혁신

작은 건물 모델을 활용한 방 레이아웃 자동 생성 혁신

본 논문은 건축 설계 자동화라는 실용적 과제에 트랜스포머 기반의 시퀀스‑투‑시퀀스 모델을 적용한 점에서 의미가 크다. 기존 연구들은 주로 2D 평면도나 3D 모델을 직접 입력으로 사용하거나, 규칙 기반 시스템에 의존해 레이아웃을 생성하였다. 그러나 이러한 방식은 복잡한 공간 제약을 충분히 반영하기 어렵고, 데이터 요구량이 높으며, 일반화 능력이 제한적이다. SBM은 ‘룸 엔벨로프’라는 최소한의 입력만으로도 방 내부의 가구 배치, 동선, 기능 구역을 동시에 고려한 레이아웃을 생성한다는 점에서 입력 효율성이 뛰어나다. 모델 아키텍처는

의료 대화형 AI 안전성 향상을 위한 반복적 사후 정렬 프레임워크

의료 대화형 AI 안전성 향상을 위한 반복적 사후 정렬 프레임워크

본 논문은 의료 현장에서 LLM 기반 대화형 보조 시스템이 직면한 두 가지 핵심 과제—‘위험한 요청에 대한 과잉 순응’과 ‘무해한 요청에 대한 과잉 거부’를 동시에 해결하고자 하는 시도를 담고 있다. 이를 위해 저자들은 기존 사후 정렬(Post‑Deployment Alignment) 접근법에 Kahneman‑Tversky Optimization(KTO)과 Direct Preference Optimization(DPO)을 결합한 새로운 프레임워크를 설계하였다. KTO는 인간의 인지 편향을 모델링해 위험 신호에 대한 민감도를 조절하고,

비디오만으로 공간 인지와 행동 계획을 구현하는 비디오포스페이셜

비디오만으로 공간 인지와 행동 계획을 구현하는 비디오포스페이셜

VIDEO4SPATIAL은 최근 비디오 기반 인공지능 연구에서 눈에 띄는 전환점을 제공한다. 기존 연구들은 주로 RGB‑D, 포즈 추정, 혹은 3D 메쉬와 같은 다중 모달리티를 결합해 공간 정보를 보강했지만, 이 논문은 순수 비디오 프레임만으로 동일하거나 그 이상의 성능을 달성한다는 점에서 혁신적이다. 핵심은 두 가지 설계 선택에 있다. 첫째, 데이터 큐레이션 단계에서 ‘시공간 일관성’과 ‘다양한 시점 전이’를 강조한 고품질 시퀀스를 선별함으로써 모델이 자연스러운 움직임과 물체 변화를 학습하도록 유도했다. 둘째, 프레임워크 내부에

스파크 단계별 검증을 활용한 참조 없는 프로세스 보상 모델 학습

스파크 단계별 검증을 활용한 참조 없는 프로세스 보상 모델 학습

본 논문은 강화학습(RL)에서 핵심적인 보상 설계 문제를 새로운 관점에서 해결한다. 전통적인 PRM은 단계별 정답 레퍼런스나 인간 주석에 의존해 학습 데이터를 구축한다. 그러나 이러한 데이터는 비용이 많이 들고, 특히 수학·과학·코드와 같이 정답이 복잡하거나 존재하지 않을 때는 실용성이 떨어진다. SPARK는 이 한계를 “생성‑검증” 루프를 통해 극복한다. 첫 번째 단계에서 생성기 모델은 프롬프트에 따라 다채로운 풀이 경로를 생성한다. 여기서 중요한 점은 다양성을 확보하기 위해 온도 조절, 샘플링 기법 등을 활용해 다수의 후보 풀이

Learning
에너지 수율을 극대화하는 차세대 디지털 트윈 솔루션

에너지 수율을 극대화하는 차세대 디지털 트윈 솔루션

본 논문은 태양전지 연구에서 가장 실용적인 목표 중 하나인 연간 에너지 수율(EY) 최적화를 위한 통합 시뮬레이션 프레임워크를 제시한다. 기존의 계산 접근법은 광학, 전기, 열, 재료 과학 등 각각의 분야를 별도로 다루는 경우가 많아, 실제 현장 적용 시 발생하는 복합적인 변수들을 동시에 고려하기 어렵다. 이러한 한계를 극복하기 위해 저자들은 ‘차별 가능한 디지털 트윈(Differentiable Digital Twin)’이라는 개념을 도입하였다. 디지털 트윈은 물리적 시스템을 가상 공간에 정밀히 복제하는 기술이며, 여기서 차별 가능

프리리얼2i 사전 학습 실수형 모델을 복소수 형태로 변환한 초저비트 양자화

프리리얼2i 사전 학습 실수형 모델을 복소수 형태로 변환한 초저비트 양자화

Fairy2i 논문은 현재 LLM 양자화 연구에서 가장 중요한 두 가지 문제—메모리·연산 비용 절감과 기존 사전 학습 모델의 재활용—를 동시에 해결하려는 시도로 평가할 수 있다. 첫 번째 핵심 기여는 “실수형 레이어와 광선형 복소수 매핑 사이의 손실 없는 수학적 동등성”을 증명한 점이다. 기존의 복소수 신경망은 실수와 허수 성분을 별도로 학습해야 하는 구조적 제약이 있었으며, 이는 사전 학습된 실수형 가중치를 그대로 옮겨올 수 없게 만들었다. 저자들은 넓게 정의된 복소수 선형 연산(광선형 변환)을 이용해 실수 가중치를 두 개의 실수

LLM 기반 에이전트 프레임워크 현황과 개발자 요구 분석

LLM 기반 에이전트 프레임워크 현황과 개발자 요구 분석

본 논문은 LLM(대형 언어 모델) 기반 에이전트 프레임워크라는 비교적 새로운 연구 영역에 대한 포괄적인 실증 조사를 수행했다는 점에서 학술적·실무적 의미가 크다. 첫 번째 강점은 데이터 수집 규모이다. 1,575개의 실제 오픈소스 프로젝트와 8,710개의 개발자 토론을 메타데이터로 활용함으로써, 단순히 문헌 조사에 머무르지 않고 현장 실무에서 발생하는 구체적인 문제와 사용 패턴을 포착했다. 특히 10개의 대표 프레임워크를 선정하는 과정에서 ‘별(star)’·‘포크(fork)’·‘활동성’ 등 객관적인 지표와 함께 토론 내용의 질적

Framework
뇌파로부터 제스처를 재구성하는 새로운 딥러닝 프레임워크

뇌파로부터 제스처를 재구성하는 새로운 딥러닝 프레임워크

본 논문은 뇌 영상(fMRI)과 언어, 그리고 몸짓(gesture)이라는 세 가지 서로 다른 모달리티 사이의 매핑을 직접 학습하기 어려운 현실적인 문제를 창의적으로 해결한다는 점에서 학술적 의의가 크다. 첫 번째 핵심은 ‘비연계 데이터’를 활용한다는 점이다. 기존의 뇌‑이미지 혹은 뇌‑언어 재구성 연구는 fMRI와 목표 출력(이미지, 텍스트) 사이에 1:1 매칭이 보장된 데이터셋을 전제로 한다. 그러나 뇌와 동시에 기록된 제스처 데이터는 실험 설계상의 제약과 비용 때문에 거의 존재하지 않는다. 저자들은 이러한 제약을 우회하기 위해

단답형 구성형 질문 자동 채점 근접 데이터 활용 프레임워크

단답형 구성형 질문 자동 채점 근접 데이터 활용 프레임워크

본 연구가 다루는 핵심 문제는 ‘구성형 짧은 답변 채점’이라는 교육 현장의 난제이다. 전통적인 자동 채점 시스템은 객관식처럼 정답이 명확히 정의된 경우에만 높은 정확도를 보이며, 자유 서술형 답변은 표현 다양성, 어휘 선택, 문맥적 의미 등 복합적인 변수를 포함한다. 따라서 사전 정의된 루브릭 없이도 정확히 채점하려면 방대한 학습 데이터와 정교한 의미 이해가 필요하다. 저자들은 이러한 난점을 극복하기 위해 ‘근접 데이터(near‑domain data)’라는 개념을 도입한다. 이는 동일하거나 유사한 주제·난이도의 과거 시험 문항과 학

Data
모듈형 트랜스듀서 기반 세계 모델 분해 프레임워크

모듈형 트랜스듀서 기반 세계 모델 분해 프레임워크

이 논문이 제시하는 핵심 아이디어는 ‘트랜스듀서’를 이용해 세계 모델을 모듈화하고, 그 모듈들을 역으로 분해함으로써 병렬 처리와 해석 가능성을 동시에 확보한다는 점이다. 트랜스듀서는 관측·행동·보상 등 복합적인 상호작용을 하나의 입력‑출력 관계로 추상화한 구조로, POMDP(부분 관측 마코프 결정 과정)를 일반화한다. 기존 연구에서는 여러 트랜스듀서를 순차적으로 연결해 복잡한 시스템을 구성하는 ‘합성’ 방법이 주로 다루어졌으며, 이는 설계 단계에서는 직관적이지만 실제 운용 단계에서는 전체 모델이 거대해져 연산 비용이 급증하고, 내부

Model
스페이시오템포럴 피라미드 플로우를 활용한 효율적 기후 에뮬레이션

스페이시오템포럴 피라미드 플로우를 활용한 효율적 기후 에뮬레이션

본 논문은 기후 과학과 머신러닝이 교차하는 최전선에서, 기존 생성 모델이 갖는 근본적인 한계를 뛰어넘는 혁신적인 프레임워크를 제시한다. 현재 대부분의 기후 에뮬레이션은 고해상도 물리 기반 모델을 직접 실행하거나, 저해상도 통계 모델에 의존한다. 전자는 계산 비용이 천문학적으로 높고, 후자는 복잡한 비선형 상호작용을 충분히 포착하지 못한다. 특히, 날씨 수준의 자기회귀 방식은 시간 단계마다 순차적으로 샘플링해야 하므로 장기 시뮬레이션(수십 년~수백 년)에서는 시간 복잡도가 선형적으로 증가한다. 이러한 구조적 제약은 비정상적인 외부 강

시뮬레이션‑실측 격차를 메우는 얕은 순환 디코더 기반 데이터 동화 프레임워크

시뮬레이션‑실측 격차를 메우는 얕은 순환 디코더 기반 데이터 동화 프레임워크

본 논문은 현대 센서 네트워크가 직면한 두 가지 근본적인 한계, 즉 측정 포인트의 희소성 및 시뮬레이션 모델의 불완전성을 동시에 해결하려는 시도로서, 머신러닝 기반 데이터 동화 프레임워크 DA‑SHRED 를 제시한다. 기존 데이터 동화 기법은 주로 칼만 필터, 변분 동화, 혹은 최근의 딥러닝 기반 접근법에 의존해 왔으며, 이들은 고차원 상태 공간을 직접 다루는 경우 계산 비용이 급격히 증가하거나, 물리적 제약을 충분히 반영하지 못한다는 문제점을 안고 있다. DA‑SHRED 는 이러한 문제점을 회피하기 위해 먼저 SHRED 라는 얕은

Data Model
제로오버헤드 인트로스펙션으로 비용과 보상을 동시에 예측하는 ZIPRC

제로오버헤드 인트로스펙션으로 비용과 보상을 동시에 예측하는 ZIPRC

본 논문은 현재 대형 언어 모델(LLM)이 직면한 메타인지 부재 문제를 짚고, 이를 해결하기 위한 새로운 인프라스트럭처인 ZIP‑RC(Zero‑overhead Introspective Prediction of Reward and Cost)를 제시한다. 기존의 Best‑of‑N 방식은 고정된 샘플 수를 미리 정해두고 모든 후보에 대해 동일한 비용을 소모한다. 이는 생성 과정 중에 “이 정도면 충분한가?”라는 판단을 내릴 근거가 부족해, 실제로는 marginal benefit가 거의 없는 추가 샘플까지도 수행하게 만든다. 또한, 모델

커뮤니티 품질이 인플루언스 최대화에 미치는 영향 α계층 군집 기반 확산 실험

커뮤니티 품질이 인플루언스 최대화에 미치는 영향 α계층 군집 기반 확산 실험

이 논문은 인플루언스 최대화 문제를 해결하기 위한 두 가지 접근법을 체계적으로 비교함으로써, 커뮤니티 탐지 품질이 실제 확산 성능에 미치는 영향을 실증적으로 규명한다. 첫 번째 접근법은 기존의 계층 군집(Hierarchical Clustering) 알고리즘을 사용해 얻은 비교적 저품질의 커뮤니티 구조를 기반으로 시드 노드를 선정한다. 두 번째 접근법은 저자들이 이전 연구에서 제안한 α‑계층 군집(α‑Hierarchical Clustering) 알고리즘을 적용해, 보다 명확한 모듈성(modularity)과 내부 결속력을 가진 고품질

혁신을 측정하는 AI 에이전트 벤치마크 인노짐

혁신을 측정하는 AI 에이전트 벤치마크 인노짐

InnoGym이 제시하는 가장 큰 혁신은 “혁신성”이라는 추상적 개념을 정량화하려는 시도에 있다. 기존의 LLM·에이전트 평가는 주로 정답률, 실행 시간, 토큰 비용 등 효율성 지표에 집중했으며, 이는 모델이 기존 지식을 재현하는 능력은 잘 측정하지만, 새로운 아이디어를 창출하는 능력은 거의 드러내지 못한다. InnoGym은 이를 보완하기 위해 두 축, 즉 performance gain과 novelty를 동시에 측정한다. performance gain은 현재까지 보고된 최적 솔루션 대비 얼마나 개선했는지를 백분율 혹은 절대값으로 나

색채 위장 이미지 이해를 위한 대규모 멀티태스크 벤치마크

색채 위장 이미지 이해를 위한 대규모 멀티태스크 벤치마크

본 논문은 현재 Vision‑Language Model(VLM)이 직면한 핵심 한계인 ‘피겨‑그라운드 구분’ 문제를 정량적으로 평가하기 위해 매우 체계적인 벤치마크를 설계했다는 점에서 의미가 크다. 기존 VLM 평가 데이터셋은 주로 명확한 객체와 배경을 구분할 수 있는 이미지에 초점을 맞추었으며, 색채 위장(camouflage)과 같이 인간의 시각 시스템조차도 인지하기 어려운 상황을 충분히 반영하지 못했다. ChromouVQA는 이러한 공백을 메우기 위해 이시하라 점 플레이트(Ishihara plates)를 변형한 색채 위장 이미지

Model
인과 머신러닝 기반 사전 유지보수 원인 규명과 최적 개입

인과 머신러닝 기반 사전 유지보수 원인 규명과 최적 개입

본 논문은 제조 현장에서 예측 중심의 유지보수에서 한 단계 나아가 인과관계를 명시적으로 모델링함으로써 ‘처방형 유지보수(prescriptive maintenance)’를 구현하려는 시도를 상세히 제시한다. 먼저 기존 예측 모델이 “스푸리어스(correlational) 패턴”에 의존한다는 비판은 실제 현장 사례와 일치한다. 센서 데이터가 풍부하지만, 고장 원인에 대한 도메인 지식이 부족한 경우 모델이 잡아내는 신호는 종종 우연히 발생한 상관관계에 불과하다. 이러한 상황에서 단순히 고장 확률만을 제공받아도, 현장 엔지니어는 “어디를 고

Framework Model
인도 수학 올림피아드 문제를 활용한 자동 형식화 벤치마크

인도 수학 올림피아드 문제를 활용한 자동 형식화 벤치마크

자동 형식화(auto‑formalization) 문제는 자연어로 서술된 수학 문제를 기계가 이해할 수 있는 형식 언어, 여기서는 Lean 4와 같은 정리 증명 시스템으로 변환하는 과정을 의미한다. 기존 연구에서는 주로 서양 수학 교과서나 공개된 정리 데이터베이스를 활용했지만, 이러한 자료는 이미 많은 자동 형식화 도구에 의해 학습되어 과적합(over‑fitting) 위험이 있다. 반면 INDIMATHBENCH는 인도 수학 올림피아드라는 비교적 독립적인 출처에서 312개의 문제를 수집함으로써 데이터 다양성을 크게 확대한다. 이는 LL

No Image

문서검색 알고리즘의 효율성 향상: 접미사 트리 최적화를 통한 혁신

이 논문은 텍스트 검색 알고리즘의 효율성을 크게 높이는 방법을 제시한다. 특히 접미사 트리를 최적화함으로써, 현대 데이터셋에서 발생하는 복잡성과 규모 문제를 해결하고자 한다. 전통적인 Naive Search, KMP, Boyer Moore 알고리즘들은 기본적이지만, 그 효율성이 현대의 방대한 데이터 처리 요구사항에 부합하지 못한다. 이 연구에서는 접미사 트리를 Splitting 및 Ukkonen 알고리즘을 통해 최적화하는 방법을 제시하며, 이를 통해 선형 시간과 공간 효율성을 달성할 수 있음을 보여준다. 특히, Ukkonen 알고리

대규모 지역 에너지 소비 프로파일 모델링 및 계층적 분류 알고리즘

대규모 지역 에너지 소비 프로파일 모델링 및 계층적 분류 알고리즘

이 연구는 에너지 관리 분야에서 기존에 흔히 사용되던 개별 건물 단위의 현장 조사 방식이 갖는 비효율성을 근본적으로 해결하려는 시도로 평가할 수 있다. 저자는 프리토폴로지(pretopology)라는 수학적 프레임워크를 선택했는데, 이는 전통적인 위상수학이 제공하는 개념보다 더 유연하게 ‘근접성’과 ‘포함 관계’를 정의할 수 있다. 프리토폴로지 공간에서는 점들의 근접성을 나타내는 ‘프리클로저’ 연산과, 집합을 확장시키는 ‘프리내부’ 연산을 통해 데이터 간의 구조적 관계를 정량화한다. 이러한 연산을 기반으로 다중 기준(예: 위치, 크기

System
긴 꼬리 데이터에서 신경 붕괴 정렬을 통한 성능 향상

긴 꼬리 데이터에서 신경 붕괴 정렬을 통한 성능 향상

이 논문은 최근 각광받고 있는 ‘신경 붕괴(Neural Collapse, NC)’ 현상을 긴 꼬리 데이터 분류 문제에 적용함으로써, 기존 방법론이 놓치고 있던 핵심적인 정렬 문제를 새롭게 조명한다. NC는 학습이 진행될수록 클래스별 특징 평균(feature means)과 최종 선형 분류기의 가중치가 서로 정렬되고, 전체 클래스가 단순체 등각 긴밀 프레임(simplex ETF) 구조를 이루는 현상이다. 이 구조는 클래스 간 각도가 동일하고, 각 클래스의 특징이 서로 정규 직교하는 최적의 기하학적 배치를 제공한다는 점에서 이론적·실용적

Learning
위기 상황 이미지 지리화를 위한 LLM 기반 주의 메커니즘 결합 VPR 프레임워크

위기 상황 이미지 지리화를 위한 LLM 기반 주의 메커니즘 결합 VPR 프레임워크

본 논문은 사회 미디어에서 수집된 스트리트 뷰 이미지를 활용하여 도시 홍수와 같은 위기 상황을 실시간으로 모니터링하는 문제를 해결하기 위해 VPR AttLLM 프레임워크를 제안한다. 기존의 VPR 모델들은 교차 소스 시나리오에서 발생하는 시각적 왜곡과 도메인 이동으로 인해 성능이 저하되는 한계가 있다. 이를 해결하기 위해, 본 논문은 LLMs의 의미론적 추론 및 지리 공간 지식을 주의 메커니즘을 통해 기존 VPR 파이프라인에 통합하는 모델에 무관한 프레임워크를 제시한다. VPR AttLLM은 LLMs을 활용하여 이미지 내에서 위치

몬테카를로 기반 신경 연산자 경량 파라메트릭 PDE 솔루션 연산자

몬테카를로 기반 신경 연산자 경량 파라메트릭 PDE 솔루션 연산자

Monte Carlo형 신경 연산자(MCNO)는 기존 신경 연산자 연구에서 두드러진 두 가지 한계를 동시에 해결하려는 시도로 볼 수 있다. 첫 번째는 Fourier Neural Operator(FNO)와 같은 스펙트럼 기반 방법이 전제하는 주기성·평행이동 불변성 가정이다. 이러한 가정은 정규 격자나 주기적 경계조건을 갖는 문제에선 효율적이지만, 복잡한 지오메트리·비주기적 경계·비균일 격자에서는 적용이 어려워진다. MCNO는 커널을 임의의 점 집합 위에 정의하고, 이 점들을 Monte Carlo 샘플링으로 선택함으로써 스펙트럼 가정을

Learning

< 분야별 논문 현황 (Total: 768) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
9
HEP-EX
7
HEP-PH
12
HEP-TH
7
MATH-PH
4
NUCL-TH
1
Quantum Physics
10

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키