게시글

모든 게시글 목록입니다. 최신순으로 정렬되어 있습니다.

총 821개의 게시글
총 17페이지
주관적 기능을 통한 목표 설정의 비밀

주관적 기능을 통한 목표 설정의 비밀

이 논문은 인간 지능과 인공 시스템 간의 차이를 탐색하면서, 특히 목표 설정 과정에 초점을 맞춥니다. 주관적 기능이라는 개념을 도입함으로써, 에이전트 자체의 내재적인 특징에 근거한 목표 설정 방법을 제안합니다. 이는 인간 지능에서 보이는 즉흥적인 목표 합성 능력을 인공 시스템에도 부여하려는 노력입니다. 논문은 예측 오류를 최소화하는 것을 주관적 기능의 한 형태로 설명하며, 이를 통해 에이전트가 자신의 경험과 학습에 따라 새로운 목표를 설정하고 추구할 수 있음을 제시합니다. 이러한 접근 방식은 심리학에서의 자기효능감 이론이나 신경과학

지속가능한 농업을 위한 공간적 변이성 인식 기계학습 프레임워크

지속가능한 농업을 위한 공간적 변이성 인식 기계학습 프레임워크

FTBSC KGML은 농생태계 탄소 순환량을 정확하고 비용 효율적으로 측정하기 위한 혁신적인 머신러닝 프레임워크입니다. 기존 접근법의 한계를 극복하기 위해, 이 연구는 전이 학습과 공간적 변이성을 활용하는 방법론을 제안합니다. 특히, FTBSC KGML은 사전 훈련 및 미세 조정 과정을 통해 각 지역의 특성에 맞춰 모델을 개선하고, 이를 통해 데이터가 부족한 지역에서도 높은 정확도를 유지할 수 있습니다. 이 프레임워크는 원격 측정 GPP, 기후 및 토양 공변량과 같은 다양한 데이터 소스를 활용하여 농생태계의 탄소 순환을 효과적으로

Learning
지식 기반에 의한 엔티티 집합의 구동

지식 기반에 의한 엔티티 집합의 구동

본 연구는 지식 기반(Knowledge Base)이 어떻게 다양한 엔티티 집합을 구동하는지에 대한 심층적인 분석을 제공합니다. 이 논문은 아마도 데이터 관리, 정보 검색, 또는 인공지능 시스템의 개선과 관련된 주제를 다루고 있을 것입니다. 지식 기반은 특정 도메인에서 수집된 정보와 그 정보 간의 관계를 저장하는 구조로, 이는 엔티티 집합을 효과적으로 관리하고 활용하는 데 중요한 역할을 합니다. 연구자들은 아마도 이러한 시스템이 어떻게 효율성을 향상시키고 새로운 인사이트를 제공하는지에 대해 탐구했을 것입니다.

No Image

ELVIS: 비디오 스트리밍 품질과 재생의 균형

ELVIS 아키텍처는 전통적인 코드크와의 차별화된 접근법으로 주목할 만합니다. 이 논문은 서버 측 인코딩 최적화와 클라이언트 측 생성형 인페인팅을 결합하여 중복 데이터를 제거하고 재구성하는 방법을 제시합니다. 이러한 접근법은 대역폭 사용을 줄이면서도 높은 화질을 유지할 수 있는 새로운 가능성을 열어줍니다. ELVIS의 모듈식 설계는 다양한 코드크, 인페인팅 모델, 품질 지표를 쉽게 통합할 수 있게 하며, 이는 미래 기술 발전에 대한 유연성과 확장성을 제공합니다. 또한, 현재 기술이 베이스라인보다 최대 11 VMAF 점을 개선한 결과

Learning
강화학습 에이전트의 안정적 학습을 위한 하이퍼볼릭 특징 공간 활용

강화학습 에이전트의 안정적 학습을 위한 하이퍼볼릭 특징 공간 활용

본 논문은 강화학습(Reinforcement Learning, RL) 에이전트의 성능 향상을 위해 하이퍼볼릭 특징 공간을 활용하는 방법에 대해 깊게 분석하고 있다. 특히, 포앙카레 공(Poincaré Ball)과 하이퍼볼로이드(Hyperboloid) 모델에서 핵심 연산들의 그래디언트를 분석함으로써, 큰 노름(embedding norm)은 그래디언트 기반 훈련을 불안정하게 만들고 근접 정책 최적화(Proximal Policy Optimization, PPO)의 신뢰 영역 위반(trust region violation)을 초래한다는 것

Learning
모델 간 추론 연쇄 교환 가능성 탐구

모델 간 추론 연쇄 교환 가능성 탐구

본 논문은 추론 연쇄의 중간 산출물을 다른 모델이 이어받을 수 있는지를 실험적으로 검증함으로써, LLM 연구 분야에 새로운 시각을 제공한다. 첫 번째 핵심 기여는 ‘추론 교환 가능성’이라는 개념을 정의하고, 이를 정량화하기 위한 평가 프레임워크를 구축한 점이다. 저자들은 토큰‑레벨 로그‑확률을 기준으로 추론을 세 단계(초기, 중간, 후기)로 트렁케이트하고, 각 단계마다 프로세스 보상 모델(PRM)을 적용해 논리적 일관성과 정답 정확도를 측정한다. 이때 사용된 두 베이스 모델인 Gemma‑3‑4B‑IT와 LLaMA‑3.1‑70B‑In

Model
문제 모델링을 통한 안정적인 계획 수립

문제 모델링을 통한 안정적인 계획 수립

이 논문은 대형 언어 모델(LLMs)이 복잡한 계획 작업에서 제약 위반, 일관성 없는 상태 추적 및 취약한 솔루션을 생성하는 문제를 해결하기 위해 Model First Reasoning(MFR)이라는 새로운 접근법을 제안합니다. MFR은 두 단계로 구성되는데, 첫 번째 단계에서는 LLM이 문제의 구조화된 모델을 명시적으로 구성하고, 두 번째 단계에서는 이 모델에 대한 추론 및 계획을 수행합니다. 이러한 방법은 인간의 과학적 추론, 고전 AI 계획, 그리고 의사결정 인지 모델에서 영감을 받아 제안되었습니다. 실험 결과 MFR은 다양한

Model
시간 렌즈 멀티모달 대형 언어 모델의 비디오 시간 정렬을 위한 고품질 데이터와 효율적 알고리즘 설계

시간 렌즈 멀티모달 대형 언어 모델의 비디오 시간 정렬을 위한 고품질 데이터와 효율적 알고리즘 설계

Time‑Lens 논문은 비디오 시간 정렬(VTG)이라는 비교적 좁은 영역에 초점을 맞추면서도, 현재 멀티모달 대형 언어 모델(MLLM) 연구에서 간과되고 있는 두 가지 핵심 요소—데이터 품질과 알고리즘 설계—를 체계적으로 조명한다. 첫 번째 기여는 기존 VTG 벤치마크가 갖는 ‘라벨 노이즈’와 ‘주석 불일치’ 문제를 정량적으로 분석하고, 이를 해결하기 위해 재주석 작업을 수행한 TimeLens‑Bench이다. 재주석 과정에서는 시간 구간의 경계 정확도, 언어 표현의 일관성, 그리고 시각‑언어 연관성 등을 엄격히 검증했으며, 그 결

No Image

양자 신경망 개발을 위한 시각화 도구 XQAI Eyes

이 논문은 양자 신경망(QNNs) 개발에서 중요한 역할을 하는 인코더 선택에 초점을 맞추고 있습니다. QNNs는 양자 컴퓨팅과 뉴럴 네트워크 아키텍처를 결합한 것으로, 고차원 데이터와 얽힘된 데이터의 처리 속도 향상 및 효율성을 제공합니다. 그러나 적절한 인코더 선택은 시스템적인 지침 부족과 실험적 접근 방식 때문에 어려움을 겪고 있습니다. 이 논문에서는 이러한 문제를 해결하기 위해 XQAI Eyes라는 새로운 시각화 도구를 제안하고 있습니다. XQAI Eyes는 QNN 개발자가 클래식 데이터 특징과 해당 양자 상태 사이의 비교를

Network
역인과성 초점 알고리즘으로 대규모 후보 공간 탐색 혁신

역인과성 초점 알고리즘으로 대규모 후보 공간 탐색 혁신

이 논문은 “희귀하지만 가치 있는 솔루션을 찾는 문제”를 기존의 탐색‑최적화 접근법과는 다른 관점에서 접근한다는 점에서 의미가 크다. 전통적인 방법은 보통 목표 함수를 직접 최적화하거나, 강화 학습에서는 보상을 최대화하도록 정책을 학습한다. 그러나 후보 공간이 천문학적으로 클 경우, 특히 목표가 희박하게 분포하거나 제약 조건이 복잡하게 얽혀 있을 때, 이러한 방식은 샘플 효율성이 급격히 떨어진다. ICFA는 이러한 상황을 “목표‑조건부 재가중”이라는 개념으로 재구성한다. 구체적으로, 먼저 기존의 제안 샘플러(예: 언어 모델, 무작위

No Image

의료 AI의 진화: Ophiuchus로 시각적 사고 혁신

이 논문은 의료 AI 분야에서 중요한 발전을 제시하고 있다. Ophiuchus 프레임워크는 MLLMs가 복잡한 시각적 정보를 처리하는 데 필요한 세 가지 핵심 기능을 제공한다: 추가적인 시각적 증거의 필요성을 판단할 수 있는 능력, 의료 이미지 내에서 정확하게 탐사해야 할 위치를 결정할 수 있는 능력, 그리고 이들 정보를 다중 모달 추론 체인에 통합하는 능력. 이러한 기능은 MLLMs가 복잡한 시각적 데이터를 처리하고 분석하는 데 있어 중요한 도약을 이루게 한다. Ophiuchus의 핵심은 세 단계로 구성된 훈련 전략이다: 첫째,

Analysis
No Image

카디널리티 추정을 개선하는 TiCard: 데이터베이스 최적화의 새로운 지평

이 논문은 카디널리티 추정 문제를 해결하기 위해 TiCard라는 새로운 프레임워크를 소개하고 있습니다. 카디널리티 추정은 데이터베이스 쿼리 최적화에서 중요한 역할을 하지만, 기존의 방법들은 상관관계를 고려하지 못하거나 특정 작업 부하에 맞는 별도의 훈련 파이프라인과 통합이 필요하다는 문제점이 있습니다. TiCard는 이러한 제약을 극복하기 위해 데이터베이스의 원래 추정기를 보완하는 방식으로 설계되었습니다. TiCard는 두 가지 주요 구성 요소를 사용합니다: 그레디언트 부스팅 회귀기(Gradient Boosting Regressor

Learning
터널 결함 자동 검사 위한 새로운 데이터셋 소개

터널 결함 자동 검사 위한 새로운 데이터셋 소개

본 논문은 터널 결함 검사를 위한 새로운 데이터셋을 소개하며, 이는 딥러닝 모델의 학습과 성능 개선에 중요한 역할을 합니다. 터널은 교통 인프라의 주요 구성 요소로, 안전성을 유지하기 위해 정기적인 점검이 필수적입니다. 하지만 전통적인 수동 검사 방법은 시간 소모가 많고 비용이 높으며 주관적이어서 제한점이 있습니다. 모바일 매핑 시스템과 딥러닝의 발전으로 자동화된 시각 검사가 가능해졌지만, 이를 위한 충분한 데이터셋이 부족하여 그 효과가 제한되어 왔습니다. 본 논문에서 소개하는 새로운 데이터셋은 세 가지 다른 종류의 터널 라이닝에

Learning Data Detection
해석 가능한 결정트리 기반 선호 베이지안 최적화

해석 가능한 결정트리 기반 선호 베이지안 최적화

본 논문은 베이지안 최적화의 한계점을 극복하고자 결정트리를 새로운 대리 모델로 제시한다. 이는 가우시안 프로세스(GP)를 사용하는 기존 방법과 달리 해석성이 뛰어나며, 연속형 및 범주형 데이터 처리 능력이 강화되어 실제 적용에 유용하다. 결정트리는 복잡한 모델을 이해하기 쉽게 시각화할 수 있어, 최적화 과정에서 얻은 결과를 직관적으로 해석하고 활용하는 데 도움이 된다. 특히, 본 논문의 실험에서는 날카로운 함수에 대한 성능 향상이 확인되었으며, 이는 실제 세계에서 자주 발생하는 불규칙적인 데이터 분포에 효과적일 수 있음을 시사한다.

Learning Model
현대 프로세서 설계에서의 정확하고 효율적인 전력 모델링: ReadyPower 프레임워크

현대 프로세서 설계에서의 정확하고 효율적인 전력 모델링: ReadyPower 프레임워크

본 논문의 핵심은 현대 프로세서 설계에서 전력 모델링의 중요성을 강조하고, 이를 위해 고전적인 분석형 아키텍처 수준의 전력 모델과 ML 기반 전력 모델의 한계를 지적하며 새로운 접근 방식을 제안하는 것입니다. ReadyPower 프레임워크는 기존의 문제점을 해결하기 위해 다양한 수준의 매개변수를 도입하여 McPAT 분석 모델에 통합함으로써, 고정밀도와 신뢰성을 제공합니다. ReadyPower의 주요 장점은 세 가지입니다: 첫째, 신뢰성. ReadyPower는 실제 프로세서 구현과 아키텍처 수준의 분석 모델 간의 불일치를 해결함으로써

Framework Model
확산모델을 이용한 텍스트 지도 이미지 편집의 면역화: 시맨틱 불일치와 인식적 저하를 통한 보호

확산모델을 이용한 텍스트 지도 이미지 편집의 면역화: 시맨틱 불일치와 인식적 저하를 통한 보호

이 논문은 텍스트 지시 이미지 편집에 대한 악용 가능성과 그로 인한 우려를 다루며, 이를 방어하기 위한 새로운 접근법을 제안합니다. 기존의 면역화 성공 평가 방법은 주로 시각적 유사성에 초점을 맞추고 있지만, 이는 공격자의 의도와의 시맨틱 불일치라는 본질적인 문제를 해결하지 못한다는 점에서 한계가 있습니다. 논문에서는 이러한 문제를 해결하기 위해 Synergistic Intermediate Feature Manipulation (SIFM) 방법을 제안합니다. SIFM은 중간 확산 특징을 전략적으로 변형하여 원래 편집 경로와의 시맨틱

고주파 신호 학습을 강화하는 쿼리 컨볼루션

고주파 신호 학습을 강화하는 쿼리 컨볼루션

본 논문은 고주파 신호 학습의 어려움을 해결하기 위해 Qonvolutions이라는 새로운 접근법을 제시합니다. 이 방법은 기존의 신경망이 고주파 정보를 처리하는 데 어려움을 겪는 문제를 해결하고자 저주파 신호와 쿼리(예: 좌표)를 합성하여 고주파 신호를 더 잘 학습할 수 있게 합니다. Qonvolutions은 간단한 방법임에도 불구하고, 1D 회귀, 2D 초해상도, 2D 이미지 회귀 및 새로운 시점 합성(NVS)과 같은 다양한 작업에서 우수한 성능을 보여줍니다. 특히 NVS에서는 가우시안 스팟팅과 결합하여 실제 복잡한 장면에서도 라

Learning
대형 언어 모델의 낙태 낙인 인식 한계와 다층적 일관성 부재

대형 언어 모델의 낙태 낙인 인식 한계와 다층적 일관성 부재

이 논문은 인공지능 윤리와 인간‑컴퓨터 상호작용 분야에서 매우 시의적절한 질문을 제기한다. 낙태와 같이 사회적·문화적 갈등이 심한 주제는 개인의 내면적 판단, 주변인과의 관계, 그리고 사회 구조적 압력이라는 세 층위에서 복합적으로 작동한다. 저자들은 이러한 다층적 구조를 정량화한 ILAS(Individual Level Abortion Stigma Scale)를 기준으로, GPT‑4, Claude, Llama 2 등 현재 가장 널리 사용되는 다섯 개 LLM을 627명의 가상 페르소나에 적용해 체계적인 실험을 설계했다. 첫 번째 핵심

No Image

대화 분기: AI와의 효율적인 프로그래밍 탐색

이 논문은 대형 언어 모델(LLMs)의 한계를 극복하기 위해 ContextBranch라는 새로운 시스템을 제시하고 있습니다. LLMs는 여러 차례에 걸친 대화에서 성능이 크게 저하되며, 이로 인해 개발자가 다양한 접근 방식을 탐색하는 데 어려움을 겪습니다. ContextBranch는 체크포인트, 분기, 전환, 주입이라는 네 가지 핵심 기능을 제공하여 사용자가 대화 상태를 캡처하고 고립된 환경에서 다양한 접근 방식을 탐색하며 통합할 수 있도록 합니다. 실험 결과, ContextBranch는 선형 대화보다 2.5% 더 높은 응답 품질을

말ayer 주의 풀링을 활용한 음성 인식 기술 혁신

말ayer 주의 풀링을 활용한 음성 인식 기술 혁신

본 연구에서는 Layer Attentive Pooling (LAP)이라는 새로운 접근법을 제안하고, 이를 통해 사전 학습된 Transformer 모델로부터 얻은 계층별 출력을 효과적으로 통합하는 방법론을 개발했다. LAP의 핵심 아이디어는 각 계층의 중요성을 시간 동적으로 평가하고, 이에 따라 최대 풀링(max pooling)을 사용하여 특징들을 통합하는 것이다. 이 접근법은 기존의 정적 가중 평균 방법보다 더 유연하게 화자 특성의 변화를 포착할 수 있는 장점을 가지고 있다. 또한, 본 논문에서는 LAP과 Attentive Stat

반응형 학습을 통한 수학적 추론 모델의 효율적인 훈련: TRAPO 알고리즘

반응형 학습을 통한 수학적 추론 모델의 효율적인 훈련: TRAPO 알고리즘

본 논문은 강화학습과 준감독 학습을 결합하여 대규모 추론 모델(LRMs)을 효율적으로 훈련하는 방법을 제안하고 있습니다. 특히, TRAPO 알고리즘을 통해 소량의 라벨링 데이터와 많은 비라벨 데이터를 활용해 모델을 안정화시키고, 이를 통해 높은 정확도와 강력한 일반화 성능을 달성할 수 있음을 보여주었습니다. 이 연구는 기존 무감독 RLVR 방법들이 훈련 후기 단계에서 일관성을 유지하지 못하고 모델 붕괴를 겪는 문제를 해결하는 데 중점을 두고 있습니다. TRAPO 알고리즘은 학습 경로 유사성 분석을 통해 신뢰할 수 있는 비라벨 샘플을

Framework Learning
No Image

시뮬레이션 기반 컴퓨터 아키텍처 연구 재현성을 위한 gem5와 gem5 Resources 확장

본 논문은 현재 컴퓨터 아키텍처 연구에서 널리 사용되는 전 시스템 시뮬레이터인 gem5가 직면한 재현성 문제를 체계적으로 진단하고, 이를 해결하기 위한 실질적인 개선안을 제시한다. 첫 번째 문제는 디스크 이미지와 커널, 벤치마크 등 필수 아티팩트를 개별 연구자가 직접 구축해야 하는 비효율성이다. 특히 ISA마다 이미지 생성 절차가 달라 협업과 공유가 어려웠으며, 이미지 품질 검증이 부족해 결과의 신뢰성이 저하될 위험이 있었다. 저자들은 Packer라는 자동화 도구를 도입해 x86, ARM, RISC‑V 세 ISA에 대해 동일한 워크

실시간 다중 사용자 영상 번역을 위한 선형 복합 AI 파이프라인 설계와 평가

실시간 다중 사용자 영상 번역을 위한 선형 복합 AI 파이프라인 설계와 평가

본 논문이 다루는 핵심 문제는 “실시간”이라는 엄격한 시간 제약 하에 복수의 생성형 AI 모델을 연속적으로 실행해야 하는 상황에서 발생하는 시스템 레벨의 병목 현상이다. 전통적인 파이프라인 방식은 각 프레임 혹은 영상 세그먼트에 대해 음성 인식, 번역, 텍스트‑투‑스피치, 영상 합성 등 여러 모델을 순차적으로 호출한다. 이러한 순차 호출은 모델마다 수백 밀리초에서 수초에 이르는 추론 지연을 유발하고, 특히 다중 사용자가 동시에 참여하는 화상 회의에서는 각 사용자의 스트림에 대해 동일한 파이프라인을 독립적으로 적용해야 하므로 전체 연

인간감독의 핵심: AI 윤리와 인간의 번영을 위한 새로운 접근법

인간감독의 핵심: AI 윤리와 인간의 번영을 위한 새로운 접근법

이 논문은 AI 윤리와 인간감독 사이의 연결고리를 탐색하며, 그 중요성을 강조하고 있습니다. EU AI Act를 포함한 여러 지침과 법률들이 인간감독에 대한 명확한 정의나 구체적인 발전 방향을 제시하지 못하는 상황에서, 저자들은 이 개념을 '번영 효능성' 프레임워크 내에서 재정의하고 있습니다. 번영 효능성은 AI 리터러시와 윤리적 판단력을 포함하며, 인간의 필요를 인식하면서도 그 중 일부가 충돌하거나 해롭게 될 수 있다는 점을 인정하는 포괄적인 접근법입니다. 논문은 또한 사람들이 자신의 욕구나 두려움을 AI 시스템에 투영할 가능성을

질문을 통한 인터랙티브 추론 결과 기반 질문 최적화 전략

질문을 통한 인터랙티브 추론 결과 기반 질문 최적화 전략

본 논문은 “질문”이라는 행동을 LLM의 핵심 능력으로 재정의하고, 이를 학습 가능한 정책으로 전환하는 혁신적인 프레임워크를 제시한다. 전통적인 LLM 활용 방식은 주어진 프롬프트에 대해 가능한 한 정확한 답을 생성하는 데 초점을 맞추지만, 실제 고위험 응용에서는 사용자가 제공한 정보가 불완전하거나 모호할 때 추가적인 질의가 필요하다. 이러한 상황을 모델이 스스로 인식하고, 교사 모델(보다 강력한 LLM)에게 보완 정보를 요청하도록 학습시키는 것이 핵심 아이디어이다. ODQS는 두 단계 학습 파이프라인을 사용한다. 첫 번째 단계는

Model
No Image

학습 성과와 연계된 교육 자료 자동 정렬을 위한 임베딩 기반 프레임워크

본 논문은 교육 기술 분야에서 ‘학습 목표와 교육 자료 간 정렬(alignment)’이라는 핵심 문제를 자동화하려는 시도로서, 텍스트 임베딩 모델을 활용한 프레임워크를 제시한다. 연구는 크게 세 단계로 구성된다. 첫 번째 단계에서는 인간이 직접 만든 교육 자료를 기준 데이터셋으로 활용해 여러 LLM 기반 임베딩 모델(Voyage, OpenAI‑Ada 등)을 비교 평가하였다. 여기서 ‘정렬’은 학습 목표와 자료 내용 사이의 의미적 유사성을 수치화한 점수로 정의되며, 인간 평가자들의 라벨링을 정답으로 삼아 모델의 정확도를 측정하였다.

Learning
No Image

3D 이해와 생성을 위한 통합적 추론 프레임워크: CoRe3D

CoRe3D는 3D 이해와 생성의 통합적 추론 프레임워크로, 기존의 다모달 모델에서 중요한 역할을 하는 명시적인 추론 메커니즘을 3D 영역에 확장하는 것을 목표로 한다. 이 연구는 언어와 비전 작업에서 효과적으로 입증된 추론 중심 접근법이 아직 충분히 개발되지 않은 3D 분야에서도 유사한 성과를 낼 수 있다는 가설을 제시한다. CoRe3D의 핵심은 공간적 근거를 갖춘 추론 표현으로, 이를 통해 모델은 3D 잠재 공간을 지역화된 영역으로 분해하고, 이러한 분해된 부분들에 대해 조합적이고 절차적인 방식으로 기하학적 특성을 추론할 수 있

AI 의료진단에서 XAI의 복합적 영향

AI 의료진단에서 XAI의 복합적 영향

본 논문은 인공지능(AI)이 의료 분야에 미치는 복잡한 영향을 탐구하고 있다. 특히, 설명 가능한 AI(XAI)의 도입이 진단 정확도와 의사결정 과정에 어떤 효과를 미치는지를 살펴보았다. 연구에서는 일반인과 내과 의사 두 그룹을 대상으로 실험을 진행하였으며, 이를 통해 XAI가 사용자들의 전문성과 AI 제안의 타이밍에 따라 다양한 결과를 보여주는 것을 확인하였다. 연구결과, 피부 톤 간 균형을 맞춤으로써 AI 지원은 진단 정확도를 높이고 불균형을 줄이는 효과가 있었다. 그러나 LLMs을 통한 설명은 일반 사용자와 내과 의사 사이에서

No Image

SAGA: 유연하고 적응력 있는 시각 모터 제어 프레임워크

본 논문은 SAGA라는 새로운 프레임워크를 소개하며, 이는 다양한 환경과 작업 목표에 걸쳐 일반화할 수 있는 유연하고 적응력 있는 시각 모터 제어를 제공합니다. 핵심 아이디어는 고수준의 의미적 의도와 저수준의 시각 모터 제어를 분리하는 것입니다. 이를 위해 능동성 기반 작업 표현을 사용하여 복잡한 행동을 통일되고 구조화된 형태로 나타냅니다. 다중 모달 기초 모델을 활용하여 SAGA는 로봇의 시각적 관찰에 3D 능동성 히트맵으로 근거를 두어, 작업 관련 엔티티를 강조하고 일반화를 방해할 수 있는 부수적인 외관 변이를 추상화합니다. 이

경제예측을 위한 해석가능 인공지능의 진화

경제예측을 위한 해석가능 인공지능의 진화

이 논문은 계산경제학에서 해석가능 인공지능(XAI)의 중요성을 강조하며, 특히 기계 학습 예측자가 고전적인 경제학적 모델을 능가할 수 있지만 그 내부 작동 원리가 불투명하다는 문제를 해결하기 위해 XAI에 대한 관심이 증가하고 있음을 설명합니다. 논문은 시간 시리즈 데이터의 특성, 즉 자기상관성, 비정상성, 계절성, 혼합 주기, 그리고 제도 변화 등이 표준적인 설명 기법을 불안정하거나 경제적으로 설득력 없게 만들 수 있다는 점에 주목합니다. 이를 해결하기 위해 논문은 XAI 방법론을 세 가지 범주로 분류하고, 각 범주의 특징과 시간

System
No Image

기억관리 시스템 MaRS: 효율성과 프라이버시 보장

이 논문은 생성적 에이전트가 장기 기억을 관리하면서 효율성, 프라이버시 및 비용 제약 조건을 충족하는 방법에 대해 깊게 탐구하고 있습니다. Memory Aware Retention Schema (MaRS)는 이벤트, 의미론적, 사회적, 작업 기억들을 타입화하고 출처를 추적하며 효율적인 검색을 위한 여러 인덱스를 제공하는 구조입니다. 이러한 기반 위에 제안된 6가지 잊음 정책은 각각의 복잡도 분석과 감도에 따른 보존성을 제공하며, 선택적으로 차별적 프라이버시를 보장합니다. 논문에서 소개한 FiFA 벤치마크는 서사 일관성, 목표 완료,

No Image

노이즈 기반 정규화의 새 지평: PerNodeDrop

딥 뉴럴 네트워크는 복잡한 패턴을 학습하는 데 매우 효과적이지만, 이 과정에서 유해한 공적응이 발생하여 일반화 성능이 저하되는 문제를 안고 있습니다. 드롭아웃과 드롭커넥트와 같은 기존의 노이즈 기반 정규화 방법은 이러한 문제를 해결하기 위해 무작위 변동을 주입하지만, 이들 방법은 층이나 배치 단위로 균일한 노이즈를 적용하므로 유용한 공적응까지 억제하는 부작용이 있습니다. 본 연구에서는 PerNodeDrop이라는 새로운 정규화 방법을 제안합니다. PerNodeDrop은 샘플별, 노드별로 변동성을 주입함으로써 기존의 균일한 노이즈 적용

Network
대형언어모델의 일관성 강화: 기업환경에서의 정보 안정성 향상

대형언어모델의 일관성 강화: 기업환경에서의 정보 안정성 향상

본 논문은 대형 언어 모델(LLMs)의 일관성 문제를 해결하기 위한 새로운 접근 방식을 제안합니다. LLMs는 다양한 비즈니스 분야에서 중요한 역할을 하지만, 사용자에게 일관된 정보를 제공하는 데 어려움이 있습니다. 이는 특히 기업 환경에서 중요하며, HR 입문, 고객 지원, 정책 공개 등과 같은 시나리오에서는 정보의 안정성이 필수적입니다. 기존 접근 방식은 사실성 향상이나 확률성을 줄이는 데 중점을 두지만, 의미적으로 동등한 프롬프트 간의 일관성을 보장하지는 못합니다. 본 논문에서 제안하는 방법은 그룹 상대 정책 최적화(GRPO)

Model
레몬: 3D 공간 이해를 위한 통합 변형 모델

레몬: 3D 공간 이해를 위한 통합 변형 모델

이 논문은 대규모 다중 모달 모델(LMMs)의 한계를 극복하고, 특히 3D 데이터 이해에 필요한 새로운 접근법을 제시하고 있습니다. Lemon이라는 이름의 모델은 기존의 분리된 아키텍처와 달리 통합 변형 아키텍처를 사용하여 점 클라우드 데이터와 언어 토큰을 동시에 처리하는 능력을 제공합니다. 이 접근법은 중복되는 인코더를 제거하고, 파라미터 효율성을 높이며, 모델의 확장을 더 효과적으로 지원함으로써 기존의 문제점을 해결합니다. 또한, Lemon은 3D 데이터의 특성에 맞게 구조화된 패치화 및 토큰화 방식을 개발하여 공간적 맥락을 유

Model
No Image

매든 줄리안 진동의 생명주기: AI를 활용한 새로운 이해

이 논문은 매든 줄리안 진동(MJO)의 생명주기를 정확하게 정의하기 위한 새로운 접근법을 제시합니다. MJO는 기후 변동성에서 중요한 역할을 하는데, 그 전파 특성 때문에 이 생명주기의 정의가 어렵습니다. 현재 사용되는 RMM 지수는 수학적 오류를 물리 상태와 혼동하는 문제를 가지고 있으며, 원시 데이터 공간에서 직접 클러스터링을 시도하면 '전파 패널티' 문제가 발생합니다. 이 논문은 이러한 문제를 해결하기 위해 AI 기반 이론 발견 방법론을 도입하였습니다. 이를 통해 MJO의 내재 구조를 객체적으로 탐색할 수 있는 새로운 접근법을

베이지안 전파형 역산을 통한 대규모 지하 모델의 불확실성 인식

베이지안 전파형 역산을 통한 대규모 지하 모델의 불확실성 인식

이 논문은 베이지안 전파형 역산(FWI) 기법을 이용해 지하 모델의 불확실성을 효과적으로 처리하는 방법을 제시하고 있다. 특히, 대규모 현장 조사에서 실용적이지 않다는 문제를 해결하기 위해 확산 기반 사후 표본 추출과 동시 소스 FWI 데이터를 결합한 새로운 접근 방식을 제안한다. 이 방법은 각 단계에서 파 방정식 해의 수를 줄이고, 모델 공간에서 스토캐스틱 정교화 단계를 적용하여 계산 비용을 크게 감소시키면서도 높은 정확성을 유지할 수 있다. 또한, 속도 패치와 볼륨에 대한 조건 없는 확산 사전 훈련을 통해 소스 관련 수치적 오류

Model
No Image

부분적으로 관찰된 컨텍스트에서 효율적인 탐색을 위한 베이지안 프레임워크

본 논문은 부분적으로 관찰되는 컨텍스트와 잠재 변수에 의해 유도되는 의존성을 고려한 새로운 베이지안 프레임워크를 제시합니다. 이 접근법의 핵심은 모든 작업에서 수집된 데이터를 통합하여 전역적인 결합 분포를 학습하면서, 각각의 사용자 또는 작업에 맞는 개인화된 추론을 가능하게 하는 것입니다. 논문에서는 두 가지 주요 불확실성 요인, 즉 팔과 작업 간의 잠재적 보상 의존성에서 발생하는 구조적 불확실성 및 부족한 컨텍스트와 제한된 상호작용 역사로 인해 발생하는 사용자별 불확실성을 식별하고 이를 해결하기 위한 방법을 제시합니다. 논문의 주

양자신경라디언스필드: 3D장면복원을 위한 혁신적인 접근법

양자신경라디언스필드: 3D장면복원을 위한 혁신적인 접근법

본 논문은 3D 장면 복원에서 고전적인 암시적 신경 표현(INRs)의 한계를 극복하기 위해 양자 컴퓨팅 기술을 도입한 혁신적인 접근법을 제안합니다. 특히, Q NeRF는 Nerfacto라는 현존하는 3D 렌더링 프레임워크에 QIREN 모듈을 통합하여 고주파수 세부 사항의 표현력을 향상시키고자 합니다. 이 접근법은 양자 회로가 내재적으로 가진 푸리에 구조를 활용함으로써, 고전적인 신경망이 겪는 스펙트럼 편향성을 완화하는 데 효과적입니다. 논문에서 제시된 하이브리드 양자 클래식 모델은 기존의 클래식 모델과 비교하여 PSNR, SSIM

No Image

연방학습의 로컬 드리프트를 줄이는 피드백 정렬 기법

이 논문은 연방학습(Federated Learning, FL)에서 발생하는 데이터 이질성 문제를 해결하기 위한 새로운 접근법인 FLFA(Federated Learning with Feedback Alignment)에 대해 설명하고 있습니다. 연방학습은 클라이언트 간의 데이터 프라이버시를 보장하면서도 협업 학습을 가능하게 하는 기술입니다. 그러나 각 클라이언트의 데이터가 독립적이고 동일한 분포(IID)가 아닌 경우, 즉 비IID인 경우에는 로컬 모델과 전역 모델 간에 수렴이 어려워지며 이를 로컬 드리프트 현상이라고 합니다. FLFA는

Learning
외환시장 예측의 혁신: EXFormer

외환시장 예측의 혁신: EXFormer

이 논문은 국제 금융에서 오랫동안 해결되지 않았던 문제인 매일의 환율 변동률 예측에 초점을 맞추고 있습니다. 이 연구는 EXFormer이라는 새로운 Transformer 기반 아키텍처를 제시하며, 이를 통해 다양한 시장 요인들에 의해 주도되고 고주파 변동성을 보이는 환율 변동률을 효과적으로 예측할 수 있도록 합니다. 특히, 이 논문은 다중 스케일 추세 인식 자기 주의 메커니즘을 도입하여 서로 다른 수용 필드를 가진 병렬 컨볼루션 브랜치를 사용해 로컬 기울기에 따라 관찰 값을 정렬합니다. 이를 통해 장기 종속성을 유지하면서도 시장 상

인공지능 기반 녹색세탁의 법적 책임: 인도, 미국, EU 비교 분석

인공지능 기반 녹색세탁의 법적 책임: 인도, 미국, EU 비교 분석

본 논문은 AI 기반의 녹색세탁이 기업 지속 가능성 관리에서 중요한 도전 과제임을 강조하고 있다. 녹색세탁은 환경 공시의 불투명성을 가중시키고, 규제 감독을 방해한다. 연구는 인도, 미국, EU를 대상으로 AI 매개 녹색세탁에 대한 범죄 책임을 비교 분석하여, 기존 법률이 인간 의도를 전제로 하여 알고리즘 시스템에서 발생한 속임수에 대해 불합리하게 적용되고 있음을 드러낸다. 이는 현행 사기 및 환경 관련 법률들이 AI가 생성하는 오해를 처리할 수 없게 만드는 문제점을 보여준다. 본 연구는 기존 판례, 법령, 규제 지침을 체계적으로

주제 중심 이미지 생성의 진화: Scone으로 구현되는 통합 이해 생성 방법

주제 중심 이미지 생성의 진화: Scone으로 구현되는 통합 이해 생성 방법

이 논문은 주제 중심 이미지 생성 분야에서 중요한 이슈를 다루고 있다. 특히, 단일 주제에서 다중 주제로의 전환 과정에서 발생하는 구분력 부족 문제에 집중한다. Scone이라는 새로운 접근법을 제시함으로써, 이 논문은 이미지 생성 모델이 복잡한 시나리오에서도 효과적으로 작동할 수 있도록 하는 데 중점을 두고 있다. Scone의 핵심 아이디어는 이해 전문가와 생성 전문가 사이에 의미적인 다리를 만드는 것이다. 이 다리는 입력된 여러 주제들 중에서 올바른 주제를 식별하고 그 정체성을 유지하는 데 필수적이다. 두 단계 훈련 방식을 통해

Model
프라이브: 수직연방학습의 사생활 보호

프라이브: 수직연방학습의 사생활 보호

이 논문은 수직연방학습(VFL)에서 발생하는 특징 추론 공격 문제를 해결하기 위한 새로운 방어 메커니즘인 PRIVEE를 제안하고 있습니다. VFL은 서로 다른 데이터셋을 가진 여러 조직들이 공동의 사용자 샘플에 대해 학습할 수 있는 방법으로, 특히 개인 정보 보호가 중요한 분야에서 유용하게 활용될 수 있습니다. 그러나 이러한 협업 과정에서는 공격자가 모델의 예측 확률을 이용해 다른 참여자의 데이터를 재구성하는 특징 추론 공격에 노출될 위험이 있습니다. PRIVEE는 이 문제를 해결하기 위해 신뢰도 점수를 암호화하여 공유함으로써, 공

Learning
현대 대형 언어 모델의 의식: 가설 검증과 연속 학습의 관점

현대 대형 언어 모델의 의식: 가설 검증과 연속 학습의 관점

본 논문은 현대 대형 언어 모델(LLMs)의 의식 가능성에 대한 철학적이고 과학적인 접근법을 제시하고 있습니다. 저자는 증명 불가능성과 비자명성을 충족하는 이론이 있어야 한다는 요구 사항을 강조하며, 이를 통해 현대 LLMs의 의식 가능성을 검증합니다. 논문은 기존의 인과 구조와 기능에 기반한 의식 이론들이 이러한 요구 조건을 만족하지 못한다는 점을 지적하고 있습니다. LLMs는 입력/출력 기능 측면에서 특정 시스템들과 동등하기 때문에, 그들에 대한 의식 가능성은 증명 불가능성과 비자명성을 충족하는 이론이 존재해야 합니다. 그러나

Learning Model
희소 상황에 대응하는 인간 영감 학습 방법 탐구

희소 상황에 대응하는 인간 영감 학습 방법 탐구

이 논문은 대형 언어 모델(LLMs)의 한계를 극복하기 위해 인간 학습 과정에서 영감을 얻는 새로운 접근법을 제안하고 있습니다. LLMs은 큰 규모의 데이터로부터 일반적인 패턴을 추출하는 데 탁월하지만, 희귀하거나 저자원 상황에서는 이러한 패턴이 데이터 내에 충분히 나타나지 않아 예측 능력이 제한됩니다. 이 문제를 해결하기 위해 논문은 두 가지 메커니즘을 통합하는 인간 영감 학습 프레임워크를 제안합니다: 첫 번째로, '명시적 기록'은 원인 결과 또는 질문 해결책 관계를 상징적 메모리에 저장하여 단일 또는 불규칙한 경험에서도 지속적인

Learning Model
AI 모델 문서 투명성 표준화: 현황과 격차

AI 모델 문서 투명성 표준화: 현황과 격차

이 논문은 AI 모델 문서의 투명성 문제를 체계적으로 분석하고 해결하기 위한 프레임워크를 제시합니다. 특히, 다양한 플랫폼에서 제공되는 AI 모델 문서는 구조와 내용에 일관성이 부족하여 사용자들이 필요한 정보를 쉽게 찾기 어렵다는 점을 지적합니다. 이를 해결하기 위해 EU AI Act Annex IV와 스탠퍼드 투명성 지수를 기반으로 한 가중 투명도 프레임워크를 개발하였습니다. 이 프레임워크는 안전성이 중요한 공개 사항을 우선시하며, 이를 통해 모델의 안전성을 평가하는 데 필요한 정보를 체계적으로 제공합니다. 또한, 논문은 AI 모

Model Framework
AI와 철학자들의 대화: 지식의 메타버스에서의 혁신

AI와 철학자들의 대화: 지식의 메타버스에서의 혁신

이 논문은 대형 언어 모델(LLMs)의 역할에 대한 통념을 재고하고, 이러한 시스템들이 단순히 훈련 데이터를 복제하는 것이 아니라, 적절한 상호작용적 맥락에서 새로운 개념 구조와 창의적인 사고를 발전시킬 수 있음을 입증합니다. 연구는 철학자들의 디지털 재현체가 참여하는 Syntropic Counterpoints 프로젝트를 통해 실제 철학적 논쟁을 분석하고, 이러한 대화에서 추론의 일관성과 반성적인 질문이 어떻게 발생하는지를 탐구합니다. 연구팀은 이러한 발견을 바탕으로 'Epistemoverse'라는 개념을 제안하며, 이는 인간과 기

뇌파 신호의 3차원 그래프 매트릭스 변환을 통한 발작 예측 모델 개발

뇌파 신호의 3차원 그래프 매트릭스 변환을 통한 발작 예측 모델 개발

이 논문은 뇌전도(EEG) 신호를 활용한 발작 예측 모델의 정확성을 향상시키는 방법을 제시하고 있다. 기존 연구에서는 EEG 신호 전체에 대해 1차원 처리를 적용해 왔지만, 본 논문에서는 Gram Matrix 방법을 통해 신호를 3차원 표현으로 변환함으로써, 신호 간의 관계와 시간 의존성을 동시에 모델링할 수 있다. 이는 EEG 데이터 내에서 발견된 로컬과 글로벌 신호 사이의 불균형 문제를 해결하기 위한 노력 중 하나이다. 또한 논문은 공유 주의(coattention)를 활용해 전체적인 신호 특징을 포착하고, Inception 구조

No Image

수력확산모델: 강우량 예측의 새로운 패러다임

해도디퓨전(HydroDiffusion)은 확산 모델을 활용한 새로운 유속예측 프레임워크로, 기존 LSTM 기반 모델들의 한계를 극복하고자 개발되었다. 이 논문에서는 해도디퓨전이 어떻게 전체 멀티데이 트레젝토리를 동시에 처리하여 시간적 일관성을 보장하고, 자동회귀 예측에서 발생하는 오차 누적 문제를 완화하는지 설명한다. 특히, 해도디퓨전은 CAMELS 데이터셋을 통해 531개의 수계에 걸쳐 평가되었으며, DRUM과 비교하여 우수한 성능을 보여주었다. 이러한 결과는 해도디퓨전이 중기 유속예측에서 강력한 도구로 활용될 수 있음을 시사하며

인공지능과 인간의 임상 파트너십: 뇌종양 진단에서의 혁신

인공지능과 인간의 임상 파트너십: 뇌종양 진단에서의 혁신

본 논문은 인공지능(AI)과 인간 전문가의 파트너십이 의료 분야에서 어떻게 작동하는지를 탐구한 연구입니다. 특히, 뇌종양 환자의 MRI 기반 진단을 중심으로 AI와 방사선 전문가 간의 상호작용에 초점을 맞추고 있습니다. 이 연구는 두 가지 주요 관점에서 진행되었습니다: 첫째, AI가 인간 전문가를 지원하는 역할과 둘째, 인간 전문가가 AI를 지원하는 역할입니다. 연구 결과, 양쪽 파트너십 모두 정확도와 메타인지 능력이 향상되었음을 발견했습니다. 특히, 방사선 전문가의 지원을 받는 AI 에이전트에서 환자에게 가장 큰 혜택이 나타났습니

< 분야별 논문 현황 (Total: 821) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
9
HEP-EX
7
HEP-PH
12
HEP-TH
7
MATH-PH
4
NUCL-TH
1
Quantum Physics
12

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키