General

'General' 카테고리의 모든 글

총 273개의 글
시간순 정렬
No Image

매든 줄리안 진동의 생명주기: AI를 활용한 새로운 이해

이 논문은 매든 줄리안 진동(MJO)의 생명주기를 정확하게 정의하기 위한 새로운 접근법을 제시합니다. MJO는 기후 변동성에서 중요한 역할을 하는데, 그 전파 특성 때문에 이 생명주기의 정의가 어렵습니다. 현재 사용되는 RMM 지수는 수학적 오류를 물리 상태와 혼동하는 문제를 가지고 있으며, 원시 데이터 공간에서 직접 클러스터링을 시도하면 '전파 패널티' 문제가 발생합니다. 이 논문은 이러한 문제를 해결하기 위해 AI 기반 이론 발견 방법론을 도입하였습니다. 이를 통해 MJO의 내재 구조를 객체적으로 탐색할 수 있는 새로운 접근법을

No Image

부분적으로 관찰된 컨텍스트에서 효율적인 탐색을 위한 베이지안 프레임워크

본 논문은 부분적으로 관찰되는 컨텍스트와 잠재 변수에 의해 유도되는 의존성을 고려한 새로운 베이지안 프레임워크를 제시합니다. 이 접근법의 핵심은 모든 작업에서 수집된 데이터를 통합하여 전역적인 결합 분포를 학습하면서, 각각의 사용자 또는 작업에 맞는 개인화된 추론을 가능하게 하는 것입니다. 논문에서는 두 가지 주요 불확실성 요인, 즉 팔과 작업 간의 잠재적 보상 의존성에서 발생하는 구조적 불확실성 및 부족한 컨텍스트와 제한된 상호작용 역사로 인해 발생하는 사용자별 불확실성을 식별하고 이를 해결하기 위한 방법을 제시합니다. 논문의 주

양자신경라디언스필드: 3D장면복원을 위한 혁신적인 접근법

양자신경라디언스필드: 3D장면복원을 위한 혁신적인 접근법

본 논문은 3D 장면 복원에서 고전적인 암시적 신경 표현(INRs)의 한계를 극복하기 위해 양자 컴퓨팅 기술을 도입한 혁신적인 접근법을 제안합니다. 특히, Q NeRF는 Nerfacto라는 현존하는 3D 렌더링 프레임워크에 QIREN 모듈을 통합하여 고주파수 세부 사항의 표현력을 향상시키고자 합니다. 이 접근법은 양자 회로가 내재적으로 가진 푸리에 구조를 활용함으로써, 고전적인 신경망이 겪는 스펙트럼 편향성을 완화하는 데 효과적입니다. 논문에서 제시된 하이브리드 양자 클래식 모델은 기존의 클래식 모델과 비교하여 PSNR, SSIM

No Image

연방학습의 로컬 드리프트를 줄이는 피드백 정렬 기법

이 논문은 연방학습(Federated Learning, FL)에서 발생하는 데이터 이질성 문제를 해결하기 위한 새로운 접근법인 FLFA(Federated Learning with Feedback Alignment)에 대해 설명하고 있습니다. 연방학습은 클라이언트 간의 데이터 프라이버시를 보장하면서도 협업 학습을 가능하게 하는 기술입니다. 그러나 각 클라이언트의 데이터가 독립적이고 동일한 분포(IID)가 아닌 경우, 즉 비IID인 경우에는 로컬 모델과 전역 모델 간에 수렴이 어려워지며 이를 로컬 드리프트 현상이라고 합니다. FLFA는

Learning
외환시장 예측의 혁신: EXFormer

외환시장 예측의 혁신: EXFormer

이 논문은 국제 금융에서 오랫동안 해결되지 않았던 문제인 매일의 환율 변동률 예측에 초점을 맞추고 있습니다. 이 연구는 EXFormer이라는 새로운 Transformer 기반 아키텍처를 제시하며, 이를 통해 다양한 시장 요인들에 의해 주도되고 고주파 변동성을 보이는 환율 변동률을 효과적으로 예측할 수 있도록 합니다. 특히, 이 논문은 다중 스케일 추세 인식 자기 주의 메커니즘을 도입하여 서로 다른 수용 필드를 가진 병렬 컨볼루션 브랜치를 사용해 로컬 기울기에 따라 관찰 값을 정렬합니다. 이를 통해 장기 종속성을 유지하면서도 시장 상

인공지능 기반 녹색세탁의 법적 책임: 인도, 미국, EU 비교 분석

인공지능 기반 녹색세탁의 법적 책임: 인도, 미국, EU 비교 분석

본 논문은 AI 기반의 녹색세탁이 기업 지속 가능성 관리에서 중요한 도전 과제임을 강조하고 있다. 녹색세탁은 환경 공시의 불투명성을 가중시키고, 규제 감독을 방해한다. 연구는 인도, 미국, EU를 대상으로 AI 매개 녹색세탁에 대한 범죄 책임을 비교 분석하여, 기존 법률이 인간 의도를 전제로 하여 알고리즘 시스템에서 발생한 속임수에 대해 불합리하게 적용되고 있음을 드러낸다. 이는 현행 사기 및 환경 관련 법률들이 AI가 생성하는 오해를 처리할 수 없게 만드는 문제점을 보여준다. 본 연구는 기존 판례, 법령, 규제 지침을 체계적으로

주제 중심 이미지 생성의 진화: Scone으로 구현되는 통합 이해 생성 방법

주제 중심 이미지 생성의 진화: Scone으로 구현되는 통합 이해 생성 방법

이 논문은 주제 중심 이미지 생성 분야에서 중요한 이슈를 다루고 있다. 특히, 단일 주제에서 다중 주제로의 전환 과정에서 발생하는 구분력 부족 문제에 집중한다. Scone이라는 새로운 접근법을 제시함으로써, 이 논문은 이미지 생성 모델이 복잡한 시나리오에서도 효과적으로 작동할 수 있도록 하는 데 중점을 두고 있다. Scone의 핵심 아이디어는 이해 전문가와 생성 전문가 사이에 의미적인 다리를 만드는 것이다. 이 다리는 입력된 여러 주제들 중에서 올바른 주제를 식별하고 그 정체성을 유지하는 데 필수적이다. 두 단계 훈련 방식을 통해

Model
프라이브: 수직연방학습의 사생활 보호

프라이브: 수직연방학습의 사생활 보호

이 논문은 수직연방학습(VFL)에서 발생하는 특징 추론 공격 문제를 해결하기 위한 새로운 방어 메커니즘인 PRIVEE를 제안하고 있습니다. VFL은 서로 다른 데이터셋을 가진 여러 조직들이 공동의 사용자 샘플에 대해 학습할 수 있는 방법으로, 특히 개인 정보 보호가 중요한 분야에서 유용하게 활용될 수 있습니다. 그러나 이러한 협업 과정에서는 공격자가 모델의 예측 확률을 이용해 다른 참여자의 데이터를 재구성하는 특징 추론 공격에 노출될 위험이 있습니다. PRIVEE는 이 문제를 해결하기 위해 신뢰도 점수를 암호화하여 공유함으로써, 공

Learning
현대 대형 언어 모델의 의식: 가설 검증과 연속 학습의 관점

현대 대형 언어 모델의 의식: 가설 검증과 연속 학습의 관점

본 논문은 현대 대형 언어 모델(LLMs)의 의식 가능성에 대한 철학적이고 과학적인 접근법을 제시하고 있습니다. 저자는 증명 불가능성과 비자명성을 충족하는 이론이 있어야 한다는 요구 사항을 강조하며, 이를 통해 현대 LLMs의 의식 가능성을 검증합니다. 논문은 기존의 인과 구조와 기능에 기반한 의식 이론들이 이러한 요구 조건을 만족하지 못한다는 점을 지적하고 있습니다. LLMs는 입력/출력 기능 측면에서 특정 시스템들과 동등하기 때문에, 그들에 대한 의식 가능성은 증명 불가능성과 비자명성을 충족하는 이론이 존재해야 합니다. 그러나

Learning Model
희소 상황에 대응하는 인간 영감 학습 방법 탐구

희소 상황에 대응하는 인간 영감 학습 방법 탐구

이 논문은 대형 언어 모델(LLMs)의 한계를 극복하기 위해 인간 학습 과정에서 영감을 얻는 새로운 접근법을 제안하고 있습니다. LLMs은 큰 규모의 데이터로부터 일반적인 패턴을 추출하는 데 탁월하지만, 희귀하거나 저자원 상황에서는 이러한 패턴이 데이터 내에 충분히 나타나지 않아 예측 능력이 제한됩니다. 이 문제를 해결하기 위해 논문은 두 가지 메커니즘을 통합하는 인간 영감 학습 프레임워크를 제안합니다: 첫 번째로, '명시적 기록'은 원인 결과 또는 질문 해결책 관계를 상징적 메모리에 저장하여 단일 또는 불규칙한 경험에서도 지속적인

Learning Model
AI 모델 문서 투명성 표준화: 현황과 격차

AI 모델 문서 투명성 표준화: 현황과 격차

이 논문은 AI 모델 문서의 투명성 문제를 체계적으로 분석하고 해결하기 위한 프레임워크를 제시합니다. 특히, 다양한 플랫폼에서 제공되는 AI 모델 문서는 구조와 내용에 일관성이 부족하여 사용자들이 필요한 정보를 쉽게 찾기 어렵다는 점을 지적합니다. 이를 해결하기 위해 EU AI Act Annex IV와 스탠퍼드 투명성 지수를 기반으로 한 가중 투명도 프레임워크를 개발하였습니다. 이 프레임워크는 안전성이 중요한 공개 사항을 우선시하며, 이를 통해 모델의 안전성을 평가하는 데 필요한 정보를 체계적으로 제공합니다. 또한, 논문은 AI 모

Model Framework
AI와 철학자들의 대화: 지식의 메타버스에서의 혁신

AI와 철학자들의 대화: 지식의 메타버스에서의 혁신

이 논문은 대형 언어 모델(LLMs)의 역할에 대한 통념을 재고하고, 이러한 시스템들이 단순히 훈련 데이터를 복제하는 것이 아니라, 적절한 상호작용적 맥락에서 새로운 개념 구조와 창의적인 사고를 발전시킬 수 있음을 입증합니다. 연구는 철학자들의 디지털 재현체가 참여하는 Syntropic Counterpoints 프로젝트를 통해 실제 철학적 논쟁을 분석하고, 이러한 대화에서 추론의 일관성과 반성적인 질문이 어떻게 발생하는지를 탐구합니다. 연구팀은 이러한 발견을 바탕으로 'Epistemoverse'라는 개념을 제안하며, 이는 인간과 기

뇌파 신호의 3차원 그래프 매트릭스 변환을 통한 발작 예측 모델 개발

뇌파 신호의 3차원 그래프 매트릭스 변환을 통한 발작 예측 모델 개발

이 논문은 뇌전도(EEG) 신호를 활용한 발작 예측 모델의 정확성을 향상시키는 방법을 제시하고 있다. 기존 연구에서는 EEG 신호 전체에 대해 1차원 처리를 적용해 왔지만, 본 논문에서는 Gram Matrix 방법을 통해 신호를 3차원 표현으로 변환함으로써, 신호 간의 관계와 시간 의존성을 동시에 모델링할 수 있다. 이는 EEG 데이터 내에서 발견된 로컬과 글로벌 신호 사이의 불균형 문제를 해결하기 위한 노력 중 하나이다. 또한 논문은 공유 주의(coattention)를 활용해 전체적인 신호 특징을 포착하고, Inception 구조

No Image

수력확산모델: 강우량 예측의 새로운 패러다임

해도디퓨전(HydroDiffusion)은 확산 모델을 활용한 새로운 유속예측 프레임워크로, 기존 LSTM 기반 모델들의 한계를 극복하고자 개발되었다. 이 논문에서는 해도디퓨전이 어떻게 전체 멀티데이 트레젝토리를 동시에 처리하여 시간적 일관성을 보장하고, 자동회귀 예측에서 발생하는 오차 누적 문제를 완화하는지 설명한다. 특히, 해도디퓨전은 CAMELS 데이터셋을 통해 531개의 수계에 걸쳐 평가되었으며, DRUM과 비교하여 우수한 성능을 보여주었다. 이러한 결과는 해도디퓨전이 중기 유속예측에서 강력한 도구로 활용될 수 있음을 시사하며

인공지능과 인간의 임상 파트너십: 뇌종양 진단에서의 혁신

인공지능과 인간의 임상 파트너십: 뇌종양 진단에서의 혁신

본 논문은 인공지능(AI)과 인간 전문가의 파트너십이 의료 분야에서 어떻게 작동하는지를 탐구한 연구입니다. 특히, 뇌종양 환자의 MRI 기반 진단을 중심으로 AI와 방사선 전문가 간의 상호작용에 초점을 맞추고 있습니다. 이 연구는 두 가지 주요 관점에서 진행되었습니다: 첫째, AI가 인간 전문가를 지원하는 역할과 둘째, 인간 전문가가 AI를 지원하는 역할입니다. 연구 결과, 양쪽 파트너십 모두 정확도와 메타인지 능력이 향상되었음을 발견했습니다. 특히, 방사선 전문가의 지원을 받는 AI 에이전트에서 환자에게 가장 큰 혜택이 나타났습니

No Image

인공지능의 미래: 데이터 분석을 통한 예측

이 논문은 인공지능(AI) 기술이 데이터 분석을 통해 미래 예측에 어떻게 활용되는지를 탐구한다. AI와 머신러닝 알고리즘의 발전은 다양한 산업에서 혁신적인 변화를 가져왔지만, 동시에 새로운 도전 과제도 제기하고 있다. 특히, 이 연구는 AI가 데이터 분석을 통해 미래 트렌드를 예측하는 데 얼마나 효과적일 수 있는지를 평가한다. 이를 위해 다양한 머신러닝 모델과 알고리즘의 성능을 비교하며, 실제 사례와 함께 그 결과를 분석한다. 이러한 연구는 AI 기술이 더욱 발전함에 따라 미래 예측의 정확도를 높이는 방법론을 제시하는 동시에, 데이

전이 매칭 헤드 설계와 샘플링 전략의 대규모 연구

전이 매칭 헤드 설계와 샘플링 전략의 대규모 연구

본 논문은 전이 매칭(TM)이라는 새로운 생성 모델링 패러다임에 대한 대규모 연구를 수행하였습니다. TM은 기존의 확산 및 유동 일치 모델, 연속 상태 자기회귀 모델을 일반화하며, 특히 두 번째 '내부' 생성 모델을 사용하여 전이 단계를 구현함으로써 더 표현력 있는 결과를 제공합니다. 연구에서는 시간 연속 양방향 변형에 초점을 맞추어 TM 프레임워크에서 헤드의 설계, 학습 및 샘플링에 대한 체계적인 조사를 수행하였습니다. 연구팀은 56개의 다른 17억 개 텍스트 이미지 모델을 학습하는 포괄적인 실험(총 549개 고유한 평가)을 통해

정확한 변동성 예측을 위한 하이브리드 모델링 프레임워크: SV LSTM의 성능 분석

정확한 변동성 예측을 위한 하이브리드 모델링 프레임워크: SV LSTM의 성능 분석

본 연구는 금융 시장에서 변동성 예측의 중요성을 강조하며, 이를 위해 확률적 변동성(SV) 모델과 장단기 메모리(LSTM) 신경망을 통합한 하이브리드 모델링 프레임워크를 제안한다. SV 모델은 통계적인 정확성과 잠재적인 변동성 동태를 포착하는 능력을 제공하며, 특히 예상치 못한 사건에 대한 반응에서 유용하다. 한편, LSTM 네트워크는 금융 시계열 데이터에서 복잡하고 비선형 패턴을 감지할 수 있는 능력이 있어, SV 모델의 통계적 정확성과 결합하여 더 우수한 예측 성능을 제공한다. 본 연구에서는 S&P 500 지수 일별 데이터를 사

Network Model
지능 시스템의 엔트로피 붕괴와 적응성 상실

지능 시스템의 엔트로피 붕괴와 적응성 상실

본 논문은 지능 시스템의 복잡한 역동성과 그에 따른 붕괴 메커니즘을 탐구하고 있다. 학습, 조정, 최적화를 통해 지능이 향상되는 것이 일반적인 관점이나, 이 과정에서 발생하는 역설적인 문제점, 즉 시스템의 경직과 예기치 않은 실패가 제시된다. 이러한 현상을 엔트로피 붕괴라는 개념으로 설명하며, 피드백 증폭이 새로운 창출을 능가할 때 발생하는 보편적인 동적 실패 모드를 식별한다. 엔트로피 붕괴는 시스템의 적응성 차원 축소를 의미하며, 이는 활동이나 규모의 상실보다 더 복잡한 구조적 변화를 나타낸다. 논문은 이러한 현상이 다양한 분야에

System
지반공학과 지진공학을 위한 합성 토층 생성 프레임워크: SoilGen

지반공학과 지진공학을 위한 합성 토층 생성 프레임워크: SoilGen

지반공학과 지진공학 분야에서는 정확한 모델 개발을 위해 대규모의 잘 라벨링된 데이터셋이 필수적이다. 그러나 이러한 데이터셋은 공개적으로 이용하기 어렵고, 고품질 현장 기록은 대부분 전문적인 성격 때문에 접근성이 제한적이다. 이로 인해 연구자들은 데이터 부족으로 인해 모델 개발에 어려움을 겪게 된다. 본 논문에서 소개된 SoilGen 프레임워크는 이러한 문제를 해결하기 위해 물리적으로 일관되고 다층적인 합성 토층을 생성하는 방법론을 제시한다. SoilGen은 단순히 무작위화된 데이터셋을 제공하지 않고, 실제 지반공학적 속성을 고려하여

Analysis
No Image

changning지역의 고해상도 지진파 배열을 활용한 소규모 지진 파열 과정 연구

이 논문은 중국 시촨 분지 changning 지역에서 수집된 고밀도 노드 지진계 배열 데이터를 활용하여, 소규모 지진의 파열 과정을 정교하게 분석하는 데 초점을 맞추고 있습니다. 연구팀은 PhaseNet+와 SKHASH라는 알고리즘을 사용해 1<M<4 범위의 여진들의 포커스 메커니즘 카탈로그를 향상시켰습니다. 이를 통해, 두 개의 M3 여진에서 방향성에 따른 코너 주파수를 관찰하고 Brune 모델을 사용한 스펙트럼 피팅으로 일방적 파열이 확인되었습니다. 특히, 이 연구는 changning 지역의 복잡한 단면 구조와 지하 유체 주입과

Data
XAI 평가에서 베이스라인 선택의 함정과 해결책

XAI 평가에서 베이스라인 선택의 함정과 해결책

본 논문은 XAI 평가에서 Attribution 방법의 성능을 측정하는 데 사용되는 Fidelity 지표에 대한 중요한 한계점을 제기합니다. 특히, Insertion과 Deletion 같은 기준 함수는Attribution 방법이 입력 이미지의 픽셀을 변경하는 방식에 따라 성능 차이를 보일 수 있다는 점입니다. 이는Attribution 방법 선택 시 특정 모델만 우월하게 만들 수 있어 공정한 평가에 어려움을 초래합니다. 논문은 이러한 문제를 해결하기 위해 기준 함수의 두 가지 이상적인 특성을 제시합니다: 정보 제거와 분포 외(OOD)

오픈소스 에이전트 기반의 재료과학 혁신 플랫폼 AGAPI

오픈소스 에이전트 기반의 재료과학 혁신 플랫폼 AGAPI

AGAPI 플랫폼은 인공지능이 과학적 발견에 미치는 영향을 강조하면서, 특히 재료과학 분야에서의 제약들을 해결하려는 시도를 보여줍니다. 이 플랫폼은 오픈 소스 대형 언어 모델(LLMs)과 다양한 재료과학 API 엔드포인트를 통합하여 데이터베이스, 시뮬레이션 도구, 머신러닝 모델을 하나의 프레임워크로 연결합니다. AGAPI는 에이전트 플래너 실행자 요약자 구조를 활용해 재료과학 연구에서 발생하는 복잡한 작업들을 자동화하고 최적화합니다. 특히, AGAPI는 재료 데이터의 검색부터 그래프 신경망을 통한 속성 예측, 머신러닝 기반 포스필드

FPGA를 활용한 3D 포인트 클라우드 모델의 고속 처리: HLS4PC 프레임워크

FPGA를 활용한 3D 포인트 클라우드 모델의 고속 처리: HLS4PC 프레임워크

이 논문은 고속 처리를 위해 FPGA 기반의 HLS4PC 프레임워크를 제시하고, 이를 통해 3D 포인트 클라우드 모델의 효율적인 처리를 가능하게 합니다. 특히, PointMLP Elite 모델에 대한 다양한 압축 기법을 적용하여 복잡성을 줄이면서도 정확도 하락을 최소화하는 PointMLP Lite 변형을 개발하였습니다. 이는 3D 포인트 클라우드 데이터의 특성상 GPU에서 발생하는 계산 및 메모리 요구 사항의 문제를 해결하고, 실시간 성능을 향상시키는데 기여합니다. 또한, FPGA 가속화를 통해 CPU와 GPU에 비해 높은 처리량을

Framework Model
공정성 규제와 부드러운 온라인 최적화의 새로운 패러다임

공정성 규제와 부드러운 온라인 최적화의 새로운 패러다임

본 논문은 온라인 최적화 문제에서 공정성과 부드러움이라는 두 가지 중요한 요소가 동시에 고려되지 않는 현상을 해결하기 위해 새로운 접근법을 제시합니다. 특히, 공정성 규제와 스위칭 비용이 포함된 복잡한 설정에서의 도전적인 문제를 다룹니다. 논문은 이러한 문제에 대한 근본적인 도전을 증명하고, 이를 해결하기 위한 FairOBD 알고리즘을 제안합니다. FairOBD는 장기 공정성 비용을 온라인 비용 시퀀스로 분해하는 방법으로, 보조 변수를 활용하여 공정한 결과를 달성하도록 행동을 규제합니다. 이 접근법은 스위칭 비용을 고려하면서도 최적

다층 강인성 작물 배치 프레임워크: 지속 가능한 농업 계획의 새로운 패러다임

다층 강인성 작물 배치 프레임워크: 지속 가능한 농업 계획의 새로운 패러다임

이 논문은 다층 강인성 작물 계획 프레임워크(MLRCPF)를 제안하여 농업 계획의 복잡한 문제들을 해결하고자 합니다. 기존 방법들은 정적인 결정론적 방식으로 작물 배치를 최적화하므로, 시장과 기후 변동에 대한 탄력성을 보장하지 못합니다. MLRCPF는 공간적 이질성, 시간적 농업 종속성 및 환경 불확실성을 고려하여 이러한 문제점을 해결하고자 합니다. 논문은 작물 간 상호작용을 구조화된 상호작용 행렬로 표현하며, 이를 상태 전이 논리 내에 통합합니다. 또한 분포 강건 최적화 계층을 사용해 데이터 기반 모호 집합으로 정의된 최악의 위험

No Image

인공지능 시스템의 신뢰성 보장: 통합 관리 아키텍처로 향상된 책임성

본 논문은 AI 시스템의 책임성과 신뢰성을 높이기 위한 통합 관리 아키텍처를 제시한다. 기존의 AI는 주로 AI 간 조정에 초점을 맞추었지만, 이 연구에서는 전체 AI 구성 요소와 인간 참여자를 포괄하는 보다 포괄적인 접근 방식을 제안하고 있다. 특히 '신뢰할 수 있는 조정 AI를 위한 10개 기준'은 이러한 목표를 달성하기 위해 중요한 역할을 한다. 이 논문의 핵심 개념 중 하나는 '통합 관리 아키텍처'이다. 이는 인간 입력, 의미론적 일관성, 감사 및 증거의 정합성을 통합한 단일 관리 패널로 구성되어 있다. 이러한 접근 방식은

축구 마스터: 통합 축구 비전 모델

축구 마스터: 통합 축구 비전 모델

축구 마스터는 축구 관련 이미지와 동영상 자료를 활용하여 다양한 축구 관련 작업을 수행할 수 있는 통합 비전 모델입니다. 이 모델은 주석 생성, 감지, 추적, 분류 등과 같은 여러 가지 축구 이해 작업에 적용될 수 있습니다. SoccerMaster는 축구 콘텐츠의 다양성을 활용함으로써, 축구 관련 데이터로부터 얻을 수 있는 정보를 최대한 활용하여 보다 정확하고 효과적인 결과를 도출합니다. 이러한 모델은 축구 분석, 선수 평가, 경기 전략 등 다양한 영역에서 활용될 수 있으며, 특히 실시간 주석 생성과 같은 빠른 의사결정이 필요한 상

Model
트랜스포머 기반의 전역 다목적 최적화: TAMO로 과학적 발견 가속화

트랜스포머 기반의 전역 다목적 최적화: TAMO로 과학적 발견 가속화

이 논문은 트랜스포머 아키텍처를 활용한 TAMO라는 새로운 다목적 최적화 방법을 제시합니다. 전통적으로, 다목적 베이지안 최적화는 각 문제에 맞게 대리 모델과 획득 함수를 특별히 선택해야 하며, 이 과정은 시간과 자원을 많이 소모하는 것으로 알려져 있습니다. 특히 병렬 또는 시간 민감한 환경에서는 이러한 재적합 오버헤드가 큰 문제입니다. TAMO는 이러한 제약을 극복하기 위해 트랜스포머를 사용하여 다양한 입력 및 목표 차원에서 작동할 수 있도록 설계되었습니다. 이를 통해 TAMO는 사전 학습된 모델을 새로운 문제에 적용하는 데 필요

Stable Diffusion에서 색채가 잠재 공간에 어떻게 인코딩되는가

Stable Diffusion에서 색채가 잠재 공간에 어떻게 인코딩되는가

본 논문은 최신 확산 모델인 Stable Diffusion의 내부 표현 메커니즘을 색채라는 구체적인 지각 속성에 초점을 맞추어 파헤친다. 연구자는 먼저 색상과 형태가 명확히 구분된 합성 이미지 데이터셋을 제작하였다. 이 데이터셋은 색상만을 변형시키는 버전과 형태만을 변형시키는 버전으로 구성돼 있어, 각 속성이 잠재 공간에 어떻게 매핑되는지를 독립적으로 측정할 수 있다. 잠재 표현을 분석하기 위해 저자는 Stable Diffusion의 UNet 인코더 단계에서 추출한 중간 특징 맵을 벡터화하고, 전체 데이터셋에 대해 주성분 분석(PC

Model
데이터 불균형이 모델 서브그룹 성능에 미치는 영향과 잠재공간 분리 가설

데이터 불균형이 모델 서브그룹 성능에 미치는 영향과 잠재공간 분리 가설

본 연구는 인구통계학적 다양성을 반영한 데이터셋 구축이 머신러닝 모델의 공정성과 일반화에 핵심적인 역할을 한다는 전제에서 출발한다. 전통적으로는 각 서브그룹이 훈련 데이터에 균등하게 포함될 때 모델이 모든 집단에 대해 최적의 성능을 보인다고 믿어 왔으며, 이를 위해 데이터 수집 단계에서 ‘밸런싱(balancing)’ 작업이 필수적이라고 여겨졌다. 그러나 최근 몇몇 실험에서는 오히려 불균형한 데이터가 특정 서브그룹의 성능을 끌어올리거나, 전체 서브그룹이 훈련에 전혀 포함되지 않아도 해당 서브그룹에 대한 예측 정확도가 크게 저하되지 않

디스크 그래프에서 근사 최대 클리크 찾기: 단위 및 다중 반경 경우

디스크 그래프에서 근사 최대 클리크 찾기: 단위 및 다중 반경 경우

이 논문은 디스크 그래프에서 최대 클리크 문제에 대한 근사 알고리즘을 제시하며, 특히 단위 디스크 그래프와 다중 반경 디스크 그래프의 경우를 고려하고 있습니다. 이 문제는 그래프 이론에서 중요한 위치를 차지하며, 특히 통신 네트워크나 센서 네트워크와 같은 실제 시스템에서 활용될 수 있는 중요한 응용 분야입니다. 논문은 단위 디스크 그래프에 대한 알고리즘을 개선하여 O(n/ε^2) 기대 시간 내에 (1 ε) 근사 최대 클리크를 찾는 방법을 제시합니다. 이는 기존의 정확한 해결책보다 훨씬 빠르며, 특히 큰 그래프에서 중요한 성능 개선입

복소수스텝적분변환 고정밀수치미분과스펙트럼분석을위한새로운프레임워크

복소수스텝적분변환 고정밀수치미분과스펙트럼분석을위한새로운프레임워크

본 논문은 기존의 Hilbert 변환이 신호의 위상 정보를 추출하고 미분 연산과 연결된다는 사실을 출발점으로 삼아, 복소수 스텝 차분법(complex‑step differentiation)의 핵심 아이디어를 적분 변환 형태로 확장한다는 점에서 혁신적이다. 복소수 스텝을 실수와 허수 두 축으로 독립적으로 조정함으로써, 변환 과정에서 발생할 수 있는 수치 오차를 최소화하고 동시에 고주파 잡음을 효과적으로 억제한다는 메커니즘은 특히 스펙트럼 기반 수치 미분에서 큰 장점을 제공한다. 스펙트럼 분석에서는 CSIT가 입력 신호의 푸리에 스펙트

No Image

큰 언어 모델의 추론 메커니즘: 확률적 기반과 인간 추론의 유사성

이 논문은 대형 언어 모델(LLMs)에서 토큰 완성 기반의 추론 메커니즘을 탐구하며, 특히 이러한 LLMs이 학습된 연관성을 통해 생성되는 텍스트와 인간의 추측적 추론(abductive reasoning) 사이의 유사성을 분석한다. 논문은 LLMs가 직접적인 진리나 의미를 기반으로 하지 않고도 가능성이 있는 가설을 제시하고, 상식적 추론을 시뮬레이션하며, 설명적인 답변을 제공하는 방식을 통해 그들의 출력이 실제 추측적 추론과 유사하게 보일 수 있다는 점에 주목한다. 이러한 모델의 확률적 핵심과 애플리케이션에서 나타나는 추측적 추론의

Model
폐암 사망률 예측을 위한 기계학습 모델의 성능 분석

폐암 사망률 예측을 위한 기계학습 모델의 성능 분석

이 연구는 미국에서 폐암(LC) 사망률 예측에 기계학습 모델의 적용을 통해 얻은 결과를 보고하고 있다. 특히, 랜덤 포레스트(RF), 그래디언트 부스팅 회귀(GBR), 그리고 선형 회귀(LR) 세 가지 모델을 사용하여 LC 사망률 예측 성능을 평가하였다. 연구에서 RF 모델이 GBR과 LR보다 우수한 성능을 보여주었으며, R squared 값 41.9%, RMSE 12.8을 달성했다는 점은 주목할 만하다. SHAP 분석을 통해 흡연률이 가장 중요한 예측 변수로 나타났고, 이어 집값 중앙값과 히스패닉 인구 비율이 중요하게 작용한다는

Learning
능동 주행과 자율 주행에서의 뇌파 기반 정신 상태 비교 연구

능동 주행과 자율 주행에서의 뇌파 기반 정신 상태 비교 연구

본 논문은 운전 상황에 따라 뇌파 신호가 어떻게 달라지는지를 정량적으로 규명함으로써, 인간‑차량 인터페이스 설계에 중요한 통찰을 제공한다. 실험 설계는 31명의 피험자를 대상으로 동일한 운전 과제를 능동 주행과 자율 주행 두 조건에서 수행하게 하여, 과제 복잡도(저·중·고)별로 EEG 데이터를 수집하였다. 데이터 전처리 단계에서는 눈깜빡임·근육 잡음 등을 ICA 기반으로 제거하고, 64채널 시스템을 이용해 전두엽·두정엽·후두엽 등 주요 영역의 전력 스펙트럼을 분석하였다. 인지 부하와 피로는 주파수 밴드 파워(θ, α, β)와 복합

핸드 오브젝트 그립을 위한 3D 포즈 추정 CLIP과 DINOv2 시각 모델 비교

핸드 오브젝트 그립을 위한 3D 포즈 추정 CLIP과 DINOv2 시각 모델 비교

본 연구는 최근 급부상한 비전 파운데이션 모델(VFM)과 비전‑언어 모델(VLM)이 로봇 조작, 특히 손‑물체 그립 상황에서 6D 객체 포즈 추정에 어떻게 다른 강점을 발휘하는지를 체계적으로 비교한다. CLIP은 대규모 이미지‑텍스트 쌍으로 사전 학습된 멀티모달 모델로, 언어와 시각 정보를 정렬함으로써 “컵”, “핸들” 등 객체의 의미적 카테고리를 강력히 인식한다. 이러한 의미적 이해는 복잡한 장면에서 객체를 정확히 구분하고, 인간이 제공하는 자연어 명령과의 매핑을 용이하게 만든다. 그러나 CLIP의 특징은 주로 전역적인 토큰 임베

Model
형식적 자원 경계 인증을 위한 합성 프레임워크

형식적 자원 경계 인증을 위한 합성 프레임워크

이 논문은 프로그램의 자원 사용을 정형적으로 검증하려는 연구 흐름에 중요한 기여를 한다. 가장 눈에 띄는 점은 자원 경계를 추상 격자 (L, ⪯, ⊕, ⊔, ⊥) 로 일반화함으로써, 전통적인 시간 복잡도 분석을 넘어 메모리, 가스, 혹은 도메인‑특화 비용까지 하나의 형식 체계 안에서 다룰 수 있게 만든 것이다. 이러한 추상화는 기존의 비용 모델이 서로 독립적으로 설계되는 문제를 해결하고, 동일한 타입 시스템을 재사용해 다양한 비용을 동시에 추론할 수 있게 한다는 실용적 장점을 제공한다. 논문이 도입한 등급 가능성 모달리티 □ r 은

Analysis
3D 역설계 프레임워크 물리 인식 잠재공간 탐색과 위상 보존 정밀화

3D 역설계 프레임워크 물리 인식 잠재공간 탐색과 위상 보존 정밀화

본 연구는 3차원 역설계 분야에서 가장 근본적인 병목 현상인 “설계 공간의 폭발적 증가” 문제를 근본적으로 해결하려는 시도로 평가할 수 있다. 전통적인 그리드 탐색이나 베이즈 최적화와 같은 전통적 방법은 차원 수가 늘어날수록 계산 복잡도가 지수적으로 증가해 실용적인 적용이 어려워진다. 최근 딥러닝 기반 접근법은 잠재 공간을 이용해 탐색 차원을 크게 축소했지만, 대부분 2D 투영을 사용하거나 기존 3D 모델을 미세 조정하는 방식에 머물러 실제 3D 형태의 자유로운 생성 능력을 제한한다. 이러한 한계는 특히 복합 물리 현상이 얽힌 설계

청취 선택성을 측정하는 SH 벤치와 프라이버시 파인튜닝

청취 선택성을 측정하는 SH 벤치와 프라이버시 파인튜닝

본 논문은 오디오 기반 대형 언어 모델이 실제 서비스 환경에서 마주하게 되는 ‘부수 청취’ 문제를 정량화하고 해결책을 제시한다는 점에서 매우 시의적절하다. 기존 연구들은 주로 모델의 전반적인 음성 인식·이해 능력에 초점을 맞추었으며, 주변 사람들의 음성을 무심코 수집·처리하는 프라이버시 위험을 간과해 왔다. 이러한 공백을 메우기 위해 저자들은 두 가지 핵심 기여를 한다. 첫째, SH‑Bench라는 새로운 벤치마크를 구축했다. 이 벤치마크는 3,968개의 다중 화자 오디오 믹스를 포함하고, 실제 현장 녹음과 합성 데이터를 균형 있게

동적 프로그래밍을 이용한 리더 팔로워 일반합 스토케스틱 게임 최적 정책 합성

동적 프로그래밍을 이용한 리더 팔로워 일반합 스토케스틱 게임 최적 정책 합성

본 연구는 기존의 리더‑팔로워 스토케스틱 게임 이론에 중요한 구조적 진전을 제공한다. 일반합 게임은 두 에이전트가 서로 다른 보상 함수를 갖는 상황을 의미하는데, 여기서 리더는 자신의 정책을 사전에 고정하고 팔로워는 그에 대한 최적 반응을 선택한다. 이러한 비대칭 약속 구조는 실세계의 보안 배치, 네트워크 방어, 자원 할당 등에서 흔히 나타난다. 기존 접근법은 주로 완전 정보 혹은 제한된 정책 공간을 가정하고, 팔로워의 반응을 근사하거나 제한된 형태의 균형만을 계산했다. 그러나 이러한 방법은 신뢰 가능한 집합(credible set

메타데이터 강화로 기업용 RAG 검색 성능 극대화

메타데이터 강화로 기업용 RAG 검색 성능 극대화

본 논문은 기업용 지식 관리 시스템에서 흔히 겪는 “정보 검색 병목” 문제를 해결하기 위해 메타데이터를 자동으로 생성·활용하는 새로운 파이프라인을 제안한다. 먼저, 대형 언어 모델을 이용해 각 문서 조각에 대해 주제, 키워드, 요약, 관계 등 다차원 메타데이터를 추출한다. 이러한 메타데이터는 기존 텍스트 임베딩에 추가적인 시그널을 제공함으로써, 동일한 의미를 공유하는 문서 간의 거리 계산을 보다 정교하게 만든다. 청킹 전략은 세 가지로 구분된다. ① 의미 기반 청킹은 문맥적 유사성을 기준으로 문서를 동적으로 분할해 의미 단위가 보존

Framework Data System
브레이드 군 Hecke 표현과 HOMFLY PT 다항식 효율적 계산

브레이드 군 Hecke 표현과 HOMFLY PT 다항식 효율적 계산

이 논문은 현대 결절 이론과 계산 복잡도 이론을 연결하는 교량 역할을 한다. 핵심 아이디어는 Hecke 대수의 표현론적 구조가 브레이드 군의 원소를 행렬로 변환할 때 발생하는 연산적 강직성을 이용해, 기존 구현보다 훨씬 빠른 계산 루틴을 만든다는 점이다. 저자들은 먼저 브레이드 군 Bₙ의 생성자 σᵢ에 대해 Hecke 대수 Hₙ(q) 의 표준 표현을 명시하고, 이때 발생하는 교환 관계와 제곱 관계를 이용해 행렬 곱셈의 차원을 최소화한다. 특히, Garside 정규형을 활용해 브레이드 단어를 최소 길이의 정규 형태로 변환함으로써 중복

트리폭을 보존한 3‑다양체 삼각분할의 변환과 퀀텀 불변량의 고정‑파라미터 알고리즘

트리폭을 보존한 3‑다양체 삼각분할의 변환과 퀀텀 불변량의 고정‑파라미터 알고리즘

이 논문은 3‑다양체 위상학에서 가장 실용적인 데이터 구조인 삼각분할을 다루면서, 그래프 이론의 핵심 개념인 트리폭을 중심으로 알고리즘적 효율성을 극대화한다는 점에서 큰 의미를 가진다. 트리폭은 그래프가 트리와 얼마나 유사한지를 정량화하는 파라미터이며, 트리폭이 작을수록 동적 계획법이나 색칠 알고리즘 같은 전통적인 FPT 기법을 적용하기 용이하다. 기존 연구에서는 삼각분할 자체의 트리폭을 이용해 다양한 위상학적 문제(예: 매니폴드 동형판별, 코흐라 복합체 계산 등)를 FPT로 해결했지만, 히어로드 분할이라는 전혀 다른 표현으로 변환

확산 기반 통계 다운스케일링으로 고해상도 날씨 예보 구현

확산 기반 통계 다운스케일링으로 고해상도 날씨 예보 구현

본 연구는 수치예보 분야에서 고해상도 예보를 실시간으로 제공하기 위한 핵심 기술인 통계적 다운스케일링을 딥러닝 기반 확산 모델에 적용한 점에서 큰 의의를 가진다. 기존의 CorrDiff 프레임워크는 주로 표면 변수와 제한된 지역에 초점을 맞추었으나, 본 논문은 적용 영역을 약 40배 확대하여 중국 전역을 포괄하고, 6개의 기압 레벨에 해당하는 고층 변수까지 포함함으로써 모델의 일반화 능력을 크게 강화하였다. 이는 대기 현상이 수직적으로도 복잡하게 얽혀 있음을 고려한 설계로, 특히 강수·대류·제트 스트림 등 고층 동역학을 정확히 재현

Model
희소 사전학습이 드러내는 신경망 표현의 다중 의미와 식별 불가능성

희소 사전학습이 드러내는 신경망 표현의 다중 의미와 식별 불가능성

이 논문은 최근 인공지능 모델이 복잡한 개념을 어떻게 내부 표현에 담는지를 탐구하는 기계적 해석(mechanistic interpretability) 분야의 핵심 문제에 접근한다. 기존 연구들은 신경망이 의미 있는 개념을 고차원 표현 공간의 선형 방향으로 저장하고, 여러 개념이 동일한 뉴런 집합에 겹쳐서(superposition) 나타난다고 주장한다. 이러한 현상을 해소하기 위해 연구자들은 희소 사전학습(Sparse Dictionary Learning, SDL)이라는 방법론을 도입했으며, 여기에는 희소 자동인코더(sparse aut

Learning
AI 생성 이미지와 허위 정보의 확산 메커니즘 분석

AI 생성 이미지와 허위 정보의 확산 메커니즘 분석

본 논문은 AI‑생성 이미지와 허위 정보가 소셜 미디어, 특히 Reddit이라는 포럼 기반 플랫폼에서 어떻게 확산되는지를 정량적으로 규명한 최초의 대규모 연구로 평가할 수 있다. 연구자는 이념적 스펙트럼이 넓은 다섯 개 서브레딧을 선정함으로써, 좌파·우파·중도·대안·기술 중심 커뮤니티 등 다양한 정치·사회적 배경을 포괄하였다. 데이터 수집 단계에서는 2022‑2024년 사이에 게시된 1백만 건 이상의 포스트와 그에 연결된 재게시(cascade) 데이터를 크롤링했으며, 각 포스트에 포함된 이미지가 AI‑생성 여부를 판별하기 위해 최신

동작 확산 모델의 표현 방식과 손실 함수 선택이 성능에 미치는 영향에 대한 체계적 분석

동작 확산 모델의 표현 방식과 손실 함수 선택이 성능에 미치는 영향에 대한 체계적 분석

본 논문은 최근 급부상하고 있는 인간 동작 합성용 확산 모델의 핵심 설계 요소인 ‘동작 표현 방식’과 ‘손실 함수’를 체계적으로 검증한 점에서 학술적·실용적 의의가 크다. 먼저, 저자는 기존 연구에서 제안된 6가지 대표적인 동작 표현(예: 관절 각도, 관절 위치, 회전 행렬, 쿼터니언, 속도·가속도 기반 표현, 그리고 혼합형 표현)을 동일한 MDM 기반 프레임워크에 적용해 비교하였다. 이때 사용된 평가지표는 흔히 쓰이는 Frechet Inception Distance(FID)와 Diversity Score 등으로, 품질과 다양성을

Model
시각언어모델의 발화감정 모호성 해소와 심리대화 이해를 위한 다중수준 인사이트 네트워크

시각언어모델의 발화감정 모호성 해소와 심리대화 이해를 위한 다중수준 인사이트 네트워크

본 논문은 인간 대화의 비언어적 단서를 시각‑언어 모델에 통합하려는 시도 중 가장 포괄적인 접근법이라 할 수 있다. 첫 번째 문제인 ‘발화‑감정 모호성’은 입술 움직임이 감정 표현과 겹쳐 보이는 현상으로, 기존 VLM이 텍스트와 이미지 간의 연관성을 학습할 때 이중 의미를 구분하지 못해 심리적 추론에 오류를 일으킨다. MIND는 이러한 모호성을 해결하기 위해 계층적 구조를 채택하고, 각 레이어에서 시간적 특징 분산을 계산해 변동성이 낮은(즉, 감정과 무관한) 입술 패턴을 억제한다. 이 ‘상태 판단’ 모듈은 기존의 단순 attenti

Analysis Model
시간 영역 조건부 생성 모델을 이용한 지진 강진 합성 및 현장 특성 학습

시간 영역 조건부 생성 모델을 이용한 지진 강진 합성 및 현장 특성 학습

본 논문은 지진공학 분야에서 현장별 강진 기록을 인공적으로 생성할 수 있는 새로운 데이터‑드리븐 모델을 제시한다는 점에서 큰 의미를 가진다. 기존의 강진 합성 방법은 주로 스펙트럼 기반 혹은 물리‑기반 시뮬레이션에 의존했으며, 현장 특성을 충분히 반영하기 위해서는 복잡한 파라미터 튜닝이 필요했다. 반면 본 연구는 시간 영역에서 직접 가속도 신호를 다루는 TimesNet‑Gen을 도입함으로써, 현장별 고유의 “잠재적 병목”(latent bottleneck)이라는 작은 차원의 임베딩을 통해 현장 특성을 압축하고 재현한다. 이는 현장마다

Learning

< 분야별 논문 현황 (Total: 792) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
9
HEP-EX
7
HEP-PH
12
HEP-TH
7
MATH-PH
4
NUCL-TH
1
Quantum Physics
11

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키