Model

'Model' 태그의 모든 글

총 101개의 글
시간순 정렬
대형 언어 모델과 휴리스틱 규칙으로 보는 소셜미디어 양극화 측정

대형 언어 모델과 휴리스틱 규칙으로 보는 소셜미디어 양극화 측정

이 논문은 기존 감성 분석이나 사전 학습된 분류기 중심의 양극화 연구와 차별화되는 두 가지 핵심 요소를 제시한다. 첫째, 대형 언어 모델을 활용해 텍스트에서 ‘입장(stance)’, ‘감정적 어조(affective tone)’, ‘동의·반대 패턴(agreement dynamics)’을 다층적으로 추출한다는 점이다. 기존 방법은 주로 단일 차원의 감성 점수(긍정/부정) 혹은 사전 정의된 레이블(찬성/반대)만을 제공했지만, LLM은 문맥을 고려해 미묘한 입장 변화를 포착하고, 감정의 강도와 유형(분노, 슬픔, 혐오 등)까지 세분화한다.

Computer Science Social Networks Model
소매점의 자원 제약을 극복하는 LSTM 압축: 정확도와 효율성 사이의 최적 균형 찾기

소매점의 자원 제약을 극복하는 LSTM 압축: 정확도와 효율성 사이의 최적 균형 찾기

이 논문은 소매 판매 예측 분야에서 LSTM 네트워크의 효율성과 정확성을 극대화하는 방법에 대해 깊이 있게 탐구하고 있다. 특히, 이 연구는 자원 제약을 가진 소규모 및 중소 규모 매장에서도 효과적인 AI 기반 예측 시스템을 구축할 수 있도록 하는 모델 압축 기법의 중요성을 강조한다. 기술적 혁신성 이 논문은 LSTM 네트워크를 압축하는 다양한 방법론을 체계적으로 평가하고, 특히 64개 은닉 유닛을 가진 모델이 가장 높은 예측 정확도를 보이는 것을 발견했다. 이는 표준 LSTM(128개 은닉 유닛)보다 메모리 사용량을 줄이고 추론

Computer Science Network Machine Learning Model
No Image

시간적 근거를 갖춘 비디오‑언어 모델을 위한 팩터화 학습

이 논문은 기존 비디오‑언어 모델이 “한 번에 전체 비디오를 요약하고 질문에 답한다”는 전통적인 패러다임을 탈피한다는 점에서 큰 의미가 있다. 기존 방법들은 종종 시간적 정보를 흐릿하게 처리하거나, 근거가 되는 시각적 증거를 명시적으로 제시하지 못해 해석 가능성이 낮았다. 저자들은 이러한 한계를 극복하기 위해 두 가지 핵심 아이디어를 제시한다. 첫 번째는 generation objective의 factorization 이다. 모델이 먼저 “어떤 시간 구간이 질문에 대한 근거가 되는가”를 판단하고, 그 구간에 해당하는 evidence

Computer Science Model Learning Computer Vision
자동항체 언어 모델 pIgGen의 생성 조절을 위한 TopK 및 Ordered 희소 오토인코더 분석

자동항체 언어 모델 pIgGen의 생성 조절을 위한 TopK 및 Ordered 희소 오토인코더 분석

본 논문은 단백질 언어 모델, 특히 항체 서열을 생성하도록 설계된 pIgGen에 대한 메커니즘적 해석을 목표로 한다. 이를 위해 두 종류의 희소 오토인코더, 즉 TopK SAE와 Ordered SAE를 도입하였다. TopK SAE는 각 레이어에서 가장 큰 K개의 활성값만을 보존함으로써 희소성을 강제하고, 이를 통해 잠재 공간의 개별 차원이 특정 생물학적 특성과 강하게 연관되는지를 탐색한다. 실험에서는 특정 뉴런(또는 뉴런 집합)이 항체의 CDR(Complementarity Determining Region) 길이, 친화도, 혹은 특

Model
멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

본 연구는 최근 급부상하고 있는 멀티모달 기초 모델, 특히 비전‑언어 모델(Vision‑Language Model, VLM)의 기상 분야 적용 가능성을 최초로 시도한 사례라 할 수 있다. 전통적인 해상예보는 기상 관측값(위성, 레이더, 관측소 등)을 인간 기상학자가 해석하고, 정형화된 텍스트 형식으로 재작성하는 복합적인 워크플로우를 요구한다. 이러한 과정은 높은 인적 비용과 시간 지연을 초래하며, 특히 급변하는 기상 상황에 대한 실시간 대응력을 저해한다. 연구팀은 먼저 격자형 기상 데이터를 시간‑공간 차원을 포함한 비디오 시퀀스로

Model
LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

본 논문은 자연어‑논리 변환 작업에서 LLM의 환각 문제를 완화하기 위한 실용적인 접근법을 제시한다는 점에서 의미가 크다. 첫째, 저자는 “자연어 → 논리식 → CNF”라는 3단계 파이프라인을 명확히 정의하고, 각 단계에서 발생할 수 있는 오류 원인을 분석한다. 특히, 논리식 생성 단계에서 LLM이 문맥을 오해하거나 논리 연산자를 잘못 선택하는 경우가 빈번히 발생한다는 점을 지적하고, 이를 자체 정의 문법으로 제한함으로써 모델이 허용된 구조 내에서만 출력을 생성하도록 강제한다. 이러한 문법 기반 필터링은 기존의 후처리 방식보다 사전

Model
깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

본 논문은 현재 가장 널리 사용되는 트랜스포머 기반 대형 언어 모델(Large Language Model, LLM)이 “깊이 일반화(depth generalization)”라는 중요한 차원에서 한계를 보인다는 점을 명확히 규명한다. 기존 연구는 주로 시퀀스 길이가 훈련 데이터보다 길어질 때 모델이 어떻게 일반화되는지를 탐구했으며, 이를 “길이 일반화”라고 부른다. 그러나 실제 자연어와 수학·논리 문제에서는 단순히 시퀀스가 길어지는 것이 아니라, 괄호·연산자·논리 연산자의 중첩 구조가 깊어지는 경우가 빈번하다. 이러한 중첩 구조는 스

Model
세계 정합성을 위한 강화학습과 그라운드 제어

세계 정합성을 위한 강화학습과 그라운드 제어

본 논문이 제시하는 “Reinforcement Learning with World Grounding”(RLWG) 접근법은 기존 비디오 기반 세계 모델이 겪는 기하학적 불일치 문제를 근본적으로 해결하려는 시도이다. 전통적인 비디오 세계 모델은 주로 프레임‑간 재구성 손실을 최소화함으로써 학습되는데, 이러한 손실은 시각적 일관성은 확보하지만 물리적·기하학적 제약을 충분히 반영하지 못한다. 결과적으로 모델이 생성한 가상 환경은 인간이 직관적으로 인식하는 물리 법칙과 어긋나는 경우가 빈번하다. RLWG는 이러한 한계를 극복하기 위해 두 가

Model
희소 스펙 메모리 효율적인 자기 추측 디코딩

희소 스펙 메모리 효율적인 자기 추측 디코딩

이 논문은 최근 대형 언어 모델이 복잡한 문제를 해결하기 위해 체인‑오브‑쓰루(Chain‑of‑Thought)와 같은 긴 추론 과정을 거칠 때, 메모리 대역폭이 주요 병목으로 작용한다는 점을 정확히 짚어낸다. 전통적인 디코딩 방식에서는 매 토큰마다 KV‑Cache에 저장된 모든 이전 토큰에 대해 완전 어텐션을 수행한다. 토큰 수가 늘어날수록 KV‑Cache의 크기도 선형적으로 증가하고, 이에 따라 메모리 읽기·쓰기 비용이 급증한다. 특히 GPU 메모리 용량이 제한적인 상황에서 이러한 메모리‑바운드 특성은 실시간 응용에 큰 제약이 된

Model
마운더 최소기의 비밀: 플럭스 전송 다이너모 모델로 탐구

마운더 최소기의 비밀: 플럭스 전송 다이너모 모델로 탐구

: 서론 분석 서론에서 저자들은 태양 활동 주기 중 가장 중요한 특징 중 하나인 마운더 최소기에 대해 설명한다. 이 기간 동안 태양 흑점 수가 현저히 감소했으며, 이러한 사실은 여러 연구에서 확인되었다(Ribes & Nesme Ribes, 1993; Hoyt & Schatten, 1996). 특히, 양 극반구 모두에서 태양 흑점 수가 거의 제로에 가까워졌으며 남반구에서는 마지막 단계에서 몇 개의 흑점이 나타났다(Ribes & Nesme Ribes, 1993). 코스모제닉 동위 원소 데이터(Beer et al., 1998; Miyah

Model Astrophysics
SN 1996cr의 X선 신비: 폭발물과 주변 물질의 기하학적 관계 탐색

SN 1996cr의 X선 신비: 폭발물과 주변 물질의 기하학적 관계 탐색

본 연구는 SN 1996cr의 X선 스펙트럼 분석을 통해 초신성의 기하학적 특성을 밝히고자 했다. 이 연구는 초신성의 폭발 후 배출물과 주변 물질(CSM) 간의 상호작용에 대한 깊이 있는 이해를 제공하며, 이를 통해 초신성의 진화 과정을 추적할 수 있다. 1. SN 1996cr의 발견 및 특징 SN 1996cr은 순환 은하에서 발견되었으며, 초기에는 일반적인 Type IIn 초신성으로 분류되었다. 그러나 시간이 지나면서 X선 밝기가 급격히 증가하는 독특한 행동을 보였다. 이는 SN 1987A와 유사하며, 다른 X선 검출 초신성과 핵

Model Astrophysics
금융시장의 이상파: 복잡한 변동성과 옵션가격 모델을 통한 분석

금융시장의 이상파: 복잡한 변동성과 옵션가격 모델을 통한 분석

이 논문은 비선형 과학에서 중요한 개념인 프리크 파도를 금융 시장에 적용하여 새로운 모델을 제시한다. 프리크 파도는 해양학, 광학 등 다양한 분야에서 연구되었으며, 이 현상의 특징은 극단적인 사건이 발생할 때 나타나는 거대한 파도이다. 논문에서는 이러한 개념을 금융 시장에 적용하여 변동성과 옵션 가격 간의 상호작용을 분석하고, 이를 통해 금융 위기와 같은 극단적인 사건을 설명하려고 한다. 1. 프리크 파도 현상 프리크 파도는 비선형 과학에서 중요한 개념으로, 다양한 분야에서 연구되었다. 이 논문에서는 이러한 프리크 파도의 특성을 금

Nonlinear Sciences Quantitative Finance Model
중성미자의 초광속 측정: 통계적 오류 가능성 탐구

중성미자의 초광속 측정: 통계적 오류 가능성 탐구

: 본 논문은 중성미자의 초광속 측정에 대한 회의적인 관점을 제시하며, 이를 위해 통계적 방법론과 고전 물리학 원리를 활용한다. 특히, OPERA 실험에서 도출된 결과를 재해석하고 그 이면에 존재하는 수학적 개념을 명확히 하기 위한 목적으로 작성되었다. 1. 연구 배경 및 목적 OPERA 협업은 중성미자가 빛의 속도를 초과한다는 놀라운 결과를 발표했다. 그러나 본 논문에서는 이러한 결과에 대해 회의적인 입장을 취하며, 통계적 오류 가능성과 고전 물리학 원리를 통해 이를 재해석하려고 한다. 2. 연구 방법론 가정 및 모델링: 확률 밀

Physics Model HEP-PH HEP-EX
No Image

외환 시장에서의 최적화된 다통화 거래 전략

본 연구는 외환 시장을 대상으로 한 다통화 거래 전략을 최적화하기 위한 알고리즘을 제안하며, 이 알고리즘이 어떻게 동작하는지에 대해 상세히 설명하고 있습니다. 논문은 비선형 확률 파동 모델(NSW 모델)을 기반으로 하며, 이를 통해 복잡한 시스템의 행동을 예측하고 최적화할 수 있는 방법론을 제시합니다. 1. 알고리즘의 원칙과 구조 알고리즘은 두 가지 주요 원칙에 따라 작동합니다: 동역학 최적화와 수직 자율 조립입니다. 동역학 최적화는 랜덤 솔루션 생성을 포함하며, 이 솔루션들은 효과성에 따라 '생존'하거나 '제거'됩니다. 이 과정은

Quantitative Finance Model
No Image

암시적 변동성의 수학적 탐구: Bachelier 모델과 Black Scholes 모델 간의 동등성

: 이 논문은 암시적 변동성에 대한 새로운 접근 방식을 제시하고 있으며, 특히 Bachelier 모델에서의 정규 변동성과 Black Scholes 모델에서의 로그 정규 변동성 간의 동등성을 탐구한다. 이 연구는 기존의 암시적 변동성에 대한 이해를 확장시키며, 고주파 거래와 관련된 다양한 시나리오에서 활용 가능하다. 1. Bachelier 모델과 Black Scholes 모델 간의 동등성 논문은 Bachelier 모델에서의 정규 변동성이 단기 만기 옵션 가격 결정에 더 적합하다는 점을 강조한다. 이는 기본 자산의 하루 간 가격 변화가

Quantitative Finance Model
No Image

중성미자와 광자의 경계에서의 마법 전이복사

1. 이론적 배경 및 연구 목적 중성미자는 물리학에서 가장 미묘한 입자 중 하나로, 표준 모델에 따르면 매우 작은 질량을 가지고 있습니다. 이러한 특성이 있기 때문에, 중성미자의 상호작용은 양자장 이론을 통해 설명되어야 합니다. 본 연구에서는 중성미자가 두 가지 다른 굴절률을 가진 매질의 경계를 통과할 때 발생하는 전이복사를 탐구합니다. 전이복사는 입사 중성미자가 출사 중성미자와 광자를 방출하면서 발생하는 현상입니다. 이 과정은 중성미자의 운동량 보존을 위반하며, 매질의 특성이 이러한 상호작용에 중요한 역할을 합니다. 2. 연구 방

Model HEP-PH Astrophysics
감마선 폭발의 비밀: GRB090902B의 광구 가열 분석

감마선 폭발의 비밀: GRB090902B의 광구 가열 분석

: 서론 및 연구 배경 감마선 폭발(GRB)은 우주에서 가장 강력한 방출 현상 중 하나로, 그 발생 메커니즘에 대한 이해는 여전히 미완성 상태입니다. 불볼 모델은 GRB의 급성 방출을 설명하는 주요 이론으로, 상대적으로 빠르게 팽창하는 불볼에서 발생하는 가열이 방출을 일으킨다는 개념을 제시합니다. 그러나 대부분의 GRB 스펙트럼은 흑체 복사 특성을 명확히 나타내지 않으며, 이는 비열적 성분과 함께 서브도미난트 열 성분의 존재를 시사합니다. 비열적 성분 및 가열 메커니즘 GRB 제트 내에서 발생하는 가열은 고에너지 꼬리 부분을 포함한

Analysis Model Astrophysics
대질량 별의 비열적 라디오 방출: Cyg OB2 No. 9를 중심으로

대질량 별의 비열적 라디오 방출: Cyg OB2 No. 9를 중심으로

본 논문은 대질량 별, 특히 Wolf Rayet 및 OB 유형의 별들이 비열적 라디오 방출을 나타내는 현상을 다루고 있다. 이 비열적 복사는 충돌 없는 충격에서 상대론적 전자가 가속되어 생성되는 페르미 메커니즘에 의해 발생한다. 이론 모델(Eichler & Usov, 1993)은 이러한 충격이 방사력적으로 주도되는 바람이 쌍성 또는 다중 시스템에서 충돌하여 발생한다는 것을 제시하고 있다. Cyg OB2 No. 9는 O5 + O6 7 쌍성으로, Van Loo 등 (2008)은 이 별의 라디오 복사 데이터가 약 2.355년의 주기로 변

Model Astrophysics Data
지진 위험 평가를 위한 지역 지진 확률 모델(RELM) 방법론 분석

지진 위험 평가를 위한 지역 지진 확률 모델(RELM) 방법론 분석

: 지진 위험 평가는 장기간 피해 발생 가능성을 나타내는 지도 제작에 기반한다. 이러한 지도 생성은 역사적인 지진 데이터, 저강도 지진 활동, 구텐베르크 리처 법칙 등 다양한 접근 방식을 포함하며, 이들 방법의 차이로 인해 객관적인 지진 모델 테스트 및 순위를 매기는 통계적 방법론 개발이 중요해졌다. 미국 지질조사국(USGS)의 협동 연구 기관인 CSEP(Collaboratory for the Study of Earthquake Predictability)는 이러한 필요성을 충족하기 위해 캘리포니아 지역을 대상으로 한 RELM(Re

Model Physics
Adversary lower bounds in the Hamiltonian oracle model

Adversary lower bounds in the Hamiltonian oracle model

Catchy Title KO: 하미턴 오라클 모델에서 적대자 방법을 통한 양자 쿼리 복잡도 분석 Abstract KO: 이 논문은 양자 쿼리 모델에서 함수 계산의 복잡성을 분석하는 데 사용되는 적대자 방법에 초점을 맞추고 있다. 특히, 이 논문에서는 하미턴 오라클 모델이라는 연속 시간 모델을 통해 이러한 방법론을 적용하고, 이를 통해 양자 알고리즘의 쿼리 복잡도를 분석한다. 이는 이산 쿼리 모델과 분수 쿼리 모델에서 사용되는 적대자 방법과 유사하지만, 연속 시간 모델에서는 하미턴 오라클을 통해 함수 계산이 수행된다. Deep Ana

Model Computational Complexity Quantum Physics Computer Science
No Image

소셜 네트워크에서의 의견 확산: 인플루언서와 작은 세계 효과

본 논문은 소셜 네트워크에서 정보와 의견이 어떻게 확산되는지에 대한 심도 있는 분석을 제공한다. 특히, 기존 모델들이 논쟁 가능한 정보의 확산 과정을 정확히 설명하지 못하는 한계를 지적하고, 이를 극복하기 위한 새로운 접근법을 제시한다. 1. 기존 연구와의 차별화 전염병 확산 모델 : 이 모델은 정보나 의견이 확산되는 과정을 질병 전염과 유사하게 설명한다. 그러나, 논쟁 가능한 정보는 단순히 노출에 의한 감염만으로 설명하기 어렵다. 기준 모델 (복잡한 전염) : 이 모델은 개인의 의견 형성이 그의 주변 네트워크 구성원들의 영향을 받

Model Physics Network Social Networks Computer Science
O형 별 충돌 바람 이중성 시스템에서 동조복사 방출 모델링

O형 별 충돌 바람 이중성 시스템에서 동조복사 방출 모델링

: 본 논문은 Cyg OB2 No. 9라는 O형 별 충돌 바람 이중성 시스템에서 발생하는 동조복사 방출에 대한 모델링 연구를 다룹니다. 이 시스템은 1984년 비열적 방출원으로 처음 발견되었으며, Van Loo 외 (2008)의 VLA 관측을 통해 2.35년 주기를 가진 동조복사 발산성을 확인하였습니다. 이러한 주기적인 변동은 별풍 충돌이 비열적 라디오 방출의 원인임을 시사하며, 이는 Eichler & Usov (1993)와 Dougherty 외 (2003), Pittard 외 (2006) 등의 연구에서 제시된 가설과 일치합니다.

Model Astrophysics
No Image

DrivingGen 자율주행 생성 비디오 월드 모델 종합 벤치마크

DrivingGen 논문은 현재 자율주행 분야에서 급증하고 있는 ‘생성 비디오 세계 모델’ 연구의 평가 체계가 부재함을 정확히 짚어낸다. 기존 벤치마크가 주로 PSNR, SSIM, LPIPS와 같은 전통적인 비디오 품질 지표에 의존하는데, 이러한 지표는 픽셀 수준의 차이를 정량화할 뿐, 자율주행에 필수적인 물리적 일관성이나 안전성을 반영하지 못한다. 예를 들어, 차량이 갑자기 사라지거나 보행자가 비현실적인 속도로 움직이는 경우, 시각적으로는 높은 SSIM을 기록하더라도 실제 주행 시나리오에서는 치명적인 오류가 된다. 논문은 이러한

Computer Science Model Computer Vision
데이터 복잡도 인식 딥 모델 성능 예측

데이터 복잡도 인식 딥 모델 성능 예측

이 논문은 “데이터 복잡도 인식 딥 모델 성능 예측”이라는 주제로, 모델 설계 단계에서 사전적으로 성능을 추정할 수 있는 경량화된 두 단계 프레임워크를 제시한다. 첫 번째 단계는 데이터 자체의 통계적·구조적 특성을 기반으로 베이스라인 성능을 예측한다. 여기에는 데이터 분산, 클래스 불균형, 이미지 해상도, 텍스트 길이 등 다양한 메트릭이 포함되며, 이러한 특성은 기존 연구에서 모델 복잡도와 직접적인 상관관계를 보인 바 있다. 두 번째 단계는 모델 아키텍처(예: 레이어 수, 파라미터 규모, 연산량)와 주요 하이퍼파라미터(학습률, 배치

Computer Science Data Machine Learning Model
데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

본 논문은 최근 의료 영상 분야에서 각광받고 있는 비전‑언어 모델(VLM)의 실제 운영 단계에서 발생할 수 있는 ‘데이터 시프트(data shift)’ 문제에 초점을 맞추었다. 데이터 시프트는 크게 두 가지 차원으로 나뉜다. 첫 번째는 입력 데이터 자체가 훈련 시와 다른 분포를 보이는 경우이며, 두 번째는 모델이 출력하는 예측값이나 신뢰도(confidence)가 변하는 경우이다. 기존 연구들은 주로 입력 차원의 통계적 변화를 탐지하는 방법에 의존했지만, 이러한 변동이 반드시 모델 성능 저하와 직결되지 않는다는 점을 간과하고 있었다.

Computer Science Model Data Computer Vision
No Image

LLM은 스스로의 한계를 알까

이 논문은 “메타‑인지”라는 관점에서 LLM의 자기 평가 능력을 체계적으로 검증한다는 점에서 의미가 크다. 먼저 연구진은 “성공 예측”이라는 이진 판단을 통해 모델이 자신의 한계를 얼마나 정확히 인식하는지를 측정하였다. 여기서 사용된 평가지표는 단순 정확도뿐 아니라 ROC‑AUC와 같은 구별력 지표이며, 이는 모델이 과신(over‑confidence)과 과소신(under‑confidence) 사이에서 어느 정도 균형을 잡는지를 보여준다. 결과는 대부분의 최신 LLM이 높은 확신을 보이지만, 무작위보다 높은 AUC를 기록한다는 점이다

Computer Science NLP Model
반사실 자기질문을 통한 언어 모델 정책 최적화 안정화

반사실 자기질문을 통한 언어 모델 정책 최적화 안정화

본 논문이 제시하는 Counterfactual Self‑Questioning(CSQ)은 기존 자기 개선 메커니즘이 안고 있던 “외부 의존성”이라는 근본적인 문제를 근본적으로 해결한다는 점에서 학술적·실용적 의미가 크다. 먼저, CSQ는 하나의 언어 모델이 스스로 “왜 이 추론이 틀렸는가”를 탐색하도록 설계된 세 단계 파이프라인을 도입한다. 초기 롤아웃 단계에서 모델은 일반적인 chain‑of‑thought 방식으로 문제를 해결하고, 그 과정에서 생성된 중간 단계와 최종 답안을 그대로 보관한다. 이어지는 자기질문 단계에서는 모델이 “

Computer Science Artificial Intelligence Model
흐름을 타라 에이전트 제작과 록앤롤 그리고 오픈 에이전트 학습 생태계 내 ROME 모델 구축

흐름을 타라 에이전트 제작과 록앤롤 그리고 오픈 에이전트 학습 생태계 내 ROME 모델 구축

본 논문은 “에이전트 제작(agentic crafting)”이라는 개념을 기존의 일회성 텍스트 생성과 구별하여, 실제 세계에서 다중 턴을 거쳐 행동하고 그 결과를 관찰·피드백하는 반복적 프로세스로 정의한다. 이는 단순히 코드를 자동 생성하는 수준을 넘어, 복합적인 툴 체인과 언어 기반 워크플로 전반에 걸쳐 모델이 계획·실행·모니터링·수정까지 전 과정을 담당해야 함을 의미한다. 이러한 요구를 충족하려면 모델 자체뿐 아니라, 모델이 작동할 환경, 데이터 파이프라인, 학습·배포 인프라가 모두 유기적으로 연결된 ‘에이전트 학습 생태계(AL

Model Artificial Intelligence System Computer Science Learning
No Image

하이퍼그래프 기반 메모리를 활용한 다단계 RAG의 장기 컨텍스트 복합 관계 모델링 향상

본 논문은 다단계 RAG 시스템에서 메모리의 역할을 근본적으로 재정의한다는 점에서 학술적·실용적 의의가 크다. 기존 연구들은 메모리를 “수동적 저장소”로 간주하고, 검색된 텍스트 조각들을 단순히 압축하거나 순차적으로 연결하는 방식에 머물렀다. 이러한 접근은 개별 사실을 나열하는 수준에 그치며, 사실 간의 복합적 관계—예를 들어, 인과관계, 공통 원인, 상호 보완적 증거 등—를 포착하지 못한다. 결과적으로 장기 문맥에서 여러 단계에 걸친 추론이 단절되고, 전역적 의미망을 형성하는 데 한계가 발생한다. HGMEM은 이러한 문제를 해결하

Computer Science NLP Model
PathFound 증거 탐색형 병리 진단을 위한 에이전트형 멀티모달 모델

PathFound 증거 탐색형 병리 진단을 위한 에이전트형 멀티모달 모델

PathFound 논문은 기존 병리학 인공지능 모델이 갖는 ‘한 번에 전체 슬라이드 처리’라는 한계를 명확히 지적하고, 실제 병리학자의 진단 과정과 유사한 증거‑중심적 순환 프로세스 를 도입함으로써 새로운 연구 방향을 제시한다. 먼저, 모델 아키텍처는 세 가지 핵심 모듈로 구성된다. ① 시각 기반 파운데이션 모델 은 대용량 디지털 슬라이드에서 고해상도 특징을 추출하고, ② 비전‑언어 모델(VLM) 은 이미지 특징을 텍스트 형태의 임상 질문이나 설명과 연결한다. ③ 강화학습(RL) 기반 추론 에이전트 는 현재 진단 가설을 평가하고,

Computer Science Model Computer Vision
의료 AI의 진단 능력: 현실과 간극

의료 AI의 진단 능력: 현실과 간극

이 논문은 의료 분야에서 인공 지능(AI)의 실제 성능을 평가하는 중요한 연구를 제공한다. 특히, 이 연구는 AI 모델들이 실제 임상 상황에서 얼마나 효과적으로 작동하는지에 대한 깊이 있는 통찰력을 제공한다. B&J 벤치마크는 의료 분야에서 AI의 성능을 종합적으로 평가하기 위한 체계적인 접근법을 제시하며, 이는 기존의 단순한 선택지 문제를 넘어 실제 환자 치료에 필요한 다양한 추론 능력을 평가한다. 연구 결과는 AI 모델들이 구조화된 질문에서는 높은 성능을 보이지만, 실제 임상 상황에서 요구되는 복잡하고 다중모달적인 추론에는 아직

Model
시간을 꿈꾸는 로봇 조작을 위한 행동조건 세계모델

시간을 꿈꾸는 로봇 조작을 위한 행동조건 세계모델

ChronoDreamer는 로봇 매니퓰레이션 분야에서 가장 난해한 문제 중 하나인 ‘접촉 예측’을 시각‑언어‑물리 통합 프레임워크로 풀어낸 점이 혁신적이다. 기존 세계 모델은 주로 이미지와 관절 상태만을 이용해 미래 프레임을 예측했지만, 접촉 정보가 결여돼 실제 물리적 상호작용을 안전하게 계획하기 어려웠다. 본 연구는 접촉을 ‘깊이 가중 가우시안 스플랫’이라는 2D 이미지 형태로 변환함으로써, 기존 비전 백본(ViT 등)과 자연스럽게 결합한다. 이 방식은 3D 힘 벡터를 카메라 좌표계에 투사해 시각적 특징과 동시 학습이 가능하도록

Model
기반모델의 의료영상 진단: 가능성과 한계

기반모델의 의료영상 진단: 가능성과 한계

본 논문은 기반모델(Foundation Models)이 의료 영상 분야에서 어떻게 활용되고 있는지에 대해 깊이 있게 분석합니다. FMs는 단순히 패턴을 인식하는 데 그치지 않고, 복잡한 임상 사고를 모방하고 공간 관계를 이해하며 다중모달 데이터를 통합하는 능력을 갖추고 있습니다. 그러나 이러한 가능성과 실제 활용 사이에는 큰 간극이 존재합니다. 논문은 FMs의 핵심 기능과 한계를 평가하면서, 이들 모델들이 진정한 인지력을 보여주고 있는지 아니면 표면적인 패턴을 단순히 흉내 내는 것인지에 대해 검토하고 있습니다. 또한 논문은 통계적

Model
모델 간 추론 연쇄 교환 가능성 탐구

모델 간 추론 연쇄 교환 가능성 탐구

본 논문은 추론 연쇄의 중간 산출물을 다른 모델이 이어받을 수 있는지를 실험적으로 검증함으로써, LLM 연구 분야에 새로운 시각을 제공한다. 첫 번째 핵심 기여는 ‘추론 교환 가능성’이라는 개념을 정의하고, 이를 정량화하기 위한 평가 프레임워크를 구축한 점이다. 저자들은 토큰‑레벨 로그‑확률을 기준으로 추론을 세 단계(초기, 중간, 후기)로 트렁케이트하고, 각 단계마다 프로세스 보상 모델(PRM)을 적용해 논리적 일관성과 정답 정확도를 측정한다. 이때 사용된 두 베이스 모델인 Gemma‑3‑4B‑IT와 LLaMA‑3.1‑70B‑In

Model
해석 가능한 결정트리 기반 선호 베이지안 최적화

해석 가능한 결정트리 기반 선호 베이지안 최적화

본 논문은 베이지안 최적화의 한계점을 극복하고자 결정트리를 새로운 대리 모델로 제시한다. 이는 가우시안 프로세스(GP)를 사용하는 기존 방법과 달리 해석성이 뛰어나며, 연속형 및 범주형 데이터 처리 능력이 강화되어 실제 적용에 유용하다. 결정트리는 복잡한 모델을 이해하기 쉽게 시각화할 수 있어, 최적화 과정에서 얻은 결과를 직관적으로 해석하고 활용하는 데 도움이 된다. 특히, 본 논문의 실험에서는 날카로운 함수에 대한 성능 향상이 확인되었으며, 이는 실제 세계에서 자주 발생하는 불규칙적인 데이터 분포에 효과적일 수 있음을 시사한다.

Learning Model
질문을 통한 인터랙티브 추론 결과 기반 질문 최적화 전략

질문을 통한 인터랙티브 추론 결과 기반 질문 최적화 전략

본 논문은 “질문”이라는 행동을 LLM의 핵심 능력으로 재정의하고, 이를 학습 가능한 정책으로 전환하는 혁신적인 프레임워크를 제시한다. 전통적인 LLM 활용 방식은 주어진 프롬프트에 대해 가능한 한 정확한 답을 생성하는 데 초점을 맞추지만, 실제 고위험 응용에서는 사용자가 제공한 정보가 불완전하거나 모호할 때 추가적인 질의가 필요하다. 이러한 상황을 모델이 스스로 인식하고, 교사 모델(보다 강력한 LLM)에게 보완 정보를 요청하도록 학습시키는 것이 핵심 아이디어이다. ODQS는 두 단계 학습 파이프라인을 사용한다. 첫 번째 단계는

Model
대형언어모델의 일관성 강화: 기업환경에서의 정보 안정성 향상

대형언어모델의 일관성 강화: 기업환경에서의 정보 안정성 향상

본 논문은 대형 언어 모델(LLMs)의 일관성 문제를 해결하기 위한 새로운 접근 방식을 제안합니다. LLMs는 다양한 비즈니스 분야에서 중요한 역할을 하지만, 사용자에게 일관된 정보를 제공하는 데 어려움이 있습니다. 이는 특히 기업 환경에서 중요하며, HR 입문, 고객 지원, 정책 공개 등과 같은 시나리오에서는 정보의 안정성이 필수적입니다. 기존 접근 방식은 사실성 향상이나 확률성을 줄이는 데 중점을 두지만, 의미적으로 동등한 프롬프트 간의 일관성을 보장하지는 못합니다. 본 논문에서 제안하는 방법은 그룹 상대 정책 최적화(GRPO)

Model
베이지안 전파형 역산을 통한 대규모 지하 모델의 불확실성 인식

베이지안 전파형 역산을 통한 대규모 지하 모델의 불확실성 인식

이 논문은 베이지안 전파형 역산(FWI) 기법을 이용해 지하 모델의 불확실성을 효과적으로 처리하는 방법을 제시하고 있다. 특히, 대규모 현장 조사에서 실용적이지 않다는 문제를 해결하기 위해 확산 기반 사후 표본 추출과 동시 소스 FWI 데이터를 결합한 새로운 접근 방식을 제안한다. 이 방법은 각 단계에서 파 방정식 해의 수를 줄이고, 모델 공간에서 스토캐스틱 정교화 단계를 적용하여 계산 비용을 크게 감소시키면서도 높은 정확성을 유지할 수 있다. 또한, 속도 패치와 볼륨에 대한 조건 없는 확산 사전 훈련을 통해 소스 관련 수치적 오류

Model
교육 난이도 분석을 위한 콘형 모델

교육 난이도 분석을 위한 콘형 모델

본 논문은 교육용 텍스트의 난이도 평가에 있어 기존의 단순 통계 기반 접근법이 갖는 한계를 지적하고, 의미론적 임베딩 공간을 활용한 새로운 프레임워크를 제시한다. 현재 자연어 처리 분야에서는 Word2Vec, GloVe, FastText, BERT, RoBERTa 등 수십 가지 임베딩 기법이 존재하며, 각각이 텍스트의 의미적 유사성을 다른 방식으로 포착한다. 그러나 교육 현장에서 요구되는 “난이도”라는 추상적 특성은 단순한 의미 유사도와는 별개의 차원을 가진다. 따라서 어떤 임베딩이 난이도 구분에 가장 적합한지를 사전에 알기 어렵다

Model
텍스트 기반 훈련을 위한 텍스트 인쇄 이미지 활용 저비용 LVLM 데이터 생성 전략

텍스트 기반 훈련을 위한 텍스트 인쇄 이미지 활용 저비용 LVLM 데이터 생성 전략

본 논문은 대형 비전‑언어 모델(LVLM)의 학습 비용을 크게 낮출 수 있는 새로운 데이터 생성 방식을 제시한다는 점에서 의미가 크다. 기존 LVLM은 이미지‑텍스트 쌍을 대규모로 수집해야 하는데, 이는 촬영·저작권·프라이버시 등 여러 제약으로 인해 특히 의료·법률·산업 현장 등 특수 도메인에서 어려움을 겪는다. 반면 텍스트는 웹·논문·보고서 등에서 손쉽게 확보할 수 있으며, 대형 언어 모델(LLM)을 이용해 자동으로 변형·확장할 수 있다. 그러나 텍스트만으로 LVLM을 학습하면 ‘모달리티 격차(modality gap)’가 발생한다

Model
진화하는 딥러닝 모델을 위한 적응형 키 기반 사용 제어 시스템 ADALOC

진화하는 딥러닝 모델을 위한 적응형 키 기반 사용 제어 시스템 ADALOC

ADALOC이 제시하는 핵심 아이디어는 “키 영역(Access Key Region)”을 모델 파라미터의 일부로 고정하고, 이후 발생하는 모든 파인튜닝·전이학습·도메인 적응 등을 이 영역에만 제한한다는 점이다. 기존의 키 기반 보호 방식은 전체 파라미터에 암호화된 마스크를 적용하거나, 특정 레이어에 비밀값을 삽입한다. 이러한 방법은 모델이 업데이트될 때 마스크가 손상되거나, 새로운 파라미터가 키와 독립적으로 변형돼 보호가 무효화되는 문제가 있다. ADALOC은 처음 키를 선정할 때, 모델의 손실 곡면과 파라미터 민감도를 분석해 “업데

Model
극성 인식 대조 검색을 활용한 언어 모델 정렬 평가

극성 인식 대조 검색을 활용한 언어 모델 정렬 평가

본 논문은 최근 급부상하고 있는 비지도형 탐지 기법인 Contrast‑Consistent Search(CCS)의 정렬 평가 가능성을 심도 있게 탐구한다. 기존 CCS는 모델이 특정 입력에 대해 일관된 내부 표현을 생성하는지를 확인함으로써, 토큰 수준의 출력 없이도 모델이 어떤 ‘신념’을 가지고 있는지를 추론한다는 장점이 있다. 그러나 이러한 접근이 실제로 모델이 해로운 내용과 안전한 내용을 어떻게 구분하고, 그 구분이 정렬(Alignment)과 얼마나 연관되는지는 아직 명확히 규명되지 않았다. 연구진은 먼저 CCS가 해로운 진술과

Model
모래더미 속의 비밀: 작은 변화가 어떻게 큰 영향을 미치는지

모래더미 속의 비밀: 작은 변화가 어떻게 큰 영향을 미치는지

본 논문은 모래더미 모델에서 작은 교란이 어떻게 확산되는지를 연구하는 것으로, 이는 자율 시스템의 동적 행동에 대한 중요한 이해를 제공한다. 특히, 이 연구는 손상(damage)의 확산을 통해 SOC 상태에서의 역동성을 탐구하며, 이를 통해 모래더미 모델이 어떻게 자기 조직화되고 비판적인 상태를 유지하는지에 대한 깊은 통찰력을 제공한다. 1. 모델 및 시뮬레이션 모래더미 모델은 격자 자동자 모델로, 각 사이트는 정수 값을 가질 수 있는 변수 z(i, j)를 갖는다. 이 값은 모래 입자가 추가될 때마다 증가하고, 특정 임계값 zm에

Condensed Matter Nonlinear Sciences Model
자가 추진체 후류에서 변동하는 난류 점도 연구

자가 추진체 후류에서 변동하는 난류 점도 연구

: 본 연구에서는 자가 추진체의 난류 후류에서 일정한 난류 점도 가정을 폐기하고, 좌표에 따른 변동을 고려하는 새로운 접근 방식을 제시한다. 이는 실제 흐름 현상과 더 잘 부합하며, 기존 모델의 한계를 극복하려는 시도이다. 1. 난류 후류의 중요성 난류 후류의 연구는 과학적 이해뿐만 아니라 실용적인 측면에서도 매우 중요하다. 예를 들어, 공항 운영에서는 난류 후류가 비행기의 이착륙에 영향을 미치며, 해양 표층에서의 혼합 과정은 선박의 운항과 직접적으로 연관되어 있다. 특히, 선박의 난류 후류는 레이더 관측 해석에서 중요한 역할을 하

Physics Model
No Image

압축성 뼈 미세섬유 구조의 3D 다중 규모 모델링: 역식별 방법을 통한 연구

: 본 논문은 압축성 뼈의 미세구조를 다중 규모 모델링을 통해 분석하고자 하는 연구로, 특히 미세섬유(microfibril) 수준에서의 구조와 기계적 특성을 탐구합니다. 이는 골질(cortical bone) 내에서 중요한 역할을 하는 콜라겐 섬유와 그에 포함된 트로포콜라겐 분자들의 배열 및 미네랄화 과정에 대한 심도 있는 이해를 제공합니다. 1. 연구 배경과 목적 본 연구는 압축성 뼈의 복잡한 구조를 이해하고, 이를 통해 뼈의 기계적 특성을 분석하려는 목적으로 수행되었습니다. 이전 연구들은 주로 미세섬유의 기하학적 특성 및 분자 배

Physics Model
현지 거품과 루프 I 거품의 비평형 이온화 구조 탐구

현지 거품과 루프 I 거품의 비평형 이온화 구조 탐구

: 본 논문은 현지 거품(Local Bubble)과 Loop I 거품의 비평형 이온화 구조에 대한 심층적인 분석을 제공하며, 특히 OVI(Oxygen VI) 흡수 기조 밀도와 관련된 관측 데이터를 재현하는 데 초점을 맞추고 있습니다. 연구는 고해상도 3차원 유체역학 시뮬레이션을 통해 이온화 구조의 진화를 추적하고, 이를 실제 관측 결과와 비교하여 LB 및 Loop I 거품의 물리적 특성을 이해하는데 중점을 두었습니다. 서론: 현지 거품은 태양계 주변에 위치한 X선 방출 지역으로, 그 크기와 성질이 여전히 완벽하게 이해되지 않은 상태

Model Astrophysics
GReg을 활용한 유전적 조절 메커니즘 모델링의 혁신

GReg을 활용한 유전적 조절 메커니즘 모델링의 혁신

본 논문은 유전적 조절 메커니즘의 모델링에 있어 기존 시뮬레이션 도구와 모델 체크(model checking) 기법 사이의 균형점을 찾는 데 초점을 맞추고 있다. 특히, GReg이라는 도메인 특정 언어(DSL)를 개발하여 생물학적 개념을 형식화하고, 이를 통해 비전문가도 쉽게 접근할 수 있는 모델 체크 도구를 제공한다. 1. DSL의 필요성 생명과학 분야에서 시뮬레이션 기법은 널리 사용되고 있지만, 이는 특정 조건 하에만 가능한 행동을 탐색하는 데 그치며, 전체적인 시스템 동작을 완전히 이해하기에는 한계가 있다. 반면, 모델 체크는

Computational Engineering Model Logic Computer Science
No Image

이동성 막을 통한 다중 규모 모델링: 생물학적 과정의 새로운 접근법

: 본 논문은 생물학적 과정 연구에 있어 다중 규모 모델링의 중요성과 그 구현 방법을 탐구하고 있습니다. 특히, 이동성 막 시스템이 이러한 모델링 접근법에서 중요한 역할을 하는데 초점을 맞추고 있습니다. 1. 다중 규모 모델링의 필요성 자연 현상은 다양한 공간적 및 시간적 규모에서 상호작용하며 발생합니다. 따라서, 이를 효과적으로 연구하려면 다중 규모 모델링이 필수적입니다. 복잡 자동문(CxA)은 이러한 다중 규모 접근법을 구현하는 데 가장 적합한 시스템으로 간주됩니다. 2. 이동성 막 시스템의 활용 이동성 막 시스템은 생물학적 움

Formal Languages Quantitative Biology Model Computer Science Emerging Technologies
페트리넷과 생물학적 모델링: 상호작용으로부터 얻는 이점

페트리넷과 생물학적 모델링: 상호작용으로부터 얻는 이점

: 본 논문은 페트리넷과 생물학적 시스템 간의 상호작용을 통해 얻을 수 있는 이점을 탐구합니다. 페트리넷은 동시성과 분산 계산을 위한 강력한 도구로, 행동 특성을 분석하고 검증하는 데 사용됩니다. 생물학적 과정을 이해하기 위해 제안된 막 시스템과 반응 시스템은 세포 내 화학 반응을 추상화한 모델입니다. 페트리넷의 원인과 동시성 의미론에 대한 이해는 페트리넷이 어떻게 생물학적 과정을 정확히 모델링할 수 있는지 설명하는 데 중요합니다. 막 시스템은 세포 내 화학 반응에서 영감을 받아 개발되었으며, 이는 페트리넷과 유사한 다중 집합 재구

Formal Languages Distributed Computing Model Computer Science
스플라인 알고리즘을 활용한 고속 신호 복원: 효율적인 컴퓨팅 구조 개발

스플라인 알고리즘을 활용한 고속 신호 복원: 효율적인 컴퓨팅 구조 개발

본 논문의 핵심 내용은 스플라인(spline) 알고리즘을 활용한 고속 신호 복원 컴퓨팅 구조 개발에 대한 것입니다. 이 연구는 디지털 신호 처리 분야에서 중요한 역할을 하는 스플라인 모델의 발전과 적용에 중점을 두고 있습니다. 1. 스플라인 알고리즘의 중요성 스플라인은 다양한 읽기 처리 알고리즘의 보편성을 제공하며, 우수한 미분 및 극한 특성, 높은 추정 수렴도를 가지고 있어 신호 분석과 복원에 널리 사용되고 있습니다. 특히 스플라인은 단순한 형태와 파라미터 계산, 그리고 라운드 오류에 대한 약한 영향으로 인해 1차원 및 다변수 신

Numerical Analysis Model Computer Science

< 분야별 논문 현황 (Total: 770) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
9
HEP-EX
7
HEP-PH
12
HEP-TH
7
MATH-PH
4
NUCL-TH
1
Quantum Physics
10

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키