KOINEU Logo
LLM과 SAST 도구의 계층적 CWE 예측 평가 ALPHA 벤치마크

LLM과 SAST 도구의 계층적 CWE 예측 평가 ALPHA 벤치마크

본 논문은 LLM과 전통적인 정적 분석 도구(SAST)의 취약점 탐지 능력을 비교 평가하기 위해 새로운 벤치마크 프레임워크인 ALPHA를 설계한 점에서 학술적·실무적 의의가 크다. 기존의 이진 분류 기반 벤치마크는 “취약점 존재 여부”만을 판단하도록 제한돼, 개발자가 실제 코드 수정에 활용할 수 있는 구체적인 CWE(CWE‑Common Weakness Enumeration) 정보를 제공하지 못한다는 한계가 있었다. ALPHA는 이러한 한계를 극복하기 위해 함수 수준에서 CWE 레이블을 부여하고, 오류 유형을 세 가지 계층적 패널티(

Computer Science Software Engineering
No Image

AI 주도 사회의 독성: Chirper.ai에서의 대규모 감사 연구

본 논문은 AI 기반 소셜 에이전트가 온라인 플랫폼에서 어떻게 행동하는지에 대한 깊이 있는 이해를 제공하며, 특히 독성 콘텐츠 생성과 관련된 문제점을 집중적으로 분석한다. 이 연구는 Chirper.ai라는 플랫폼을 통해 LLM 기반 에이전트의 동작 패턴을 경험적으로 감사하고, 이러한 에이전트들이 어떻게 독성을 생성하고 채택하는지에 대한 중요한 통찰력을 제공한다. 기술적 혁신성 본 논문은 AI 기반 소셜 에이전트의 행동 이해를 위한 새로운 접근법을 제시한다. 특히, Chirper.ai 플랫폼을 활용하여 LLM 기반 에이전트가 독성 콘

Computer Science Multiagent Systems
LLM 기반 가격 책정의 콜루션 위험: 규제와 시장 집중성의 관점

LLM 기반 가격 책정의 콜루션 위험: 규제와 시장 집중성의 관점

본 논문은 알고리즘 기반 가격 결정 체계에서 대형 언어 모델(LLM)이 불법적인 담합을 유발할 수 있는 잠재적 위험에 대해 깊이 있게 분석하고 있습니다. 이 연구는 LLM의 공유된 지식 인프라와 데이터 집적 정책이 어떻게 시장 수준에서 조율되지 않은 협력을 가능하게 하는지, 그리고 이러한 메커니즘은 어떻게 실제 비즈니스 환경에서 위험성을 높이는지를 설명하고 있습니다. 기술적 혁신성 본 논문의 주요 기술적 혁신성은 LLM이 가격 책정에 활용될 때 발생할 수 있는 콜루션 위험을 이론적으로 분석하는 것입니다. 특히, 본 연구는 LLM이

Economics
안전성과 해석 가능성 우선: 급성 뇌졸중 영상 진단을 위한 에이전트 기반 AI 프레임워크

안전성과 해석 가능성 우선: 급성 뇌졸중 영상 진단을 위한 에이전트 기반 AI 프레임워크

본 논문은 급성 뇌졸중 영상 진단을 위한 AI 시스템의 개선 방향을 제시하며, 특히 불확실성 인식과 의사결정 제어 메커니즘을 통합한 에이전트 기반 접근 방식에 초점을 맞추고 있습니다. 이 연구는 의료 AI 분야에서 중요한 문제를 해결하려는 시도로, 안전성, 해석 가능성 및 임상 관련성을 강조하고 있습니다. 기술적 혁신성 본 논문의 핵심 혁신은 에이전트 기반 AI 프레임워크를 통해 불확실성 인식과 의사결정 제어 메커니즘을 통합한 것입니다. 이 접근 방식은 단순히 예측을 제공하는 것이 아니라, 불확실성이 높은 경우 보류 결정을 내릴 수

Framework Image Processing Electrical Engineering and Systems Science
대형 언어 모델과 휴리스틱 규칙으로 보는 소셜미디어 양극화 측정

대형 언어 모델과 휴리스틱 규칙으로 보는 소셜미디어 양극화 측정

이 논문은 기존 감성 분석이나 사전 학습된 분류기 중심의 양극화 연구와 차별화되는 두 가지 핵심 요소를 제시한다. 첫째, 대형 언어 모델을 활용해 텍스트에서 ‘입장(stance)’, ‘감정적 어조(affective tone)’, ‘동의·반대 패턴(agreement dynamics)’을 다층적으로 추출한다는 점이다. 기존 방법은 주로 단일 차원의 감성 점수(긍정/부정) 혹은 사전 정의된 레이블(찬성/반대)만을 제공했지만, LLM은 문맥을 고려해 미묘한 입장 변화를 포착하고, 감정의 강도와 유형(분노, 슬픔, 혐오 등)까지 세분화한다.

Computer Science Social Networks Model
소매점의 자원 제약을 극복하는 LSTM 압축: 정확도와 효율성 사이의 최적 균형 찾기

소매점의 자원 제약을 극복하는 LSTM 압축: 정확도와 효율성 사이의 최적 균형 찾기

이 논문은 소매 판매 예측 분야에서 LSTM 네트워크의 효율성과 정확성을 극대화하는 방법에 대해 깊이 있게 탐구하고 있다. 특히, 이 연구는 자원 제약을 가진 소규모 및 중소 규모 매장에서도 효과적인 AI 기반 예측 시스템을 구축할 수 있도록 하는 모델 압축 기법의 중요성을 강조한다. 기술적 혁신성 이 논문은 LSTM 네트워크를 압축하는 다양한 방법론을 체계적으로 평가하고, 특히 64개 은닉 유닛을 가진 모델이 가장 높은 예측 정확도를 보이는 것을 발견했다. 이는 표준 LSTM(128개 은닉 유닛)보다 메모리 사용량을 줄이고 추론

Computer Science Network Machine Learning Model
No Image

FlashInfer Bench AI 기반 LLM 시스템을 위한 선순환 구축

FlashInfer‑Bench 논문은 “AI‑generated GPU kernel”이라는 최신 연구 흐름을 실제 서비스 환경에 적용하기 위한 인프라스트럭처 설계라는 관점에서 매우 의미 있는 기여를 하고 있다. 첫 번째 핵심은 FlashInfer Trace 라는 메타데이터 스키마이다. 기존에 LLM이 생성한 코드를 단순히 텍스트로 저장하고 인간이 수동으로 검증하는 방식은 확장성이 떨어진다. Trace는 커널 인터페이스(입출력 텐서 형태, 메모리 요구량), 워크로드 특성(배치 크기, 시퀀스 길이), 구현 세부사항(언어, 컴파일 옵션)

Computer Science Artificial Intelligence System
비조영 CT 기반 폐색전증 자동 진단을 위한 3D 딥러닝 모델

비조영 CT 기반 폐색전증 자동 진단을 위한 3D 딥러닝 모델

본 논문은 임상 현장에서 조영제 사용에 따른 부작용과 시간 지연 문제를 해결하고자, 비조영 CT 영상만을 이용해 폐색전증을 자동으로 판별하는 3D 합성곱 신경망(3D‑CNN) 모델을 개발하였다. 먼저 데이터셋 구축 단계에서 조영제 사용이 금지된 환자군과 기존 CTPA 영상에서 라벨링된 폐색전증 사례를 매칭시켜, 비조영 CT와 라벨 정보를 일치시켰다. 이는 라벨링 비용을 크게 절감하면서도 실제 임상 상황을 반영한 데이터베이스를 확보하는 전략이다. 모델 구조는 입력 볼륨을 3차원으로 처리하여 폐혈관 및 주변 조직의 미세한 밀도 차이를

Computer Vision Computer Science Learning
No Image

동적 정보 기반 반복 자동 프로그램 수리

DynaFix가 제시하는 핵심 아이디어는 “실행‑레벨 동적 정보”를 반복적인 피드백 루프에 통합함으로써 LLM 기반 APR의 한계를 극복한다는 점이다. 기존 LLM‑APR 연구는 주로 정적 코드 구조와 테스트 스위트 결과에 의존했으며, 이는 프로그램의 실제 동작을 반영하지 못한다. 정적 정보만으로는 변수 값의 변동, 조건문 분기, 예외 발생 경로 등 복잡한 런타임 상황을 정확히 파악하기 어렵다. DynaFix는 이러한 문제를 해결하기 위해 매 라운드마다 프로그램을 실제로 실행하고, 변수 스냅샷, 제어 흐름 트레이스, 호출 스택 등

Computer Science Software Engineering
무작위 짧은 청크로 긴 법률 문서 분류

무작위 짧은 청크로 긴 법률 문서 분류

이 논문은 법률 문서와 같이 텍스트 길이가 수천 토큰에 달하는 도메인에서 Transformer 모델의 입력 제한을 우회하기 위한 실용적인 접근법을 제시한다. 기존 연구들은 보통 전체 문서를 슬라이딩 윈도우 방식으로 나누거나, 핵심 문장을 추출하는 전처리 단계에 의존한다. 그러나 슬라이딩 윈도우는 연산량이 급증하고, 핵심 문장 추출은 도메인 특화된 요약 모델이 필요해 추가 비용이 발생한다. 저자들은 이러한 문제를 “무작위 청크 샘플링”이라는 간단하지만 효과적인 전략으로 해결한다. 48개의 청크를 무작위로 선택함으로써 문서 전체의 다양

Computer Science NLP
No Image

시간적 근거를 갖춘 비디오‑언어 모델을 위한 팩터화 학습

이 논문은 기존 비디오‑언어 모델이 “한 번에 전체 비디오를 요약하고 질문에 답한다”는 전통적인 패러다임을 탈피한다는 점에서 큰 의미가 있다. 기존 방법들은 종종 시간적 정보를 흐릿하게 처리하거나, 근거가 되는 시각적 증거를 명시적으로 제시하지 못해 해석 가능성이 낮았다. 저자들은 이러한 한계를 극복하기 위해 두 가지 핵심 아이디어를 제시한다. 첫 번째는 generation objective의 factorization 이다. 모델이 먼저 “어떤 시간 구간이 질문에 대한 근거가 되는가”를 판단하고, 그 구간에 해당하는 evidence

Computer Science Model Learning Computer Vision
지반공학에서 딥러닝: 물리 기반 신경망과 연산자 학습에 대한 비판적 고찰

지반공학에서 딥러닝: 물리 기반 신경망과 연산자 학습에 대한 비판적 고찰

이 논문은 최근 지반공학 분야에 도입된 세 가지 딥러닝 프레임워크—물리 기반 신경망(PINN), 딥 연산자 네트워크(DeepONet), 그래프 네트워크 시뮬레이터(GNS)—를 전통적인 수치 해법과 직접 비교함으로써 실용성을 평가한다. 첫 번째 실험인 파동 전파 문제는 고주파 동적 응답을 정확히 포착해야 하는 전형적인 테스트베드이다. 여기서 PINN은 물리 방정식을 손실 함수에 직접 삽입하는 방식임에도 불구하고, 미분 연산과 최적화 과정에서 발생하는 수치적 불안정성으로 인해 유한차분(FD) 대비 90 000배 느려졌다. 오차 측면에서

Learning Physics
통합 구현형 VLM 추론과 로봇 행동을 위한 자동회귀 이산 사전학습

통합 구현형 VLM 추론과 로봇 행동을 위한 자동회귀 이산 사전학습

이 논문은 로봇 조작 시스템이 직면한 두 가지 핵심 과제, 즉 “넓은 의미적 일반화”와 “고정밀 연속 제어” 사이의 균형을 정밀하게 진단하고 해결책을 제시한다는 점에서 큰 의미가 있다. 먼저 ERIQ(Embodied Reasoning Intelligence Quotient)라는 새로운 벤치마크를 도입했는데, 이는 기존 VLA 모델 평가가 “입력‑출력” 형태의 성공률에만 초점을 맞추는 반면, 질문‑답변 형태의 6천 개 이상 데이터셋을 통해 ‘추론 단계’를 별도로 측정한다는 점이 차별점이다. 네 가지 추론 차원(예: 물체 관계 이해,

Computer Science Robotics
초월적 그래프 임베딩으로 보는 이상 탐지 혁신

초월적 그래프 임베딩으로 보는 이상 탐지 혁신

하이퍼볼릭 그래프 임베딩은 최근 복잡하고 비유클리드적인 네트워크 구조를 모델링하는 데 주목받고 있다. 전통적인 유클리드 임베딩은 노드 간 거리와 관계를 평면 혹은 저차원 유클리드 공간에 투사함으로써 트리 구조나 스케일‑프리 네트워크와 같은 고차원적 계층성을 충분히 표현하지 못한다. 반면, 하이퍼볼릭 공간은 지수적으로 확장되는 볼륨 특성을 가지고 있어, 동일한 차원 내에서 더 많은 노드를 구분할 수 있다. 이러한 특성은 특히 이상 탐지와 같이 정상 패턴과 비정상 패턴 사이의 미세한 차이를 포착해야 하는 작업에 유리하다. 본 논문에서는

Detection
학습 역학을 위한 다층 형식 기술 프레임워크

학습 역학을 위한 다층 형식 기술 프레임워크

이 논문이 제시하는 다층 형식 기술 프레임워크는 학습 과정을 ‘기술’한다는 점에서 기존의 ‘예측·최적화’ 중심 모델과 근본적으로 차별화된다. 학습은 단순히 성과를 높이는 목표 함수의 최소화가 아니라, 학습자 내부의 상태가 외부 자극과 어떻게 상호작용하면서 변형되는가에 대한 서술적 이해가 필요하다. 이를 위해 저자는 학습을 네 개의 기능적 층—부하 생성층, 내부 변환층, 관찰·측정층, 평가·조절층—으로 분리하고, 각 층이 담당하는 책임을 명확히 정의한다. 첫 번째 부하 생성층은 외부 과제·자료가 학습자에게 제공될 때 발생하는 인지 부

Learning System
빅데이터 교육 실습 종합 보고서

빅데이터 교육 실습 종합 보고서

종합 분석: 빅데이터 교육 실습 보고서 1. 연구 개요와 방법론 본 연구는 빅데이터 프로젝트의 통합적 접근 방식을 취하며, 세 가지 사례를 통해 다양한 데이터 유형과 규모에 대한 분석 기법을 다룹니다. Epsilon 데이터셋 : 이진 분류 문제를 해결하기 위해 MLP 모델을 사용하여 2000개의 특징과 100,000개의 인스턴스로 훈련되었습니다. PyTorch와 GPU 가속(CUDA)을 활용해 88.98%의 정확도를 달성했습니다. Rest Mex 데이터셋 : 멕시코 관광 리뷰 데이터셋에 대해 감정 분석 파이프라인을 구현하였습니다.

Data Learning
독일 최고법원 보도자료 생성 데이터셋과 LLM 벤치마크

독일 최고법원 보도자료 생성 데이터셋과 LLM 벤치마크

본 논문은 법률 분야에서 일반 대중에게 판결을 전달하는 ‘보도자료’라는 특수한 텍스트 장르에 초점을 맞춘 최초의 대규모 데이터셋과 벤치마크를 제시한다는 점에서 학술적·실용적 의의가 크다. 기존 NLP 연구는 주로 판결문 자체의 구조적 요약이나 법률용어 추출 등에 머물렀으며, 시민이 이해하기 쉬운 형태의 커뮤니케이션을 다루지는 않았다. 따라서 CourtPressGER은 ‘판결문‑보도자료‑프롬프트’라는 삼중 트리플 구조를 통해, 원문과 인간이 만든 요약(보도자료) 사이의 정밀한 정렬을 제공한다. 이는 LLM이 단순히 요약을 넘어, 법적

Data
신뢰성은 설계다 에이전트형 AI의 구조적 원칙

신뢰성은 설계다 에이전트형 AI의 구조적 원칙

이 논문이 제시하는 핵심 논지는 “신뢰성은 모델 자체가 아니라 시스템의 구조에 달려 있다”는 점이다. 에이전트형 AI를 단순히 대규모 언어 모델이나 이미지 생성 모델의 집합으로 보는 관점에서 벗어나, 목표‑관리자, 플래너, 도구‑라우터, 실행기, 메모리, 검증기, 안전‑모니터, 텔레메트리 등으로 명확히 구분된 모듈들로 구성된 ‘아키텍처’를 강조한다. 각 모듈은 스키마‑제한 인터페이스 를 통해서만 통신하도록 설계되며, 이는 입력·출력 형식이 사전에 정의된 JSON 스키마 등으로 검증됨을 의미한다. 이렇게 하면 모델이 예기치 않은 형태

메타계층 강화학습을 이용한 O RAN 자원 관리와 네트워크 슬라이싱 최적화

메타계층 강화학습을 이용한 O RAN 자원 관리와 네트워크 슬라이싱 최적화

본 논문은 O‑RAN 환경에서 자원 할당과 네트워크 슬라이싱을 동시에 최적화하기 위한 새로운 학습 프레임워크를 제시한다는 점에서 학술적·실무적 의의가 크다. 첫 번째로, 기존 메타‑강화학습(Meta‑RL) 연구들은 주로 단일 레벨 정책을 학습하는 데 그쳤으며, 복잡한 O‑RAN 시스템처럼 다중 계층의 의사결정 구조를 반영하지 못했다. 저자는 이를 보완하기 위해 고수준 ‘자원 할당 컨트롤러’와 저수준 ‘슬라이스 내부 스케줄러’라는 두 개의 에이전트를 계층적으로 배치하고, 각각이 독립적인 강화학습 과정을 수행하도록 설계하였다. 이러한

Learning
인간 중심 공정성 프레임워크로 보는 AI 공정성 다중 목표 최적화

인간 중심 공정성 프레임워크로 보는 AI 공정성 다중 목표 최적화

본 논문은 AI 시스템의 공정성을 다루는 기존 연구들의 한계를 정확히 짚어낸다. 현재까지 대부분의 연구는 하나의 공정성 지표—예를 들어 그룹 공정성 혹은 개별 공정성—에 초점을 맞추어 해당 지표를 최적화하려는 접근을 취했다. 그러나 실제 사회적·법적 맥락에서는 여러 공정성 개념이 동시에 충돌하고, 이해관계자마다 중시하는 가치가 다르다. 예를 들어 사법 분야에서는 ‘동등 기회(EOP)’와 ‘결과 평등’ 사이에 뚜렷한 긴장이 존재하고, 의료 분야에서는 환자 그룹 간의 접근성 차이를 최소화하려는 동시에 치료 효율성을 유지해야 하는 복합적

Framework
다중프랙탈 비정상 시계열의 차원별 상관행렬 스펙트럼 분석 및 암호화폐 시장 적용

다중프랙탈 비정상 시계열의 차원별 상관행렬 스펙트럼 분석 및 암호화폐 시장 적용

본 논문은 복잡계 분석에서 흔히 마주치는 세 가지 핵심 난제—비정상성, 장기 의존성(롱 메모리), 그리고 헤비테일 분포—를 동시에 고려한 새로운 상관행렬 구축 방법을 제시한다는 점에서 학문적 의의가 크다. 기존의 공분산 행렬은 평균과 분산을 전제로 하여 비정상적인 트렌드나 비선형 변동을 제대로 포착하지 못한다. 저자들은 다중프랙탈 비정상 교차상관계수 ρ r을 도입함으로써, 시계열을 다중스케일로 분해하고 각 스케일에서 특정 진폭 범위의 변동만을 강조하도록 설계하였다. 여기서 r은 변동의 크기를 조절하는 차수 매개변수로, r > 0이면

인공지능의 약한 의지와 아크라시아 벤치마크: 일관성 붕괴와 목표 전이 분석

인공지능의 약한 의지와 아크라시아 벤치마크: 일관성 붕괴와 목표 전이 분석

분석 요약 1. 논문 주제 및 목표: 본 논문은 인공지능(AI) 시스템의 안전성과 관련된 문제를 다룹니다. 특히, '아크라시아'라는 개념을 통해 AI의 일관성 붕괴와 목표 전이를 분석합니다. 아크라시아는 고대 철학에서 인간의 판단과 충동 사이의 갈등을 설명하는 용어로, 이 논문에서는 이를 AI 맥락에 적용하여 모델이 글로벌 지식과 로컬 컨텍스트 사이에서 일관성을 유지하지 못할 때 발생하는 문제를 탐구합니다. 2. 아크라시아 벤치마크의 개발: 논문은 '아크라시아 벤치마크'라는 새로운 평가 방법을 제안합니다. 이 벤치마크는 모델이 글로

System
자동항체 언어 모델 pIgGen의 생성 조절을 위한 TopK 및 Ordered 희소 오토인코더 분석

자동항체 언어 모델 pIgGen의 생성 조절을 위한 TopK 및 Ordered 희소 오토인코더 분석

본 논문은 단백질 언어 모델, 특히 항체 서열을 생성하도록 설계된 pIgGen에 대한 메커니즘적 해석을 목표로 한다. 이를 위해 두 종류의 희소 오토인코더, 즉 TopK SAE와 Ordered SAE를 도입하였다. TopK SAE는 각 레이어에서 가장 큰 K개의 활성값만을 보존함으로써 희소성을 강제하고, 이를 통해 잠재 공간의 개별 차원이 특정 생물학적 특성과 강하게 연관되는지를 탐색한다. 실험에서는 특정 뉴런(또는 뉴런 집합)이 항체의 CDR(Complementarity Determining Region) 길이, 친화도, 혹은 특

Model
진화적 추론 최적화 약한 대형 언어 모델의 시스템2 능력 향상

진화적 추론 최적화 약한 대형 언어 모델의 시스템2 능력 향상

본 논문은 현재 대형 언어 모델이 보여주는 “특정 작업에 대한 뛰어난 성능”과 “일반적인 지능, 특히 시스템 2와 연관된 느린 사고 능력” 사이의 격차를 명확히 짚어낸다. 시스템 2는 인간이 복잡한 논리적 문제를 해결할 때 의식적으로 수행하는 고차원적 사고 과정을 의미한다. 기존 LLM은 대규모 데이터에 기반한 패턴 학습을 통해 빠른 시스템 1 스타일의 응답을 제공하지만, 논리적 일관성이나 다단계 추론이 요구되는 상황에서는 오류가 빈번히 발생한다. 이러한 한계를 극복하기 위해 저자들은 진화론적 메커니즘을 차용한 ERO 프레임워크를

System
문화 지능과 가치 추론 품질 벤치마크: 미국 흑인 커뮤니티를 위한 CIVIQ 개발

문화 지능과 가치 추론 품질 벤치마크: 미국 흑인 커뮤니티를 위한 CIVIQ 개발

이 논문은 현재 AI·LLM 분야에서 급부상하고 있는 문화적 편향 문제를 실질적으로 해결하려는 시도로서 의미가 크다. 기존의 대부분 LLM은 대규모 인터넷 텍스트를 기반으로 학습되기 때문에 서구 중심의 언어·문화적 서술이 과다하게 반영된다. 결과적으로 비서구·소수자 집단이 겪는 경험이나 가치관이 제대로 반영되지 않아, 이들 집단이 LLM을 활용할 때 오해·불쾌감을 유발하거나, 중요한 의사결정에서 부정확한 정보를 제공할 위험이 있다. 이러한 문제를 인식하고 ‘문화‑인식’ LLM을 개발하려는 움직임은 필수적이며, 특히 ChatBlack

멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

본 연구는 최근 급부상하고 있는 멀티모달 기초 모델, 특히 비전‑언어 모델(Vision‑Language Model, VLM)의 기상 분야 적용 가능성을 최초로 시도한 사례라 할 수 있다. 전통적인 해상예보는 기상 관측값(위성, 레이더, 관측소 등)을 인간 기상학자가 해석하고, 정형화된 텍스트 형식으로 재작성하는 복합적인 워크플로우를 요구한다. 이러한 과정은 높은 인적 비용과 시간 지연을 초래하며, 특히 급변하는 기상 상황에 대한 실시간 대응력을 저해한다. 연구팀은 먼저 격자형 기상 데이터를 시간‑공간 차원을 포함한 비디오 시퀀스로

Model
3D 공간 언어 이해를 위한 지시 기반 마스킹 전략

3D 공간 언어 이해를 위한 지시 기반 마스킹 전략

본 논문은 3D 장면‑언어 멀티모달 모델에서 디코더의 어텐션 마스크가 성능에 미치는 영향을 심도 있게 탐구한다는 점에서 큰 의의를 가진다. 기존의 LLM 기반 3D 추론 방법들은 자연어 처리에서 검증된 인과적(causal) 마스크를 그대로 차용했는데, 이는 텍스트가 순차적 구조를 갖는다는 전제에 기반한다. 그러나 3D 객체는 공간적 위치와 관계에 의해 정의되며, 객체 간 순서는 의미가 없거나 오히려 방해가 될 수 있다. 인과 마스크는 이러한 순서‑무관성을 무시하고, 객체 토큰이 이전 토큰에만 의존하도록 강제함으로써 공간적 상호작용을

LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

본 논문은 자연어‑논리 변환 작업에서 LLM의 환각 문제를 완화하기 위한 실용적인 접근법을 제시한다는 점에서 의미가 크다. 첫째, 저자는 “자연어 → 논리식 → CNF”라는 3단계 파이프라인을 명확히 정의하고, 각 단계에서 발생할 수 있는 오류 원인을 분석한다. 특히, 논리식 생성 단계에서 LLM이 문맥을 오해하거나 논리 연산자를 잘못 선택하는 경우가 빈번히 발생한다는 점을 지적하고, 이를 자체 정의 문법으로 제한함으로써 모델이 허용된 구조 내에서만 출력을 생성하도록 강제한다. 이러한 문법 기반 필터링은 기존의 후처리 방식보다 사전

Model
깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

본 논문은 현재 가장 널리 사용되는 트랜스포머 기반 대형 언어 모델(Large Language Model, LLM)이 “깊이 일반화(depth generalization)”라는 중요한 차원에서 한계를 보인다는 점을 명확히 규명한다. 기존 연구는 주로 시퀀스 길이가 훈련 데이터보다 길어질 때 모델이 어떻게 일반화되는지를 탐구했으며, 이를 “길이 일반화”라고 부른다. 그러나 실제 자연어와 수학·논리 문제에서는 단순히 시퀀스가 길어지는 것이 아니라, 괄호·연산자·논리 연산자의 중첩 구조가 깊어지는 경우가 빈번하다. 이러한 중첩 구조는 스

Model
고밀도 레이스트랙 메모리를 위한 압축 기반 다중비트 오류 정정 기법

고밀도 레이스트랙 메모리를 위한 압축 기반 다중비트 오류 정정 기법

본 연구는 차세대 고밀도 비휘발성 메모리인 레이스트랙 메모리(RTM)의 신뢰성 문제를 근본적으로 해결하고자 하는 시도이다. RTM은 전통적인 SRAM에 비해 10배 이상 높은 집적도를 제공하면서도 읽기·쓰기 지연이 짧아 캐시 메모리 교체 후보로 적합하지만, 전류 흐름을 제어하기 위한 도메인 이동 과정에서 발생하는 스토캐스틱한 오류와 데이터 셔플링 오류가 다중 비트 오류를 초래한다. 이러한 오류는 기존의 단일 비트 ECC(예: SEC)나 2비트 정정 ECC(예: DECTED)로는 충분히 방어할 수 없으며, 다중 비트 정정을 위해서는

Data
법률 AI의 환각 방지를 위한 그래프 기반 정합성 평가 프레임워크

법률 AI의 환각 방지를 위한 그래프 기반 정합성 평가 프레임워크

본 논문은 법률 분야에서 인공지능 기반 자동 문서 생성이 직면한 가장 핵심적인 문제인 ‘환각(hallucination)’을 그래프 이론을 활용해 체계적으로 해결하려는 시도다. 기존의 환각 탐지 방법은 주로 텍스트 간 의미 유사도를 계산하는 방식에 의존한다. 이러한 접근법은 문맥상 유사해 보이지만 실제로는 중요한 엔터티(예: 당사자명, 사건 일자, 조항 번호)가 잘못 교체되거나 누락되는 경우를 포착하지 못한다. 법률 문서는 작은 엔터티의 변형만으로도 판결 결과에 큰 영향을 미칠 수 있기 때문에, 보다 정밀하고 해석 가능한 검증 메커니

Detection System
세계 정합성을 위한 강화학습과 그라운드 제어

세계 정합성을 위한 강화학습과 그라운드 제어

본 논문이 제시하는 “Reinforcement Learning with World Grounding”(RLWG) 접근법은 기존 비디오 기반 세계 모델이 겪는 기하학적 불일치 문제를 근본적으로 해결하려는 시도이다. 전통적인 비디오 세계 모델은 주로 프레임‑간 재구성 손실을 최소화함으로써 학습되는데, 이러한 손실은 시각적 일관성은 확보하지만 물리적·기하학적 제약을 충분히 반영하지 못한다. 결과적으로 모델이 생성한 가상 환경은 인간이 직관적으로 인식하는 물리 법칙과 어긋나는 경우가 빈번하다. RLWG는 이러한 한계를 극복하기 위해 두 가

Model
신경연산자를 활용한 초대질량 블랙홀 서브그리드 모델링

신경연산자를 활용한 초대질량 블랙홀 서브그리드 모델링

초대질량 블랙홀(SMBH)과 그 숙주 은하의 공동 진화는 현대 천체물리학에서 가장 난제 중 하나이다. 물리적 과정이 블랙홀 주변의 밀리파섹 규모에서 은하 전체의 메가파섹 규모에 이르기까지 10⁹배에 달하는 거리와 시간 스케일을 포괄한다는 점에서, 전통적인 첫 원리 시뮬레이션은 계산 자원 한계로 인해 실현 불가능하다. 따라서 연구자들은 ‘서브그리드’ 접근법을 사용해 미세 스케일의 물리학을 거시 스케일 시뮬레이션에 삽입한다. 기존 서브그리드 모델은 보통 고정된 효율 파라미터(예: Eddington 제한, α 디스크 모델)나 이론적 추정

Framework
희소 스펙 메모리 효율적인 자기 추측 디코딩

희소 스펙 메모리 효율적인 자기 추측 디코딩

이 논문은 최근 대형 언어 모델이 복잡한 문제를 해결하기 위해 체인‑오브‑쓰루(Chain‑of‑Thought)와 같은 긴 추론 과정을 거칠 때, 메모리 대역폭이 주요 병목으로 작용한다는 점을 정확히 짚어낸다. 전통적인 디코딩 방식에서는 매 토큰마다 KV‑Cache에 저장된 모든 이전 토큰에 대해 완전 어텐션을 수행한다. 토큰 수가 늘어날수록 KV‑Cache의 크기도 선형적으로 증가하고, 이에 따라 메모리 읽기·쓰기 비용이 급증한다. 특히 GPU 메모리 용량이 제한적인 상황에서 이러한 메모리‑바운드 특성은 실시간 응용에 큰 제약이 된

Model
극심한 비용 비대칭을 극복한 인과 기반 예측 유지보수

극심한 비용 비대칭을 극복한 인과 기반 예측 유지보수

예측 유지보수는 설비 고장을 사전에 감지해 생산 중단을 방지하고, 유지보수 비용을 최소화하려는 핵심 전략이다. 그러나 제조 현장에서는 고장을 놓치는 비용이 오경보(불필요한 정비) 비용보다 수십 배에서 수백 배까지 크게 차이 나는 ‘비용 비대칭’ 현상이 존재한다. 이 비대칭은 단순히 정확도(accuracy)나 AUC와 같은 통계적 지표만으로는 모델의 실제 가치를 평가하기 어렵게 만든다. 예를 들어, 고장 발생률이 3.3%에 불과한 상황에서 99% 정확도를 달성하더라도 오경보가 과다하면 전체 비용이 급증한다. 따라서 비용 기반 목표 함

기계 학습 삭제의 프라이버시 위협과 텔레포테이션 방어: WARP의 실효성 분석

기계 학습 삭제의 프라이버시 위협과 텔레포테이션 방어: WARP의 실효성 분석

기계 학습 모델에서 특정 샘플을 ‘삭제’하는 작업은 실제 서비스 환경에서 개인정보 보호 규정을 준수하기 위해 필수적이다. 전통적인 완전 재학습 방식은 비용이 많이 들고 실시간 서비스에 적용하기 어렵다. 따라서 최근에는 근사 삭제(approximate unlearning) 기법이 활발히 연구되고 있다. 이들 기법은 원본 모델 파라미터를 약간만 조정하거나, 손실 함수에 삭제 대상 샘플을 제외한 형태로 재학습함으로써 빠른 삭제를 목표로 한다. 하지만 본 논문이 지적하듯, 근사 삭제는 두 가지 구조적 특성 때문에 프라이버시 위험을 내포한다

Learning
언어와 보상이 결합된 프롬프트 기반 정책 탐색

언어와 보상이 결합된 프롬프트 기반 정책 탐색

Prompted Policy Search(ProPS)는 기존 강화학습 패러다임에 근본적인 변화를 시도한다. 전통적인 RL 알고리즘은 주로 환경으로부터 얻는 스칼라 보상에 기반해 정책을 업데이트한다. 이 접근법은 수학적으로는 깔끔하지만, 실제 문제에서는 목표 설명, 제약 조건, 인간 전문가의 조언 등 텍스트 형태의 풍부한 메타 정보를 무시한다는 한계가 있다. ProPS는 이러한 한계를 극복하기 위해 대형 언어 모델(LLM)을 정책 최적화의 핵심 엔진으로 활용한다. 구체적으로, 에이전트가 환경에서 얻은 보상과 함께 “목표는 ‘공을 잡아

Learning
동작 편집 기반 비디오 변환: 모션 카운터팩추얼을 활용한 확산 모델

동작 편집 기반 비디오 변환: 모션 카운터팩추얼을 활용한 확산 모델

본 논문은 최근 급격히 발전하고 있는 텍스트‑투‑비디오·이미지‑투‑비디오 생성 모델의 ‘움직임 제어’ 라는 부수적 기능을, ‘정밀 움직임 편집’ 이라는 새로운 관점으로 전환한다는 점에서 학술적·산업적 의의가 크다. 기존 연구는 주로 텍스트 프롬프트에 따라 전반적인 동작을 생성하거나, 이미지에 부착된 포즈를 애니메이션화하는 방식에 머물렀다. 그러나 실제 영상 편집 현장에서는 특정 객체의 경로를 미세하게 수정하거나, 특정 구간에서만 움직임을 바꾸고 싶어하는 요구가 빈번히 발생한다. 이러한 요구를 충족시키기 위해 저자들은 입력 영상으로부

전체 차원 연관성을 활용한 고속 수렴 최적화기 HVAdam

전체 차원 연관성을 활용한 고속 수렴 최적화기 HVAdam

본 연구는 현재 딥러닝 커뮤니티에서 널리 사용되는 적응형 옵티마이저인 Adam·RMSProp이 갖는 근본적인 구조적 한계를 지적한다. 기존 적응형 방법은 1차원(각 파라미터)별로 순간적인 1차·2차 모멘트를 추정해 학습률을 조정한다. 이는 각 파라미터가 독립적으로 움직인다는 전제 하에 설계된 것이며, 실제 고차원 손실 표면에서는 파라미터 간 상관관계가 복잡하게 얽혀 있다. 이러한 상관관계를 무시하면, 예를 들어 손실이 좁은 골짜기 형태로 연속되는 경우 한 차원에서는 급격히 감소하지만 다른 차원에서는 완만히 변하는 상황에서, 개별 학

신뢰 기반 사회 학습으로 촉진되는 자생 커뮤니케이션

신뢰 기반 사회 학습으로 촉진되는 자생 커뮤니케이션

TSLEC 논문은 기존의 다중 에이전트 커뮤니케이션 연구에서 간과되던 ‘사회적 전이’를 체계적으로 모델링한 점이 가장 큰 혁신이다. 기존 접근법은 각 에이전트가 환경 보상만을 이용해 독립적으로 언어를 형성하도록 설계돼, 초기 탐색 단계에서 무수히 많은 비효율적인 신호 조합이 발생한다. 이러한 비효율성은 학습 곡선이 완만하고, 최종 프로토콜이 비구조적이며, 환경 변화에 취약한 단점으로 이어진다. TSLEC은 두 가지 핵심 메커니즘을 도입한다. 첫째, 교사‑학생 메커니즘 을 통해 에이전트가 자신의 성공적인 행동‑신호 매핑을 다른 에이전

Learning
자동화된 추론 공격 전문가 AttackPilot LLM 기반 무인 위험 평가 에이전트

자동화된 추론 공격 전문가 AttackPilot LLM 기반 무인 위험 평가 에이전트

본 연구는 추론 공격(inference attack)이라는 기존 보안 평가 기법에 LLM 기반 자율 에이전트를 결합함으로써, “전문가 수준의 공격 수행을 비전문가에게 제공한다”는 혁신적인 목표를 설정한다. 먼저, 공격 수행에 필요한 단계—목표 모델 식별, 데이터 수집, 공격 전략 선택, 파라미터 튜닝, 결과 해석—를 명시적으로 행동(action)으로 분해하고, 각각을 LLM이 호출할 수 있는 API 형태로 구현하였다. 이러한 작업‑특화 행동 공간은 에이전트가 불필요한 추론을 최소화하고, 토큰 비용을 크게 절감하도록 설계되었다는 점이

다중 LLM을 활용한 유전 알고리즘 기반 자연어 과제 최적화

다중 LLM을 활용한 유전 알고리즘 기반 자연어 과제 최적화

본 논문이 제시하는 MultiGA는 기존 LLM 활용 방식에 중요한 변화를 도입한다. 전통적으로 하나의 사전 학습된 모델을 선택하고, 필요에 따라 파인튜닝하거나 프롬프트 엔지니어링을 적용해 성능을 끌어올리는 것이 일반적이었다. 그러나 파인튜닝은 대규모 데이터와 연산 비용이 요구되며, 프롬프트 설계는 전문가 수준의 노하우가 필요하다. 이에 비해 MultiGA는 “다중 소스 시딩”이라는 아이디어를 통해 여러 LLM의 출력을 동시에 활용한다는 점에서 혁신적이다. 초기 집단을 다양한 모델에서 추출함으로써, 각 모델이 가진 고유한 강점(예:

양자 개인 정보 검색: 하위 선형 통신 복잡성으로 혁신

양자 개인 정보 검색: 하위 선형 통신 복잡성으로 혁신

본 논문은 양자 개인 정보 검색 프로토콜 에 대한 심도 있는 분석을 제공합니다. 이는 서버로부터 데이터베이스 항목을 비공개로 검색하는 방법으로, Chor, Kushilevitz, Goldreich 및 Sudan의 연구에서 시작된 분야입니다. 본 논문은 공개 데이터베이스가 보편화됨에 따라 더욱 중요해진 이 주제를 다룹니다. 1. 개인 정보 검색 프로토콜의 배경 본 논문은 Chor, Kushilevitz, Goldreich 및 Sudan의 연구에서 시작된 개인 정보 검색 분야를 소개합니다. 이는 서버로부터 데이터베이스 항목을 비공개로

Computational Complexity Quantum Physics Computer Science Cryptography and Security
RBS 0413: 블자르에서 발견된 고에너지 감마선 방출

RBS 0413: 블자르에서 발견된 고에너지 감마선 방출

: 이 논문은 고에너지 천체물리학에서 중요한 발견 중 하나인 RBS 0413에서의 감마선 방출에 대해 자세히 설명하고 있습니다. RBS 0413은 BL 라케타로 분류되며, 이는 활동 은하핵(AGN) 중 하나로 관찰자의 축 방향에 대해 작은 각도로 제트 축이 기울어져 있는 천체입니다. 이러한 특성 때문에 RBS 0413은 블자르로 분류되며, 이는 고에너지 감마선 방출을 포함한 다양한 에너지 범위에서의 복잡한 스펙트럼을 보여줍니다. 논문에서는 VERITAS와 Fermi LAT 두 가지 관측 장비를 사용하여 RBS 0413의 에너지 분포

Astrophysics
Markarian 421의 급성 폭발: VERITAS 관측 결과

Markarian 421의 급성 폭발: VERITAS 관측 결과

이 논문은 VERITAS 관측기를 통해 Markarian 421이라는 BL Lac 객체의 급성 발광 활동을 연구한 내용을 담고 있다. Markarian 421은 적색편이 z 0.031의 고주파 피크(HBL) BL Lac 객체로, 강렬하고 빠른 변동성을 보이는 특징적인 블라자르이다. 블라자르의 특성 블라자르는 활동은하핵(AGN)의 하위 분류로, 전체 전자기 스펙트럼에서 비열적 방출과 빠른 변동성을 보이는 특징을 가지고 있다. 이는 매우 상대론적인 제트 내에서 발생하는 광자를 시사한다. 이러한 블라자르의 스펙트럼은 일반적으로 낮은 에너

Astrophysics
PSR J1831 0952 주변에서 발견된 매우 높은 에너지 감마선 방출

PSR J1831 0952 주변에서 발견된 매우 높은 에너지 감마선 방출

: 1. 연구 배경 및 목적 H.E.S.S. (High Energy Stereoscopic System)은 매우 높은 에너지(VHE) 감마선 방출원을 탐색하는 데 중요한 역할을 하는 첨단 망원경 배열입니다. 이 시스템은 은하계 평면 조사를 통해 60개 이상의 고에너지 감마선 원천을 발견해 왔습니다. 특히, GPS 핵심 지역에서 Crab 네부보다 2% 이상 높은 감도성을 달성한 것은 H.E.S.S.의 성능을 입증하는 중요한 결과입니다. 2. 데이터 수집 및 분석 방법 HESS J1831 098에 대한 데이터는 다양한 시간대에 수집되었

Astrophysics

< 분야별 논문 현황 (Total: 701) >

Electrical Engineering and Systems Science
7
General
254
General Relativity
7
HEP-EX
5
HEP-PH
12
HEP-TH
5
MATH-PH
3
NUCL-TH
1
Quantum Physics
9

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키