게시글

모든 게시글 목록입니다. 최신순으로 정렬되어 있습니다.

총 770개의 게시글
총 16페이지
AI 코딩 도우미 시대 ML 프로젝트 성공을 이끄는 네 가지 핵심 요소

AI 코딩 도우미 시대 ML 프로젝트 성공을 이끄는 네 가지 핵심 요소

본 논문은 현재 AI 기반 코딩 어시스턴트가 개발 현장에서 널리 활용되는 상황에서, 왜 여전히 ML 프로젝트의 성공률이 낮은지를 체계적으로 탐구한다. 연구자는 먼저 기존 문헌을 검토하여 성공 요인을 전략, 프로세스, 생태계, 지원 네 가지 차원으로 구분하고, 이를 시각화한 ‘머신러닝 캔버스’를 제안한다. 설문 설계는 각 차원을 정량화할 수 있는 항목들을 포함했으며, 150명의 데이터 과학자를 대상으로 6개월에 걸쳐 데이터를 수집하였다. 통계 분석에는 구조방정식 모델링(SEM)을 활용해 요인 간 인과관계를 검증했으며, β값과 p값을

Learning
No Image

Yukthi Opus 대규모 NP Hard 최적화를 위한 다중 체인 하이브리드 메타휴리스틱

Yukthi Opus(YO)는 메타휴리스틱 설계에서 흔히 발생하는 ‘전역 탐색과 지역 탐색의 균형’ 문제를 세 단계 구조로 명확히 구분함으로써 해결책을 제시한다. 첫 번째 레이어인 MCMC 기반 전역 탐색은 확률적 전이 메커니즘을 이용해 탐색 공간을 균등하게 샘플링하고, 초기 번인 단계에서 충분히 다양한 영역을 방문하도록 설계되었다. 이때 블랙리스트를 도입해 이미 낮은 품질을 보인 지역을 재방문하지 않게 함으로써 불필요한 계산을 크게 절감한다는 점이 눈에 띈다. 두 번째 레이어는 전통적인 탐욕적 로컬 서치를 적용해 현재 위치에서 가

Computer Science Neural Computing
드럼 반주 생성과 세밀한 리듬 제어를 위한 DARC

드럼 반주 생성과 세밀한 리듬 제어를 위한 DARC

DARC는 현재 음악 생성 연구에서 두드러진 문제점, 즉 ‘구조적 제어와 스타일적 자유 사이의 트레이드오프’를 효과적으로 해소한다는 점에서 의미가 크다. 기존 스템‑투‑스템 접근법은 악기 간 상호작용을 반영해 조화로운 반주를 만들 수 있지만, 리듬 패턴을 사용자가 직접 지정하거나 미세 조정하기는 어려웠다. 반대로 timbre‑transfer 기반 모델은 사용자가 직접 만든 비트박싱·탭핑 같은 리듬 시퀀스를 입력으로 받아들일 수 있지만, 그 리듬이 현재 진행 중인 화성·멜로디와 얼마나 잘 맞는지는 보장되지 않는다. DARC는 이 두

Computer Science Sound
현실 시나리오에서 경험 기반 정확도 최적화를 위한 Jenius 에이전트

현실 시나리오에서 경험 기반 정확도 최적화를 위한 Jenius 에이전트

Jenius‑Agent 논문은 최근 LLM‑기반 에이전트가 직면한 두 가지 근본적인 한계를 명확히 짚고 있다. 첫 번째는 “실행 가시성 부족”이다. 기존 벤치마크는 최종 출력만을 평가 지표로 삼아, 에이전트가 내부적으로 어떤 프롬프트를 생성하고, 어떤 도구를 언제 호출했는지, 상태를 어떻게 업데이트했는지를 파악할 방법을 제공하지 않는다. 이로 인해 개발자는 오류 원인을 추적하기 위해 로그를 일일이 수작업으로 분석해야 하며, 재현성도 떨어진다. 두 번째는 “장기·도구‑보강 작업에서의 불안정성”이다. LLM은 짧은 컨텍스트에서는 뛰어난

Computer Science Artificial Intelligence
No Image

DrivingGen 자율주행 생성 비디오 월드 모델 종합 벤치마크

DrivingGen 논문은 현재 자율주행 분야에서 급증하고 있는 ‘생성 비디오 세계 모델’ 연구의 평가 체계가 부재함을 정확히 짚어낸다. 기존 벤치마크가 주로 PSNR, SSIM, LPIPS와 같은 전통적인 비디오 품질 지표에 의존하는데, 이러한 지표는 픽셀 수준의 차이를 정량화할 뿐, 자율주행에 필수적인 물리적 일관성이나 안전성을 반영하지 못한다. 예를 들어, 차량이 갑자기 사라지거나 보행자가 비현실적인 속도로 움직이는 경우, 시각적으로는 높은 SSIM을 기록하더라도 실제 주행 시나리오에서는 치명적인 오류가 된다. 논문은 이러한

Computer Science Model Computer Vision
No Image

FALCON 교차 도메인 소수 샷 적대 학습 기반 의료 영상 분할

FALCON 논문은 현재 의료 영상 분할 분야가 직면한 세 가지 핵심 문제—라벨 데이터의 희소성, 환자 간 해부학적 변이, 그리고 실시간 임상 적용을 위한 연산 효율성—를 동시에 해결하려는 시도로 평가할 수 있다. 가장 눈에 띄는 점은 “메타‑학습 → 적대적 파인튜닝 → 경계 인식 학습”이라는 3단계 전이 전략이다. 첫 단계에서 자연 이미지(예: PASCAL‑5ⁱ, COCO‑20ⁱ)로 메타‑러닝을 수행함으로써, 다양한 클래스와 복잡한 배경을 가진 상황에서도 빠르게 새로운 태스크에 적응할 수 있는 ‘학습‑학습’ 메커니즘을 구축한다.

Computer Vision Computer Science Learning
KGCE 지식 강화 이중 그래프 평가기 기반 크로스 플랫폼 교육 에이전트 벤치마크

KGCE 지식 강화 이중 그래프 평가기 기반 크로스 플랫폼 교육 에이전트 벤치마크

KGCE 논문은 현재 교육용 AI 에이전트 평가 체계가 직면한 두 가지 핵심 한계를 체계적으로 진단하고, 이를 극복하기 위한 설계 원칙을 명확히 제시한다. 첫 번째 한계는 ‘프라이빗 도메인 소프트웨어’에 대한 구조적 이해 부족이다. XiaoYa Intelligent Assistant나 HuaShi XiaZi와 같은 학교 전용 애플리케이션은 UI 흐름, API 호출 방식, 데이터 포맷 등이 일반 상용 소프트웨어와 크게 다르다. 기존 멀티모달 LLM 기반 에이전트는 사전 학습 데이터에 이러한 특수 사례가 거의 포함되지 않아, 실제 실행

Computer Science Artificial Intelligence Model
LLM과 SAST 도구의 계층적 CWE 예측 평가 ALPHA 벤치마크

LLM과 SAST 도구의 계층적 CWE 예측 평가 ALPHA 벤치마크

본 논문은 LLM과 전통적인 정적 분석 도구(SAST)의 취약점 탐지 능력을 비교 평가하기 위해 새로운 벤치마크 프레임워크인 ALPHA를 설계한 점에서 학술적·실무적 의의가 크다. 기존의 이진 분류 기반 벤치마크는 “취약점 존재 여부”만을 판단하도록 제한돼, 개발자가 실제 코드 수정에 활용할 수 있는 구체적인 CWE(CWE‑Common Weakness Enumeration) 정보를 제공하지 못한다는 한계가 있었다. ALPHA는 이러한 한계를 극복하기 위해 함수 수준에서 CWE 레이블을 부여하고, 오류 유형을 세 가지 계층적 패널티(

Computer Science Software Engineering
Logics STEM 실패 기반 사후 학습과 문서 지식 강화로 LLM 추론력 극대화

Logics STEM 실패 기반 사후 학습과 문서 지식 강화로 LLM 추론력 극대화

Logics‑STEM 논문은 최근 LLM(Large Language Model) 분야에서 가장 뜨거운 이슈인 “추론 능력 강화”에 대해 데이터와 알고리즘을 동시에 최적화하는 전략을 제시한다. 먼저 데이터 측면을 살펴보면, 저자들은 7.2 M 규모의 SFT( supervised fine‑tuning ) 데이터셋을 구축하기 위해 5단계 파이프라인을 적용했다. 주석 단계에서는 인간 전문가가 장기 사고 사슬(chain‑of‑thought) 형태의 답변을 직접 작성하도록 하여, 모델이 단순히 정답을 맞추는 것이 아니라 사고 과정을 학습하도록

Computer Science Artificial Intelligence
관절형 객체의 온라인 추정 및 조작

관절형 객체의 온라인 추정 및 조작

이 논문은 서비스 로봇이 일상 가정 환경에서 마주치는 다양한 관절형 객체(예: 서랍, 문, 회전식 손잡이 등)를 사전 지식 없이도 신속히 파악하고 조작할 수 있도록 하는 통합 프레임워크를 제시한다. 핵심 아이디어는 ‘시각‑촉각 융합’이다. 기존 딥러닝 기반 어포던스 예측은 풍부한 이미지 데이터로부터 객체의 잠재적 움직임 축이나 제한을 추정하지만, 실제 물리적 제약(마찰, 스프링 저항 등)을 반영하지 못한다. 반면, 관절 운동을 직접 관찰해 추정하는 전통적 방법은 실제 접촉이 선행돼야 하므로 초기 탐색 비용이 크다. 저자들은 이 두

Computer Science Robotics
길이 인식 적대적 학습을 통한 가변 길이 궤적 생성 몰 쇼핑객 경로를 위한 디지털 트윈

길이 인식 적대적 학습을 통한 가변 길이 궤적 생성 몰 쇼핑객 경로를 위한 디지털 트윈

본 논문은 가변 길이 시퀀스, 특히 쇼핑몰 내 고객의 이동 경로와 같은 복합적인 시간·공간 데이터를 생성하는 문제에 초점을 맞춘다. 전통적인 미니배치 학습에서는 동일 배치 내에 길이가 크게 다른 시퀀스가 섞이게 되는데, 이는 그래디언트의 스케일 차이를 야기하고 최적화 과정에서 불안정성을 초래한다. 특히 GAN 기반 생성 모델은 판별자가 “길이 자체”를 쉽게 구분하는 단축(shortcut) 전략을 취할 위험이 있는데, 이는 실제 의미 있는 패턴(예: 방문 순서, 체류 시간)보다 길이 차이에만 민감하게 반응하게 만든다. 결과적으로 생성

Machine Learning Computer Science
데이터 복잡도 인식 딥 모델 성능 예측

데이터 복잡도 인식 딥 모델 성능 예측

이 논문은 “데이터 복잡도 인식 딥 모델 성능 예측”이라는 주제로, 모델 설계 단계에서 사전적으로 성능을 추정할 수 있는 경량화된 두 단계 프레임워크를 제시한다. 첫 번째 단계는 데이터 자체의 통계적·구조적 특성을 기반으로 베이스라인 성능을 예측한다. 여기에는 데이터 분산, 클래스 불균형, 이미지 해상도, 텍스트 길이 등 다양한 메트릭이 포함되며, 이러한 특성은 기존 연구에서 모델 복잡도와 직접적인 상관관계를 보인 바 있다. 두 번째 단계는 모델 아키텍처(예: 레이어 수, 파라미터 규모, 연산량)와 주요 하이퍼파라미터(학습률, 배치

Computer Science Data Machine Learning Model
No Image

디지털 음악 플랫폼의 로열티 모델 최적화: 선형 계약을 통한 효율적인 학습 방법

이 논문은 디지털 음악 플랫폼에서 새로운 로열티 모델 도입에 대한 핵심 문제, 즉 불확실한 아티스트 특성의 학습을 다루며, 이를 위한 최적 샘플 복잡도를 분석하고 제시합니다. 논문은 (Dütting 등, 2025)의 표본 기반 학습 프레임워크를 확장하여 선형 계약이라는 특정 계약 클래스에 대한 최적 학습을 위한 샘플 복잡도를 분석하고 있습니다. 기술적 혁신성: 논문은 디지털 음악 플랫폼이 새로운 로열티 모델을 도입할 때 직면하는 핵심 문제인 불확실한 아티스트 특성의 학습을 해결하기 위한 방법론을 제시합니다. 특히, 이 논문에서 제안

Computer Science Game Theory
랜드마크가 이끄는 스윈 트랜스포머 기반 아이덴티티 보존 얼굴 초해상도

랜드마크가 이끄는 스윈 트랜스포머 기반 아이덴티티 보존 얼굴 초해상도

SwinIFS는 얼굴 초해상도(Face Super‑Resolution, FSR) 분야에서 두 가지 핵심 문제, 즉 ‘세밀한 구조 손실’과 ‘아이덴티티 변형’에 동시에 대응하려는 시도로 눈에 띈다. 기존 CNN 기반 방법들은 지역적인 특징을 잘 포착하지만, 장거리 의존성을 모델링하기엔 한계가 있다. 반면 Vision Transformer(ViT) 계열은 전역 정보를 효율적으로 학습하지만, 얼굴과 같이 고정된 구조적 패턴을 다룰 때는 사전 지식이 부족해 세부 디테일 복원에 약점이 있다. SwinIFS는 이러한 딜레마를 ‘랜드마크 가이드

Computer Science Computer Vision
No Image

삼중 컨텍스트에서 조건 속성 및 귀속 조건 함축을 위한 최적 기반 구축

삼중 컨텍스트는 전통적인 이항 관계를 넘어 객체‑속성‑조건이라는 세 차원을 동시에 고려하는 데이터 모델로, 지식 발견 및 의미론적 분석에 있어 강력한 표현력을 제공한다. 그러나 이러한 다차원 구조에서는 기존의 이항 컨텍스트에서 사용되는 함축(implication) 기반 추론 기법을 그대로 적용하기 어렵다. 특히 조건 속성(conditional attribute)과 귀속 조건(attributional condition)이라는 두 종류의 함축이 동시에 존재할 경우, 서로 얽히는 전제와 결론 사이의 중복 및 불필요한 함축이 급증하여 효율

Computer Science Artificial Intelligence
숨겨진 인터페이스 드러내기 LLM 기반 타입 추론으로 macOS 사설 프레임워크 역공학

숨겨진 인터페이스 드러내기 LLM 기반 타입 추론으로 macOS 사설 프레임워크 역공학

MOTIF는 크게 두 가지 핵심 요소로 구성된다. 첫 번째는 Objective‑C 런타임 정보를 활용해 메서드 호출 관계와 클래스 계층 구조를 추출하는 ‘메타데이터 수집 모듈’이다. 이 모듈은 dyld shared cache와 Mach‑O 바이너리를 동적으로 로드하고, objc getClass, method getImplementation 등의 런타임 API를 호출해 실제 메모리 주소와 심볼 정보를 수집한다. 수집된 데이터는 그래프 형태로 정규화되어 이후 단계에 전달된다. 두 번째는 파인튜닝된 대형 언어 모델(LLM)이다. 연구팀은

Computer Science Framework Cryptography and Security
스토리지 기반 그래프 신경망 학습 가속화: AGNES 프레임워크

스토리지 기반 그래프 신경망 학습 가속화: AGNES 프레임워크

본 연구는 그래프 신경망(GNN) 학습을 대규모 실세계 그래프에 적용하기 위해 외부 스토리지를 활용하는 ‘스토리지 기반’ 접근법의 근본적인 한계를 짚어낸다. 기존 연구들은 주로 메모리 한계를 극복하기 위해 NVMe SSD와 같은 고속 저장소를 이용했지만, 그래프 구조가 매우 불규칙하고 엣지와 노드가 수백만~수십억 수준으로 분산돼 있기 때문에 학습 과정에서 발생하는 수십만~수백만 개의 작은 I/O 요청을 효율적으로 병합하거나 스케줄링하지 못한다. 이러한 ‘소형 I/O 폭주’는 스토리지의 순차 전송 대역폭을 활용하지 못하게 만들고, 결

Machine Learning Computer Science Network
에셔버스 물리·동역학·의도 기반 텔레오스페이셜 인텔리전스 오픈월드 벤치마크

에셔버스 물리·동역학·의도 기반 텔레오스페이셜 인텔리전스 오픈월드 벤치마크

본 논문은 인공지능·로보틱스 분야에서 최근 주목받고 있는 “텔레오‑스페이셜 인텔리전스(TSI)”라는 새로운 개념을 제시한다. 기존의 대부분 연구는 물체‑중심(object‑centric) 접근을 취해, 물리‑동역학(Physical‑Dynamic) 모델링에 집중한다. 예컨대, 물체의 질량·마찰·충돌 법칙을 이용해 시뮬레이션하거나, 비전 기반 트래킹을 통해 움직임을 예측한다. 이러한 방법은 정량적 정확도에서는 뛰어나지만, 인간이 물체를 조작하거나 배치하는 근본적인 ‘의도’를 파악하지 못한다는 한계가 있다. TSI는 이러한 한계를 극복하기

Computer Vision Computer Science Data
테스트 시점 학습 기반 고적응 레이더 에코 외삽 REE TTT

테스트 시점 학습 기반 고적응 레이더 에코 외삽 REE TTT

본 논문은 레이더 에코 외삽(Radar Echo Extrapolation, REE) 분야에서 가장 시급한 문제인 도메인 전이와 데이터 분포 변화 에 대한 해결책을 제시한다. 기존의 딥러닝 기반 REE 모델은 대규모 레이더 시퀀스를 학습해 단기 강수 예보를 수행하지만, 학습 단계에서 사용된 지역·시즌·기후 조건에 강하게 의존한다. 따라서 새로운 지역이나 극한 강수 상황에 적용하면 성능이 급격히 저하되는 것이 일반적이다. 1. 핵심 아이디어와 기여 테스트‑시점 학습(Test‑Time Training, TTT) 적용 : 모델 파라미터를

Computer Science Machine Learning
하노이월드 공동 임베딩 예측 기반 세계 모델을 이용한 자율주행 차량 제어

하노이월드 공동 임베딩 예측 기반 세계 모델을 이용한 자율주행 차량 제어

본 논문은 자율주행 제어에 있어 강화학습(RL)이 직면한 근본적인 한계를 짚어낸 뒤, JEPA 기반 자기지도 학습이 제공할 수 있는 대안을 제시한다. 기존 RL 접근법은 보상 설계가 복잡하고, 시뮬레이션 혹은 실제 도로에서 수백만 단계에 달하는 데이터가 필요하다. 특히 픽셀 수준의 재구성 손실을 최소화하려는 목표는 고차원 입력 공간에서 잡음(노이즈) 특성을 과도하게 학습하게 만들며, 이는 정책의 불안정성과 안전성 저하로 이어진다. 인간이 새로운 기술을 습득할 때 ‘상상’과 ‘예측’ 과정을 통해 적은 경험만으로도 일반화된 모델을 구축

Computer Science Robotics Model
No Image

AI 주도 사회의 독성: Chirper.ai에서의 대규모 감사 연구

본 논문은 AI 기반 소셜 에이전트가 온라인 플랫폼에서 어떻게 행동하는지에 대한 깊이 있는 이해를 제공하며, 특히 독성 콘텐츠 생성과 관련된 문제점을 집중적으로 분석한다. 이 연구는 Chirper.ai라는 플랫폼을 통해 LLM 기반 에이전트의 동작 패턴을 경험적으로 감사하고, 이러한 에이전트들이 어떻게 독성을 생성하고 채택하는지에 대한 중요한 통찰력을 제공한다. 기술적 혁신성 본 논문은 AI 기반 소셜 에이전트의 행동 이해를 위한 새로운 접근법을 제시한다. 특히, Chirper.ai 플랫폼을 활용하여 LLM 기반 에이전트가 독성 콘

Computer Science Multiagent Systems
No Image

EgoGrasp 이머시브 영상에서 세계 좌표 손물체 상호작용 재구성

EgoGrasp 논문은 이머시브(egocentric) 영상에서 세계 좌표계의 손‑물체 상호작용을 복원한다는 매우 야심찬 목표를 설정한다. 기존 연구는 크게 두 가지 한계에 봉착한다. 첫째, 정적 이미지 기반 방법은 시간적 연속성을 활용하지 못해 동적인 손동작과 물체 변화를 정확히 포착하지 못한다. 둘째, 카메라 좌표계에 국한된 접근법은 전역적인 위치와 자세 정보를 제공하지 못한다. 특히 일상 생활에서 촬영되는 이머시브 영상은 급격한 카메라 움직임, 조명 변화, 그리고 손과 물체의 빈번한 가림 현상이 특징이다. 이러한 환경에서는 2D

Computer Science Computer Vision
LLM 기반 가격 책정의 콜루션 위험: 규제와 시장 집중성의 관점

LLM 기반 가격 책정의 콜루션 위험: 규제와 시장 집중성의 관점

본 논문은 알고리즘 기반 가격 결정 체계에서 대형 언어 모델(LLM)이 불법적인 담합을 유발할 수 있는 잠재적 위험에 대해 깊이 있게 분석하고 있습니다. 이 연구는 LLM의 공유된 지식 인프라와 데이터 집적 정책이 어떻게 시장 수준에서 조율되지 않은 협력을 가능하게 하는지, 그리고 이러한 메커니즘은 어떻게 실제 비즈니스 환경에서 위험성을 높이는지를 설명하고 있습니다. 기술적 혁신성 본 논문의 주요 기술적 혁신성은 LLM이 가격 책정에 활용될 때 발생할 수 있는 콜루션 위험을 이론적으로 분석하는 것입니다. 특히, 본 연구는 LLM이

Economics
RovoDev 코드 리뷰어: Atlassian에서 실현한 LLM 기반 코드 검토 자동화의 혁신

RovoDev 코드 리뷰어: Atlassian에서 실현한 LLM 기반 코드 검토 자동화의 혁신

RovoDev 코드 리뷰어는 LLM 기반의 코드 검토 자동화 도구로서, 현대 소프트웨어 개발 프로세스에서 중요한 역할을 수행한다. 이 논문은 RovoDev이 어떻게 데이터 프라이버시와 보안 문제를 해결하고, 리뷰 가이드라인에 따른 정확한 코드 검토를 제공하며, 새로운 프로젝트에서도 효과적으로 작동하는지 설명한다. 기술적 혁신성: RovoDev의 핵심 기술은 제로샷 컨텍스트 인식 리뷰 댓글 생성, 사실적 정확성 품질 검사, 그리고 행동성 품질 검사를 통한 유효하고 행동 가능한 리뷰 댓글 추천이다. 이 중 특히 제로샷 접근 방식은 고객

Computer Science Software Engineering
No Image

객체 중심 학습의 혁신: CODA로 구현되는 정확하고 유연한 객체 표현

본 논문은 객체 중심 학습(Object centric Learning, OCL) 분야에서 중요한 기술적 혁신을 제시하고 있습니다. CODA(Contrastive Object centric Diffusion Alignment)는 사전 학습된 디퓨전 모델을 활용하여 슬롯 엮임과 약한 정렬이라는 주요 도전 과제를 해결하는 새로운 접근 방식입니다. 기술적 혁신성: 1. 등록 슬롯(Register Slots): 등록 슬롯은 독립적인 입력 데이터로 추가되어 잔여 주의를 흡수하고 객체 슬롯 간의 간섭을 줄이는 역할을 합니다. 이는 슬롯 엮임 문

Computer Science Learning Computer Vision
그래프 신경망의 과거를 활용한 미래: HISTOGRAPH로 노드 임베딩의 진화 모델링

그래프 신경망의 과거를 활용한 미래: HISTOGRAPH로 노드 임베딩의 진화 모델링

HISTOGRAPH는 그래프 신경망(GNN) 분야의 중요한 발전을 이끌어내며, 특히 노드 임베딩의 진화와 공간적 상호작용을 동시에 모델링하는 데 중점을 두고 있습니다. 이러한 접근법은 기존 GNN 아키텍처를 개선하고, 다양한 그래프 관련 작업에서 우수한 성능을 달성할 수 있는 새로운 방향성을 제시합니다. 기술적 혁신성: HISTOGRAPH의 핵심 혁신 중 하나는 역사적 활성화 추적 입니다. 이 접근법은 GNN이 메시지 전달과 집계를 통해 노드 임베딩을 생성하는 과정에서 발생한 시간적 경로를 고려합니다. 각 노드의 층별 표현을 시퀀스

Computer Science Network Learning Machine Learning
다차원 프롬프트 체이닝을 통한 소형 언어 모델의 오픈‑도메인 대화 품질 향상

다차원 프롬프트 체이닝을 통한 소형 언어 모델의 오픈‑도메인 대화 품질 향상

본 논문은 최근 대형 언어 모델(LLM)이 대화 시스템에서 보여주는 뛰어난 성능과는 달리, 소형 언어 모델(SLM)이 갖는 배포·운영상의 장점을 살리면서도 품질 격차를 메우기 위한 실용적인 접근법을 제시한다. 핵심 아이디어는 ‘프롬프트 체이닝(prompt chaining)’이라는 기법을 다차원적으로 확장하여, 각각의 대화 품질 요소인 자연스러움(Naturalness), 일관성(Coherence), 흥미성(Engagingness)을 독립적으로 강화하고, 최종 응답에서 이들을 조화롭게 결합하도록 설계한 것이다. 1. 프레임워크 설계 N

Computer Science NLP
대형 언어 모델의 실행 안정성: 코드 생성에서 메모리 동역학 분석

대형 언어 모델의 실행 안정성: 코드 생성에서 메모리 동역학 분석

이 논문은 대형 언어 모델(LLM)에서 생성된 코드의 실행 안정성에 중점을 두고, 특히 메모리 동역학 측면에서 그 중요성을 강조한다. 기존 연구에서는 주로 LLM의 출력 정확도와 다양성에 초점을 맞추었지만, 이 논문은 이러한 정확한 결과가 반드시 실행 시간 메모리 프로파일링에서도 안정적인 성능을 보장하지 않는다는 점을 지적한다. 논문에서 제시된 주요 기여 중 하나는 Monotonic Peak Profile (MPP) 와 Dynamic Time Warping (DTW) 를 활용한 실행 시간 메모리 프로파일링 방법이다. 이 방법은 애플

Computer Science Software Engineering
데이터 주도적 접근을 통한 콘크리트 혼합물 조성의 염화물 수송에 대한 영향 분석

데이터 주도적 접근을 통한 콘크리트 혼합물 조성의 염화물 수송에 대한 영향 분석

이 논문은 콘크리트 구조물 내에서 염화물의 시간 경과 변화에 미치는 혼합물 조성의 영향을 분석하는데 초점을 맞추고 있다. 이를 위해 다양한 머신러닝 알고리즘을 사용하여 데이터 주도적 접근법을 적용한다. 연구 방법론은 간단한 선형 회귀, k 최근접 이웃 회귀, 커널 리지 회귀와 복잡한 서포트 벡터 회귀, 가우시안 프로세스 회귀, 다층 퍼셉트론(MLP), 게이트 순환 유닛(GRU)을 포함한다. 각 알고리즘의 성능은 다양한 지표를 통해 평가되며, 특히 GPR 모델은 명확하고 설명 가능한 추세를 제공하여 숨겨진 상관관계를 드러내는 데 효과

Computer Science Learning Data Machine Learning
안전성과 해석 가능성 우선: 급성 뇌졸중 영상 진단을 위한 에이전트 기반 AI 프레임워크

안전성과 해석 가능성 우선: 급성 뇌졸중 영상 진단을 위한 에이전트 기반 AI 프레임워크

본 논문은 급성 뇌졸중 영상 진단을 위한 AI 시스템의 개선 방향을 제시하며, 특히 불확실성 인식과 의사결정 제어 메커니즘을 통합한 에이전트 기반 접근 방식에 초점을 맞추고 있습니다. 이 연구는 의료 AI 분야에서 중요한 문제를 해결하려는 시도로, 안전성, 해석 가능성 및 임상 관련성을 강조하고 있습니다. 기술적 혁신성 본 논문의 핵심 혁신은 에이전트 기반 AI 프레임워크를 통해 불확실성 인식과 의사결정 제어 메커니즘을 통합한 것입니다. 이 접근 방식은 단순히 예측을 제공하는 것이 아니라, 불확실성이 높은 경우 보류 결정을 내릴 수

Framework Image Processing Electrical Engineering and Systems Science
No Image

워프 코르텍스: 소비자 하드웨어에서 백만 에이전트 인지 확장의 비동기적, 메모리 효율적인 아키텍처

본 논문은 워프 코르텍스 아키텍처를 통해 대형 언어 모델(LLM)의 병렬 추론 능력을 크게 향상시키는 방법을 제시한다. 이 아키텍처는 에이전트가 독립적인 프로세스가 아닌 비동기 스레드로서 동작하도록 설계되어, 가중치와 컨텍스트 메모리의 복잡도를 크게 줄인다. 특히, 토폴로지 데이터 분석(TDA)에서 유래한 하이브리드 랜드마크 기법을 통해 KV 캐시를 점 클라우드로 취급하고, 증인 복잡체에 영감을 받은 희박화 방법을 적용하여 컨텍스트의 지속적 호모로지 특성을 유지하면서 메모리 사용량을 크게 줄일 수 있다. 논문에서 제시된 워프 코르텍

Computer Science Machine Learning
No Image

CoCo‑Fed 메모리·통신 효율을 동시에 잡는 통합 연합 학습 프레임워크

CoCo‑Fed가 제시하는 두 가지 핵심 혁신은 ‘이중 차원 다운프로젝션’과 ‘직교 부분공간 초중첩 전송’이다. 첫 번째 단계에서는 기존 연합 학습에서 각 gNB가 전체 모델 파라미터에 대한 그래디언트를 저장·전송해야 하는 문제를 해결한다. 저자들은 그래디언트를 먼저 채널 차원(예: 입력 피처)과 모델 차원(예: 출력 피처) 두 축에서 각각 저‑랭크 행렬로 근사한다. 이때 사용되는 투사 행렬은 사전에 학습된 고정 정규 직교 행렬이거나, 각 라운드마다 랜덤하게 생성된 스케치 행렬일 수 있다. 이렇게 하면 메모리 요구량이 O(rank·

Computer Science Learning Information Theory Framework
No Image

LLM 에이전트를 활용한 투자 포트폴리오 최적화: 복잡한 조합 문제 해결의 새로운 패러다임

본 논문은 언어 모델(LLM)을 활용한 에이전트 프레임워크를 통해 복잡한 조합 최적화 문제에 새로운 접근 방식을 제시하고 있습니다. 이 연구의 핵심 가치는 다음과 같은 기술적 혁신성, 방법론, 실험 결과를 통해 분석할 수 있습니다. 1. 기술적 혁신성: 본 논문은 LLM을 활용한 에이전트 프레임워크를 제시함으로써, 기존의 학문적인 최적화 접근법에서 벗어나 실제 생활 문제에 초점을 맞추고 있습니다. 특히, NPhard한 조합 최적화 문제 해결에 있어 LLM을 활용하는 것은 이전 연구에서는 찾아보기 어려운 혁신적인 시도입니다. MOCO

Computer Science Computational Engineering
대형 언어 모델과 휴리스틱 규칙으로 보는 소셜미디어 양극화 측정

대형 언어 모델과 휴리스틱 규칙으로 보는 소셜미디어 양극화 측정

이 논문은 기존 감성 분석이나 사전 학습된 분류기 중심의 양극화 연구와 차별화되는 두 가지 핵심 요소를 제시한다. 첫째, 대형 언어 모델을 활용해 텍스트에서 ‘입장(stance)’, ‘감정적 어조(affective tone)’, ‘동의·반대 패턴(agreement dynamics)’을 다층적으로 추출한다는 점이다. 기존 방법은 주로 단일 차원의 감성 점수(긍정/부정) 혹은 사전 정의된 레이블(찬성/반대)만을 제공했지만, LLM은 문맥을 고려해 미묘한 입장 변화를 포착하고, 감정의 강도와 유형(분노, 슬픔, 혐오 등)까지 세분화한다.

Computer Science Social Networks Model
데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

본 논문은 최근 의료 영상 분야에서 각광받고 있는 비전‑언어 모델(VLM)의 실제 운영 단계에서 발생할 수 있는 ‘데이터 시프트(data shift)’ 문제에 초점을 맞추었다. 데이터 시프트는 크게 두 가지 차원으로 나뉜다. 첫 번째는 입력 데이터 자체가 훈련 시와 다른 분포를 보이는 경우이며, 두 번째는 모델이 출력하는 예측값이나 신뢰도(confidence)가 변하는 경우이다. 기존 연구들은 주로 입력 차원의 통계적 변화를 탐지하는 방법에 의존했지만, 이러한 변동이 반드시 모델 성능 저하와 직결되지 않는다는 점을 간과하고 있었다.

Computer Science Model Data Computer Vision
선거 소셜 미디어 설득 시뮬레이션 프레임워크 ElecTwit

선거 소셜 미디어 설득 시뮬레이션 프레임워크 ElecTwit

ElecTwit이 제시하는 가장 큰 혁신은 설득 연구를 위한 실험 환경을 ‘게임’이라는 인위적 설정에서 벗어나 실제 소셜 미디어 플랫폼의 구조와 행태를 모사한 점이다. 이를 위해 저자들은 트위터와 유사한 게시·리트윗·팔로우 메커니즘을 구현하고, 정치적 선거라는 구체적 시나리오를 설정함으로써 에이전트 간의 정보 흐름, 의견 형성, 그리고 설득 전략의 전개 과정을 정밀하게 관찰할 수 있었다. 특히 25가지 설득 기법을 사전 정의하고, 각 LLM이 이를 어떻게 선택·조합하는지를 정량화한 방법론은 설득 기술의 ‘레시피’를 비교 분석하는 데

Computer Science Artificial Intelligence Framework System
소매점의 자원 제약을 극복하는 LSTM 압축: 정확도와 효율성 사이의 최적 균형 찾기

소매점의 자원 제약을 극복하는 LSTM 압축: 정확도와 효율성 사이의 최적 균형 찾기

이 논문은 소매 판매 예측 분야에서 LSTM 네트워크의 효율성과 정확성을 극대화하는 방법에 대해 깊이 있게 탐구하고 있다. 특히, 이 연구는 자원 제약을 가진 소규모 및 중소 규모 매장에서도 효과적인 AI 기반 예측 시스템을 구축할 수 있도록 하는 모델 압축 기법의 중요성을 강조한다. 기술적 혁신성 이 논문은 LSTM 네트워크를 압축하는 다양한 방법론을 체계적으로 평가하고, 특히 64개 은닉 유닛을 가진 모델이 가장 높은 예측 정확도를 보이는 것을 발견했다. 이는 표준 LSTM(128개 은닉 유닛)보다 메모리 사용량을 줄이고 추론

Computer Science Network Machine Learning Model
온라인 전파 최대화를 위한 지연 전방 선택 알고리즘

온라인 전파 최대화를 위한 지연 전방 선택 알고리즘

본 논문이 다루는 온라인 영향력 최대화(Online Influence Maximization, OIM) 문제는 전통적인 정적 IM과 달리 시간에 따라 시드 집합을 동적으로 선택해야 하는 상황을 전제로 한다. 여기서 ‘전체 밴딧(full‑bandit) 피드백’이라는 가정은 에이전트가 매 라운드마다 선택한 시드 집합에 의해 실제로 발생한 확산 규모(즉, 전체 활성화된 노드 수)만을 관찰한다는 의미이며, 이는 각 노드별 활성화 여부나 네트워크의 인접 행렬 등 추가적인 구조적 정보를 전혀 제공하지 않는다. 이러한 제한된 피드백 환경에서는

Machine Learning Computer Science
No Image

인공지능 생성 이미지 탐지를 위한 대규모 COCO 기반 데이터셋 공개

본 논문이 제시하는 MS COCOAI 데이터셋은 현재 이미지 진위 탐지 연구에서 가장 시급히 요구되는 ‘다양성’과 ‘규모’를 동시에 만족한다는 점에서 큰 의미를 가진다. 첫째, 기존 데이터셋들은 주로 단일 생성 모델이나 제한된 프롬프트 세트를 사용해 만든 이미지에 국한돼 있었으며, 이는 실제 현장에서 마주치는 다양한 AI 툴과의 격차를 초래한다. 반면 본 데이터셋은 Stable Diffusion 3·2.1·SDXL, DALL‑E 3, MidJourney v6 등 최신 모델을 모두 포함함으로써, 현재 시장에서 널리 사용되는 주요 생성

Computer Science Data Detection Computer Vision
제한된 의료 주석을 위한 스케일 인식 적응형 반지도 학습 네트워크

제한된 의료 주석을 위한 스케일 인식 적응형 반지도 학습 네트워크

SASNet은 의료 영상 분야에서 흔히 마주치는 라벨링 비용의 제약을 극복하고자 설계된 반지도 학습 프레임워크이다. 기존의 반지도 세그멘테이션 방법들은 주로 단일 스케일의 특징을 활용하거나, 라벨이 없는 데이터에 대해 단순히 일관성 손실을 적용하는 데 그쳤다. 이러한 접근법은 복잡한 해부학적 구조를 다양한 해상도에서 포착하기 어려워, 특히 작은 병변이나 경계가 흐릿한 영역에서 성능 저하를 보인다. SASNet은 두 개의 병렬 브랜치를 갖는다. 하나는 라벨이 충분히 제공된 소량의 데이터에 대해 전통적인 지도 학습을 수행하고, 다른 하

Image Processing Network Electrical Engineering and Systems Science
No Image

추론 모델의 ‘아하!’ 순간은 착각인가

이 논문은 최근 AI 커뮤니티에서 화제가 된 “추론 중 ‘아하!’ 순간”이라는 현상을 과학적으로 검증하려는 시도이다. 저자들은 먼저 기존 연구가 제시한 사례, 즉 DeepSeek‑R1‑Zero가 중간 단계에서 갑작스러운 전략 전환을 보이며 정답을 도출한다는 주장을 재현하려 했다. 이를 위해 1백만 개가 넘는 추론 트레이스를 수집하고, 각 트레이스에서 토큰 수준의 확률 변화, 내부 표현의 변동, 그리고 출력 정확도를 동시에 기록했다. 분석 대상은 자연어 질문‑답변, 수학 문제 풀이, 코딩 생성이라는 세 가지 도메인으로, 각각의 도메인

Computer Science Artificial Intelligence Model
텍스트투비디오 생성기 Sora의 암묵적 연관성을 정량화한 VEAT와 편향 완화 과제

텍스트투비디오 생성기 Sora의 암묵적 연관성을 정량화한 VEAT와 편향 완화 과제

본 논문은 텍스트투비디오 생성 모델이 사회적 편향을 어떻게 내재하고 재생산하는지를 정량적으로 밝히려는 시도로, 기존의 Implicit Association Test(IAT)와 이미지 기반 연관성 테스트를 비디오 임베딩에 적용한 점에서 학술적 의의가 크다. VEAT는 비디오 프레임들의 시각·음향 특징을 고차원 임베딩 공간에 매핑한 뒤, 목표 집단(예: 아프리카계 미국인, 유럽계 미국인)과 속성(pleasant, unpleasant) 사이의 거리 차이를 효과크기(d)로 측정한다. SC‑VEAT는 단일 카테고리(예: 특정 직업)와 두 집

Computers and Society Computer Science
No Image

FlashInfer Bench AI 기반 LLM 시스템을 위한 선순환 구축

FlashInfer‑Bench 논문은 “AI‑generated GPU kernel”이라는 최신 연구 흐름을 실제 서비스 환경에 적용하기 위한 인프라스트럭처 설계라는 관점에서 매우 의미 있는 기여를 하고 있다. 첫 번째 핵심은 FlashInfer Trace 라는 메타데이터 스키마이다. 기존에 LLM이 생성한 코드를 단순히 텍스트로 저장하고 인간이 수동으로 검증하는 방식은 확장성이 떨어진다. Trace는 커널 인터페이스(입출력 텐서 형태, 메모리 요구량), 워크로드 특성(배치 크기, 시퀀스 길이), 구현 세부사항(언어, 컴파일 옵션)

Computer Science Artificial Intelligence System
LLM 기반 코드 취약점 탐지를 위한 실증 평가 RAG SFT 듀얼 에이전트 시스템

LLM 기반 코드 취약점 탐지를 위한 실증 평가 RAG SFT 듀얼 에이전트 시스템

본 연구는 LLM을 활용한 코드 취약점 탐지의 실용성을 정량적으로 평가하기 위해 세 가지 접근법을 체계적으로 비교하였다. 첫 번째 접근법인 Retrieval‑Augmented Generation(RAG)은 사전 학습된 LLM에 외부 지식 베이스를 동적으로 연결한다. 구체적으로, MITRE CWE 데이터베이스와 최신 웹 검색 결과를 실시간으로 가져와 프롬프트에 삽입함으로써 모델이 코드 조각을 해석할 때 최신 보안 패턴과 CWE 정의를 참조하도록 설계되었다. 이 과정은 벡터 검색 엔진(FAISS)과 텍스트 임베딩을 활용해 관련 문서를

System Computer Science Software Engineering Detection
LLM으로 라벨링된 룩셈부르크어 NER 품질 평가

LLM으로 라벨링된 룩셈부르크어 NER 품질 평가

judgeWEL 논문은 저자원 언어인 룩셈부르크어에 대한 NER 데이터 구축이라는 실질적인 문제에 대해 창의적인 해결책을 제시한다. 가장 큰 강점은 두 가지 측면에서 약한 감독을 활용한다는 점이다. 첫째, 위키피디아 내부 링크와 위키데이터의 구조화된 메타데이터를 연결함으로써 엔터티 유형을 자동으로 추론한다는 아이디어는 기존의 규칙 기반 혹은 사전 매핑 방식보다 확장성이 뛰어나다. 위키피디아는 지속적으로 업데이트되며 다양한 도메인을 포괄하므로, 이 접근법은 새로운 엔터티가 등장해도 비교적 쉽게 반영될 수 있다. 둘째, 자동 라벨링 단

Computer Science NLP Data
VisNet 효율적인 사람 재식별을 위한 알파다이버전스 손실 특징 융합 동적 다중작업 학습

VisNet 효율적인 사람 재식별을 위한 알파다이버전스 손실 특징 융합 동적 다중작업 학습

VisNet은 현재 사람 재식별 분야에서 가장 큰 과제 중 하나인 “정확도와 연산 효율성 사이의 트레이드오프”를 해결하려는 시도로 눈에 띈다. 첫 번째 핵심 기여는 ResNet‑50의 네 단계(feature map)들을 순차적으로 결합하면서도 별도의 병렬 브랜치를 도입하지 않은 점이다. 이는 기존의 멀티‑스케일 접근법이 흔히 겪는 파라미터 폭증과 메모리 사용량 증가 문제를 크게 완화한다. 자동 주의(attention) 모듈이 각 스케일별 특징에 가중치를 부여함으로써, 저해상도에서 추출된 전역적인 형태 정보와 고해상도에서 얻어지는 세

Computer Vision Computer Science Learning
구체 위에 원을 그리는 신경망, 확실히 포도 따기

구체 위에 원을 그리는 신경망, 확실히 포도 따기

본 연구는 현재 인공지능 추론 분야에서 가장 논쟁이 되는 세 가지 접근법을 체계적으로 비교함으로써, “신뢰성”이라는 관점에서 중요한 통찰을 제공한다. 첫 번째 범주인 대규모 언어 모델(LLM) 기반 추론은 방대한 텍스트 코퍼스를 사전 학습함으로써 언어적 유연성을 얻지만, 논리적 일관성 유지와 같은 엄격한 판단에서는 여전히 불안정한 결과를 보인다. 이는 LLM이 통계적 패턴에 기반한 예측을 수행하기 때문에, 명시적인 논리 규칙을 내재화하지 못한다는 근본적인 한계와 연결된다. 두 번째인 감독 학습 기반 추론은 특정 논리 과제에 대해 라

Network Computer Science Artificial Intelligence
다중턴 대화 압축을 통한 방어형 가드레일 모델 학습

다중턴 대화 압축을 통한 방어형 가드레일 모델 학습

Defensive M2S는 기존 가드레일 모델이 전체 대화 히스토리를 입력으로 받아야 하는 구조적 한계를 근본적으로 해결한다는 점에서 의미가 크다. 다중턴 대화는 일반적으로 토큰 수가 O(n²) 수준으로 급증하는데, 이는 특히 10턴 이상으로 길어지는 실제 서비스 시나리오에서 GPU 메모리와 연산 시간의 병목을 초래한다. 논문은 이를 ‘Multi‑turn to Single‑turn (M2S)’ 압축이라는 간단하지만 효과적인 변환 규칙으로 전환한다. 구체적으로, 각 턴의 핵심 발화만을 남기고, 대화 흐름을 유지하기 위해 하이픈(–),

Computer Science NLP Model
단일세포 유전체학 전처리와 통합 방법 벤치마크

단일세포 유전체학 전처리와 통합 방법 벤치마크

본 논문은 단일세포 다중모달 데이터 분석 파이프라인의 핵심 단계인 정규화, 통합, 차원 축소를 체계적으로 비교함으로써 현재 사용되는 방법들의 실제 적용 가능성을 평가한다. 먼저 정규화 단계에서는 총 7가지 방법을 시험했는데, 이는 전통적인 로그 변환, SCTransform, CPM, TPM 등부터 최신의 베이지안 기반 정규화까지 포괄한다. 정규화는 각 세포의 기술적 변동성을 최소화하고, 서로 다른 모달리티 간의 스케일 차이를 조정하는 데 필수적이며, 논문은 정규화 선택이 통합 결과에 미치는 영향을 정량적으로 제시한다. 통합 단계에서

Quantitative Biology

< 분야별 논문 현황 (Total: 770) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
9
HEP-EX
7
HEP-PH
12
HEP-TH
7
MATH-PH
4
NUCL-TH
1
Quantum Physics
10

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키