KOINEU Logo
GNU 데이터 언어(GDL)의 현황과 미래

GNU 데이터 언어(GDL)의 현황과 미래

: GDL은 천문학 분야에서 IDL의 무료 대체 소프트웨어로 널리 사용되고 있으며, 다양한 데이터 분석과 시각화 작업에 활용됩니다. GDL의 주요 특징 중 하나는 IDL과의 완벽한 문법 호환성으로, 기존 IDL 코드를 쉽게 GDL에서 실행할 수 있다는 점입니다. 이로 인해 천문학자들은 비용 부담 없이 고급 데이터 분석 및 시각화 작업을 수행할 수 있습니다. GDL은 다양한 플랫폼에서 실행 가능하며, Linux, BSD, Mac OSX, OpenSolaris 등 주요 운영 체제를 지원합니다. 또한, 여러 운영 체제에 대한 사전 컴파일

Computer Science Data Computational Engineering Astrophysics
혼돈된 단어도 읽는 법: 뇌의 비밀

혼돈된 단어도 읽는 법: 뇌의 비밀

이 논문은 혼돈된 단어의 독해에 대한 심도 있는 분석을 제공하며, 특히 인간 뇌가 어떻게 이러한 혼란스러운 텍스트를 처리하는지에 대해 상세히 설명하고 있습니다. 연구는 캠브리지 대학교의 결과를 바탕으로, 단어 내 글자의 순서가 바뀌어도 첫 번째와 마지막 글자가 올바른 위치에 있으면 독해에 큰 영향을 미치지 않는다는 사실을 밝혀냅니다. 이는 인간 뇌가 전체 단어로 인식하는 능력 덕분이며, 이러한 현상은 여러 요인들에 의해 설명될 수 있습니다. 1. 문법 구조 보존 혼돈된 텍스트에서도 문장의 문법적 구조가 유지되면 독자는 다음 단어를

Computer Science Information Retrieval
현실 시나리오에서 경험 기반 정확도 최적화를 위한 Jenius 에이전트

현실 시나리오에서 경험 기반 정확도 최적화를 위한 Jenius 에이전트

Jenius‑Agent 논문은 최근 LLM‑기반 에이전트가 직면한 두 가지 근본적인 한계를 명확히 짚고 있다. 첫 번째는 “실행 가시성 부족”이다. 기존 벤치마크는 최종 출력만을 평가 지표로 삼아, 에이전트가 내부적으로 어떤 프롬프트를 생성하고, 어떤 도구를 언제 호출했는지, 상태를 어떻게 업데이트했는지를 파악할 방법을 제공하지 않는다. 이로 인해 개발자는 오류 원인을 추적하기 위해 로그를 일일이 수작업으로 분석해야 하며, 재현성도 떨어진다. 두 번째는 “장기·도구‑보강 작업에서의 불안정성”이다. LLM은 짧은 컨텍스트에서는 뛰어난

Computer Science Artificial Intelligence
No Image

DrivingGen 자율주행 생성 비디오 월드 모델 종합 벤치마크

DrivingGen 논문은 현재 자율주행 분야에서 급증하고 있는 ‘생성 비디오 세계 모델’ 연구의 평가 체계가 부재함을 정확히 짚어낸다. 기존 벤치마크가 주로 PSNR, SSIM, LPIPS와 같은 전통적인 비디오 품질 지표에 의존하는데, 이러한 지표는 픽셀 수준의 차이를 정량화할 뿐, 자율주행에 필수적인 물리적 일관성이나 안전성을 반영하지 못한다. 예를 들어, 차량이 갑자기 사라지거나 보행자가 비현실적인 속도로 움직이는 경우, 시각적으로는 높은 SSIM을 기록하더라도 실제 주행 시나리오에서는 치명적인 오류가 된다. 논문은 이러한

Computer Science Model Computer Vision
데이터 복잡도 인식 딥 모델 성능 예측

데이터 복잡도 인식 딥 모델 성능 예측

이 논문은 “데이터 복잡도 인식 딥 모델 성능 예측”이라는 주제로, 모델 설계 단계에서 사전적으로 성능을 추정할 수 있는 경량화된 두 단계 프레임워크를 제시한다. 첫 번째 단계는 데이터 자체의 통계적·구조적 특성을 기반으로 베이스라인 성능을 예측한다. 여기에는 데이터 분산, 클래스 불균형, 이미지 해상도, 텍스트 길이 등 다양한 메트릭이 포함되며, 이러한 특성은 기존 연구에서 모델 복잡도와 직접적인 상관관계를 보인 바 있다. 두 번째 단계는 모델 아키텍처(예: 레이어 수, 파라미터 규모, 연산량)와 주요 하이퍼파라미터(학습률, 배치

Computer Science Data Machine Learning Model
랜드마크가 이끄는 스윈 트랜스포머 기반 아이덴티티 보존 얼굴 초해상도

랜드마크가 이끄는 스윈 트랜스포머 기반 아이덴티티 보존 얼굴 초해상도

SwinIFS는 얼굴 초해상도(Face Super‑Resolution, FSR) 분야에서 두 가지 핵심 문제, 즉 ‘세밀한 구조 손실’과 ‘아이덴티티 변형’에 동시에 대응하려는 시도로 눈에 띈다. 기존 CNN 기반 방법들은 지역적인 특징을 잘 포착하지만, 장거리 의존성을 모델링하기엔 한계가 있다. 반면 Vision Transformer(ViT) 계열은 전역 정보를 효율적으로 학습하지만, 얼굴과 같이 고정된 구조적 패턴을 다룰 때는 사전 지식이 부족해 세부 디테일 복원에 약점이 있다. SwinIFS는 이러한 딜레마를 ‘랜드마크 가이드

Computer Science Computer Vision
스토리지 기반 그래프 신경망 학습 가속화: AGNES 프레임워크

스토리지 기반 그래프 신경망 학습 가속화: AGNES 프레임워크

본 연구는 그래프 신경망(GNN) 학습을 대규모 실세계 그래프에 적용하기 위해 외부 스토리지를 활용하는 ‘스토리지 기반’ 접근법의 근본적인 한계를 짚어낸다. 기존 연구들은 주로 메모리 한계를 극복하기 위해 NVMe SSD와 같은 고속 저장소를 이용했지만, 그래프 구조가 매우 불규칙하고 엣지와 노드가 수백만~수십억 수준으로 분산돼 있기 때문에 학습 과정에서 발생하는 수십만~수백만 개의 작은 I/O 요청을 효율적으로 병합하거나 스케줄링하지 못한다. 이러한 ‘소형 I/O 폭주’는 스토리지의 순차 전송 대역폭을 활용하지 못하게 만들고, 결

Machine Learning Computer Science Network
에셔버스 물리·동역학·의도 기반 텔레오스페이셜 인텔리전스 오픈월드 벤치마크

에셔버스 물리·동역학·의도 기반 텔레오스페이셜 인텔리전스 오픈월드 벤치마크

본 논문은 인공지능·로보틱스 분야에서 최근 주목받고 있는 “텔레오‑스페이셜 인텔리전스(TSI)”라는 새로운 개념을 제시한다. 기존의 대부분 연구는 물체‑중심(object‑centric) 접근을 취해, 물리‑동역학(Physical‑Dynamic) 모델링에 집중한다. 예컨대, 물체의 질량·마찰·충돌 법칙을 이용해 시뮬레이션하거나, 비전 기반 트래킹을 통해 움직임을 예측한다. 이러한 방법은 정량적 정확도에서는 뛰어나지만, 인간이 물체를 조작하거나 배치하는 근본적인 ‘의도’를 파악하지 못한다는 한계가 있다. TSI는 이러한 한계를 극복하기

Computer Vision Computer Science Data
테스트 시점 학습 기반 고적응 레이더 에코 외삽 REE TTT

테스트 시점 학습 기반 고적응 레이더 에코 외삽 REE TTT

본 논문은 레이더 에코 외삽(Radar Echo Extrapolation, REE) 분야에서 가장 시급한 문제인 도메인 전이와 데이터 분포 변화 에 대한 해결책을 제시한다. 기존의 딥러닝 기반 REE 모델은 대규모 레이더 시퀀스를 학습해 단기 강수 예보를 수행하지만, 학습 단계에서 사용된 지역·시즌·기후 조건에 강하게 의존한다. 따라서 새로운 지역이나 극한 강수 상황에 적용하면 성능이 급격히 저하되는 것이 일반적이다. 1. 핵심 아이디어와 기여 테스트‑시점 학습(Test‑Time Training, TTT) 적용 : 모델 파라미터를

Computer Science Machine Learning
RovoDev 코드 리뷰어: Atlassian에서 실현한 LLM 기반 코드 검토 자동화의 혁신

RovoDev 코드 리뷰어: Atlassian에서 실현한 LLM 기반 코드 검토 자동화의 혁신

RovoDev 코드 리뷰어는 LLM 기반의 코드 검토 자동화 도구로서, 현대 소프트웨어 개발 프로세스에서 중요한 역할을 수행한다. 이 논문은 RovoDev이 어떻게 데이터 프라이버시와 보안 문제를 해결하고, 리뷰 가이드라인에 따른 정확한 코드 검토를 제공하며, 새로운 프로젝트에서도 효과적으로 작동하는지 설명한다. 기술적 혁신성: RovoDev의 핵심 기술은 제로샷 컨텍스트 인식 리뷰 댓글 생성, 사실적 정확성 품질 검사, 그리고 행동성 품질 검사를 통한 유효하고 행동 가능한 리뷰 댓글 추천이다. 이 중 특히 제로샷 접근 방식은 고객

Computer Science Software Engineering
No Image

객체 중심 학습의 혁신: CODA로 구현되는 정확하고 유연한 객체 표현

본 논문은 객체 중심 학습(Object centric Learning, OCL) 분야에서 중요한 기술적 혁신을 제시하고 있습니다. CODA(Contrastive Object centric Diffusion Alignment)는 사전 학습된 디퓨전 모델을 활용하여 슬롯 엮임과 약한 정렬이라는 주요 도전 과제를 해결하는 새로운 접근 방식입니다. 기술적 혁신성: 1. 등록 슬롯(Register Slots): 등록 슬롯은 독립적인 입력 데이터로 추가되어 잔여 주의를 흡수하고 객체 슬롯 간의 간섭을 줄이는 역할을 합니다. 이는 슬롯 엮임 문

Computer Science Learning Computer Vision
대형 언어 모델의 실행 안정성: 코드 생성에서 메모리 동역학 분석

대형 언어 모델의 실행 안정성: 코드 생성에서 메모리 동역학 분석

이 논문은 대형 언어 모델(LLM)에서 생성된 코드의 실행 안정성에 중점을 두고, 특히 메모리 동역학 측면에서 그 중요성을 강조한다. 기존 연구에서는 주로 LLM의 출력 정확도와 다양성에 초점을 맞추었지만, 이 논문은 이러한 정확한 결과가 반드시 실행 시간 메모리 프로파일링에서도 안정적인 성능을 보장하지 않는다는 점을 지적한다. 논문에서 제시된 주요 기여 중 하나는 Monotonic Peak Profile (MPP) 와 Dynamic Time Warping (DTW) 를 활용한 실행 시간 메모리 프로파일링 방법이다. 이 방법은 애플

Computer Science Software Engineering
No Image

CoCo‑Fed 메모리·통신 효율을 동시에 잡는 통합 연합 학습 프레임워크

CoCo‑Fed가 제시하는 두 가지 핵심 혁신은 ‘이중 차원 다운프로젝션’과 ‘직교 부분공간 초중첩 전송’이다. 첫 번째 단계에서는 기존 연합 학습에서 각 gNB가 전체 모델 파라미터에 대한 그래디언트를 저장·전송해야 하는 문제를 해결한다. 저자들은 그래디언트를 먼저 채널 차원(예: 입력 피처)과 모델 차원(예: 출력 피처) 두 축에서 각각 저‑랭크 행렬로 근사한다. 이때 사용되는 투사 행렬은 사전에 학습된 고정 정규 직교 행렬이거나, 각 라운드마다 랜덤하게 생성된 스케치 행렬일 수 있다. 이렇게 하면 메모리 요구량이 O(rank·

Computer Science Learning Information Theory Framework
No Image

LLM 에이전트를 활용한 투자 포트폴리오 최적화: 복잡한 조합 문제 해결의 새로운 패러다임

본 논문은 언어 모델(LLM)을 활용한 에이전트 프레임워크를 통해 복잡한 조합 최적화 문제에 새로운 접근 방식을 제시하고 있습니다. 이 연구의 핵심 가치는 다음과 같은 기술적 혁신성, 방법론, 실험 결과를 통해 분석할 수 있습니다. 1. 기술적 혁신성: 본 논문은 LLM을 활용한 에이전트 프레임워크를 제시함으로써, 기존의 학문적인 최적화 접근법에서 벗어나 실제 생활 문제에 초점을 맞추고 있습니다. 특히, NPhard한 조합 최적화 문제 해결에 있어 LLM을 활용하는 것은 이전 연구에서는 찾아보기 어려운 혁신적인 시도입니다. MOCO

Computer Science Computational Engineering
데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

본 논문은 최근 의료 영상 분야에서 각광받고 있는 비전‑언어 모델(VLM)의 실제 운영 단계에서 발생할 수 있는 ‘데이터 시프트(data shift)’ 문제에 초점을 맞추었다. 데이터 시프트는 크게 두 가지 차원으로 나뉜다. 첫 번째는 입력 데이터 자체가 훈련 시와 다른 분포를 보이는 경우이며, 두 번째는 모델이 출력하는 예측값이나 신뢰도(confidence)가 변하는 경우이다. 기존 연구들은 주로 입력 차원의 통계적 변화를 탐지하는 방법에 의존했지만, 이러한 변동이 반드시 모델 성능 저하와 직결되지 않는다는 점을 간과하고 있었다.

Computer Science Model Data Computer Vision
선거 소셜 미디어 설득 시뮬레이션 프레임워크 ElecTwit

선거 소셜 미디어 설득 시뮬레이션 프레임워크 ElecTwit

ElecTwit이 제시하는 가장 큰 혁신은 설득 연구를 위한 실험 환경을 ‘게임’이라는 인위적 설정에서 벗어나 실제 소셜 미디어 플랫폼의 구조와 행태를 모사한 점이다. 이를 위해 저자들은 트위터와 유사한 게시·리트윗·팔로우 메커니즘을 구현하고, 정치적 선거라는 구체적 시나리오를 설정함으로써 에이전트 간의 정보 흐름, 의견 형성, 그리고 설득 전략의 전개 과정을 정밀하게 관찰할 수 있었다. 특히 25가지 설득 기법을 사전 정의하고, 각 LLM이 이를 어떻게 선택·조합하는지를 정량화한 방법론은 설득 기술의 ‘레시피’를 비교 분석하는 데

Computer Science Artificial Intelligence Framework System
온라인 전파 최대화를 위한 지연 전방 선택 알고리즘

온라인 전파 최대화를 위한 지연 전방 선택 알고리즘

본 논문이 다루는 온라인 영향력 최대화(Online Influence Maximization, OIM) 문제는 전통적인 정적 IM과 달리 시간에 따라 시드 집합을 동적으로 선택해야 하는 상황을 전제로 한다. 여기서 ‘전체 밴딧(full‑bandit) 피드백’이라는 가정은 에이전트가 매 라운드마다 선택한 시드 집합에 의해 실제로 발생한 확산 규모(즉, 전체 활성화된 노드 수)만을 관찰한다는 의미이며, 이는 각 노드별 활성화 여부나 네트워크의 인접 행렬 등 추가적인 구조적 정보를 전혀 제공하지 않는다. 이러한 제한된 피드백 환경에서는

Machine Learning Computer Science
LLM 기반 코드 취약점 탐지를 위한 실증 평가 RAG SFT 듀얼 에이전트 시스템

LLM 기반 코드 취약점 탐지를 위한 실증 평가 RAG SFT 듀얼 에이전트 시스템

본 연구는 LLM을 활용한 코드 취약점 탐지의 실용성을 정량적으로 평가하기 위해 세 가지 접근법을 체계적으로 비교하였다. 첫 번째 접근법인 Retrieval‑Augmented Generation(RAG)은 사전 학습된 LLM에 외부 지식 베이스를 동적으로 연결한다. 구체적으로, MITRE CWE 데이터베이스와 최신 웹 검색 결과를 실시간으로 가져와 프롬프트에 삽입함으로써 모델이 코드 조각을 해석할 때 최신 보안 패턴과 CWE 정의를 참조하도록 설계되었다. 이 과정은 벡터 검색 엔진(FAISS)과 텍스트 임베딩을 활용해 관련 문서를

System Computer Science Software Engineering Detection
LLM으로 라벨링된 룩셈부르크어 NER 품질 평가

LLM으로 라벨링된 룩셈부르크어 NER 품질 평가

judgeWEL 논문은 저자원 언어인 룩셈부르크어에 대한 NER 데이터 구축이라는 실질적인 문제에 대해 창의적인 해결책을 제시한다. 가장 큰 강점은 두 가지 측면에서 약한 감독을 활용한다는 점이다. 첫째, 위키피디아 내부 링크와 위키데이터의 구조화된 메타데이터를 연결함으로써 엔터티 유형을 자동으로 추론한다는 아이디어는 기존의 규칙 기반 혹은 사전 매핑 방식보다 확장성이 뛰어나다. 위키피디아는 지속적으로 업데이트되며 다양한 도메인을 포괄하므로, 이 접근법은 새로운 엔터티가 등장해도 비교적 쉽게 반영될 수 있다. 둘째, 자동 라벨링 단

Computer Science NLP Data
구체 위에 원을 그리는 신경망, 확실히 포도 따기

구체 위에 원을 그리는 신경망, 확실히 포도 따기

본 연구는 현재 인공지능 추론 분야에서 가장 논쟁이 되는 세 가지 접근법을 체계적으로 비교함으로써, “신뢰성”이라는 관점에서 중요한 통찰을 제공한다. 첫 번째 범주인 대규모 언어 모델(LLM) 기반 추론은 방대한 텍스트 코퍼스를 사전 학습함으로써 언어적 유연성을 얻지만, 논리적 일관성 유지와 같은 엄격한 판단에서는 여전히 불안정한 결과를 보인다. 이는 LLM이 통계적 패턴에 기반한 예측을 수행하기 때문에, 명시적인 논리 규칙을 내재화하지 못한다는 근본적인 한계와 연결된다. 두 번째인 감독 학습 기반 추론은 특정 논리 과제에 대해 라

Network Computer Science Artificial Intelligence
단일세포 유전체학 전처리와 통합 방법 벤치마크

단일세포 유전체학 전처리와 통합 방법 벤치마크

본 논문은 단일세포 다중모달 데이터 분석 파이프라인의 핵심 단계인 정규화, 통합, 차원 축소를 체계적으로 비교함으로써 현재 사용되는 방법들의 실제 적용 가능성을 평가한다. 먼저 정규화 단계에서는 총 7가지 방법을 시험했는데, 이는 전통적인 로그 변환, SCTransform, CPM, TPM 등부터 최신의 베이지안 기반 정규화까지 포괄한다. 정규화는 각 세포의 기술적 변동성을 최소화하고, 서로 다른 모달리티 간의 스케일 차이를 조정하는 데 필수적이며, 논문은 정규화 선택이 통합 결과에 미치는 영향을 정량적으로 제시한다. 통합 단계에서

Quantitative Biology
디바이스 기반 자율 에이전트를 통한 프라이버시 보호 협상

디바이스 기반 자율 에이전트를 통한 프라이버시 보호 협상

본 논문은 기존 클라우드‑중심 협상 플랫폼이 갖는 “데이터 중앙집중 → 보안 위협 → 사용자 신뢰 저하”라는 구조적 문제를 근본적으로 재구성한다는 점에서 학술적·산업적 의의를 가진다. 첫 번째로, 디바이스‑네이티브( device‑native ) 아키텍처는 모든 협상 로직과 제약 조건을 사용자의 로컬 환경에 격리함으로써 데이터 탈취 위험을 최소화한다. 이는 특히 GDPR·CCPA 등 데이터 주권 규제가 강화되는 현재 상황에서 법적·규제적 컴플라이언스를 자연스럽게 충족한다는 장점이 있다. 두 번째로, 제로 지식 증명(zero‑knowl

Computer Science Cryptography and Security
AdaGReS 토큰 예산을 고려한 중복 인식 적응형 컨텍스트 선택

AdaGReS 토큰 예산을 고려한 중복 인식 적응형 컨텍스트 선택

AdaGReS 논문은 현재 RAG 시스템이 직면한 두 가지 핵심 문제—토큰 예산의 제한과 컨텍스트 중복—를 동시에 해결하려는 시도로 눈에 띈다. 전통적인 top‑k 검색은 단순히 점수 순으로 청크를 선택하기 때문에, 의미적으로 거의 동일한 문장이 여러 번 포함될 경우 불필요한 토큰을 소모한다. 이는 특히 제한된 컨텍스트 길이를 갖는 대형 언어 모델(Large Language Model, LLM)에서 심각한 성능 저하 요인으로 작용한다. AdaGReS는 이를 극복하기 위해 “관련도‑중복 복합 목표 함수”를 정의한다. 목표 함수는 (1

Computer Science NLP
AI 기반 다중 클러스터 클라우드 자원 최적화 프레임워크

AI 기반 다중 클러스터 클라우드 자원 최적화 프레임워크

이 논문이 다루는 문제는 다중 클러스터 환경에서 발생하는 전통적인 자원 관리의 한계이다. 현재 대부분의 클라우드 운영자는 각 클러스터를 독립적인 관리 단위로 보고, 스케일링이나 리소스 재배치를 워크로드 변화에 따라 즉각적으로 반응하는 방식으로 수행한다. 이러한 클러스터‑중심적 접근은 전역적인 시야를 결여하게 만들며, 특히 지리적으로 분산된 데이터센터 간에 부하가 불균형하게 전파될 경우 전체 시스템의 비용 효율성과 서비스 수준이 크게 저하된다. 논문은 이를 해결하기 위해 세 가지 핵심 요소를 결합한 AI‑기반 프레임워크를 제시한다.

Computer Science Distributed Computing
LeanCat 카테고리 이론 벤치마크 1범주 형식화

LeanCat 카테고리 이론 벤치마크 1범주 형식화

이 논문은 형식화된 수학 연구에 있어 “구조적 추론”이라는 핵심 과제를 명확히 제시한다는 점에서 의미가 크다. 기존의 정리 증명 벤치마크는 주로 구체적인 계산이나 전통적인 위상·대수적 명제에 초점을 맞추어 왔으며, 라이브러리(예: Mathlib)와의 상호작용을 최소화했다. 그러나 현대 수학은 범주론과 같은 고차 구조를 통해 다양한 분야를 연결하고, 이러한 구조는 정의, 함자, 자연 변환 등 복합적인 인터페이스를 요구한다. 따라서 LLM이 실제 연구자 수준의 능력을 보이려면 단순히 “정리를 증명”하는 것을 넘어, 라이브러리 안에서 적

Computer Science Logic
No Image

LLM은 스스로의 한계를 알까

이 논문은 “메타‑인지”라는 관점에서 LLM의 자기 평가 능력을 체계적으로 검증한다는 점에서 의미가 크다. 먼저 연구진은 “성공 예측”이라는 이진 판단을 통해 모델이 자신의 한계를 얼마나 정확히 인식하는지를 측정하였다. 여기서 사용된 평가지표는 단순 정확도뿐 아니라 ROC‑AUC와 같은 구별력 지표이며, 이는 모델이 과신(over‑confidence)과 과소신(under‑confidence) 사이에서 어느 정도 균형을 잡는지를 보여준다. 결과는 대부분의 최신 LLM이 높은 확신을 보이지만, 무작위보다 높은 AUC를 기록한다는 점이다

Computer Science NLP Model
R Debater 검색 기반 논쟁 생성과 논증 메모리 활용

R Debater 검색 기반 논쟁 생성과 논증 메모리 활용

R‑Debater는 “논증 메모리”라는 개념을 토론 생성에 적용함으로써 기존 LLM 기반 토론 시스템이 갖는 몇 가지 근본적인 한계를 극복한다. 첫째, 일반적인 LLM은 대규모 사전학습을 통해 풍부한 언어 능력을 보유하지만, 특정 주장이나 증거를 일관되게 인용하는 능력은 제한적이다. 이는 특히 다중 턴 토론에서 ‘입장 일관성’과 ‘증거 기반 주장’이 요구될 때, 모델이 앞선 발언을 망각하거나 부정확한 정보를 삽입하는 오류를 초래한다. R‑Debater는 별도의 토론 지식베이스를 구축해 사례‑형 증거와 과거 토론 전개를 인덱싱하고,

Computer Science NLP
반사실 자기질문을 통한 언어 모델 정책 최적화 안정화

반사실 자기질문을 통한 언어 모델 정책 최적화 안정화

본 논문이 제시하는 Counterfactual Self‑Questioning(CSQ)은 기존 자기 개선 메커니즘이 안고 있던 “외부 의존성”이라는 근본적인 문제를 근본적으로 해결한다는 점에서 학술적·실용적 의미가 크다. 먼저, CSQ는 하나의 언어 모델이 스스로 “왜 이 추론이 틀렸는가”를 탐색하도록 설계된 세 단계 파이프라인을 도입한다. 초기 롤아웃 단계에서 모델은 일반적인 chain‑of‑thought 방식으로 문제를 해결하고, 그 과정에서 생성된 중간 단계와 최종 답안을 그대로 보관한다. 이어지는 자기질문 단계에서는 모델이 “

Computer Science Artificial Intelligence Model
압축 기법이 자연 손상 상황에서 CNN 견고성에 미치는 영향 평가

압축 기법이 자연 손상 상황에서 CNN 견고성에 미치는 영향 평가

본 연구는 모델 압축이 CNN의 견고성에 미치는 영향을 체계적으로 규명하기 위해 세 가지 대표적인 압축 기법—양자화(Quantization), 프루닝(Pruning), 가중치 클러스터링(Weight Clustering)—을 선택하였다. 각각의 기법은 메모리 사용량과 연산량을 감소시키는 메커니즘은 유사하지만, 파라미터 분포와 활성화 패턴에 미치는 영향이 다르다. 양자화는 가중치를 낮은 비트 폭으로 표현함으로써 연산 정밀도를 낮추지만, 정규화된 레이어에서는 오차가 부분적으로 상쇄되는 경향이 있다. 프루닝은 중요도가 낮은 채널이나 필터를

Computer Science Computer Vision
이미지 기반 추론 시스템을 통한 재활용 가능성 평가 맥락 지능의 최신 동향

이미지 기반 추론 시스템을 통한 재활용 가능성 평가 맥락 지능의 최신 동향

본 논문은 재활용 실천을 지원하기 위한 인공지능 기반 도구의 가능성을 탐색한다는 점에서 사회적·환경적 의미가 크다. 연구진은 먼저 재활용 대상 물품을 다양한 각도와 조명 조건에서 촬영한 이미지와, 각 물품이 속해야 할 재활용통(플라스틱, 금속, 종이 등) 및 물리적 치수 정보를 포함한 메타데이터를 결합한 데이터셋을 구축하였다. 데이터셋은 5,000여 장의 이미지와 1,200개의 다중 재질 사례를 포함해, 실제 가정에서 마주치는 복합 상황을 충분히 반영한다. 모델 평가에서는 두 단계의 질문을 제시한다. 첫 번째는 “이 물건은 어느 재

System Computer Vision Computer Science
효율적인 계층적 계획과 다목표 선호 정렬을 통한 슬레이트 추천 모델 HiGR

효율적인 계층적 계획과 다목표 선호 정렬을 통한 슬레이트 추천 모델 HiGR

HiGR 논문은 슬레이트 추천이라는 복합적인 문제를 두 가지 핵심 차원에서 혁신적으로 접근한다. 첫 번째는 아이템 토크나이제이션 단계이다. 기존의 자동회귀 기반 모델은 아이템을 단순히 고유 번호 혹은 임베딩 벡터로 변환한 뒤 순차적으로 예측한다. 이 경우 아이템 간 의미적 연관성이 토큰 수준에서 충분히 반영되지 않아, “음악‑팝”과 “음악‑재즈”와 같은 유사 아이템이 서로 다른 토큰으로 취급돼 모델이 불필요한 혼동을 겪는다. HiGR은 잔차 양자화(residual quantization)와 대비 학습(contrastive learn

Computer Science Information Retrieval
흐름을 타라 에이전트 제작과 록앤롤 그리고 오픈 에이전트 학습 생태계 내 ROME 모델 구축

흐름을 타라 에이전트 제작과 록앤롤 그리고 오픈 에이전트 학습 생태계 내 ROME 모델 구축

본 논문은 “에이전트 제작(agentic crafting)”이라는 개념을 기존의 일회성 텍스트 생성과 구별하여, 실제 세계에서 다중 턴을 거쳐 행동하고 그 결과를 관찰·피드백하는 반복적 프로세스로 정의한다. 이는 단순히 코드를 자동 생성하는 수준을 넘어, 복합적인 툴 체인과 언어 기반 워크플로 전반에 걸쳐 모델이 계획·실행·모니터링·수정까지 전 과정을 담당해야 함을 의미한다. 이러한 요구를 충족하려면 모델 자체뿐 아니라, 모델이 작동할 환경, 데이터 파이프라인, 학습·배포 인프라가 모두 유기적으로 연결된 ‘에이전트 학습 생태계(AL

Model Artificial Intelligence System Computer Science Learning
고성능 머신러닝 스트림 컴퓨팅을 위한 데이터플로우 프레임워크

고성능 머신러닝 스트림 컴퓨팅을 위한 데이터플로우 프레임워크

본 논문은 데이터 과학 실무에서 가장 빈번히 마주치는 ‘데이터는 유한하고 완전하다’는 가정을 근본적으로 뒤흔든다. 전통적인 배치 기반 워크플로우는 고정된 데이터셋을 한 번에 메모리로 로드하거나 단일 패스로 처리한다는 전제하에 설계되었으며, 이는 센서 스트림, 금융 거래 로그, 시스템 이벤트와 같이 시간에 따라 지속적으로 생성되는 데이터와는 근본적으로 맞지 않는다. 저자는 이러한 불일치를 해결하기 위해 Causify DataFlow라는 통합 컴퓨테이셔널 모델을 제안한다. 첫째, 프레임워크는 DAG를 선언적으로 정의하고, 동일한 정의를

Framework Machine Learning Computer Science Learning Data
시간 그래프 어텐션과 계층적 융합을 활용한 UGV 혼잡 환경 내 내비게이션

시간 그래프 어텐션과 계층적 융합을 활용한 UGV 혼잡 환경 내 내비게이션

본 논문은 복잡한 인간·로봇 혼재 환경에서 UGV가 실시간으로 안전하고 효율적으로 이동하기 위해 필요한 두 가지 핵심 요소, 즉 ‘시간적 연속성’과 ‘다중 센서 융합’을 동시에 만족시키는 새로운 DRL 기반 아키텍처를 제시한다. 기존 DRL 기반 내비게이션 연구들은 주로 현재 시점의 RGB 이미지 혹은 LiDAR 포인트 클라우드와 같은 단일 프레임 데이터를 입력으로 사용하고, 여러 모달리티를 결합할 때는 단순히 벡터를 이어 붙이는(concatenation) 방식을 채택한다. 이러한 설계는 (1) 과거 프레임에서 관찰된 움직이는 장애

Computer Science Robotics
에이전트 기반 추천 시스템에서 KYC 활용 비교 분석

에이전트 기반 추천 시스템에서 KYC 활용 비교 분석

본 논문은 KYC 데이터를 에이전트형 인공지능(AI)과 결합함으로써 개인화 추천의 정확도와 신뢰성을 동시에 향상시키는 새로운 패러다임을 제시한다. 먼저, KYC는 전통적으로 금융 기관이 고객의 신원·거래 위험을 평가하기 위해 수집하는 정형·비정형 데이터 집합이며, 개인정보 보호와 규제 준수 측면에서 높은 민감성을 가진다. 이러한 데이터를 추천 시스템에 직접 투입하면 사용자의 신용도·소득 수준·거래 패턴 등을 기반으로 맞춤형 콘텐츠를 제공할 수 있어, 특히 광고(Ad)와 기술(Tech) 분야에서 전환율을 크게 끌어올릴 가능성이 있다.

Computer Science Analysis Information Retrieval System
No Image

하이퍼그래프 기반 메모리를 활용한 다단계 RAG의 장기 컨텍스트 복합 관계 모델링 향상

본 논문은 다단계 RAG 시스템에서 메모리의 역할을 근본적으로 재정의한다는 점에서 학술적·실용적 의의가 크다. 기존 연구들은 메모리를 “수동적 저장소”로 간주하고, 검색된 텍스트 조각들을 단순히 압축하거나 순차적으로 연결하는 방식에 머물렀다. 이러한 접근은 개별 사실을 나열하는 수준에 그치며, 사실 간의 복합적 관계—예를 들어, 인과관계, 공통 원인, 상호 보완적 증거 등—를 포착하지 못한다. 결과적으로 장기 문맥에서 여러 단계에 걸친 추론이 단절되고, 전역적 의미망을 형성하는 데 한계가 발생한다. HGMEM은 이러한 문제를 해결하

Computer Science NLP Model
PathFound 증거 탐색형 병리 진단을 위한 에이전트형 멀티모달 모델

PathFound 증거 탐색형 병리 진단을 위한 에이전트형 멀티모달 모델

PathFound 논문은 기존 병리학 인공지능 모델이 갖는 ‘한 번에 전체 슬라이드 처리’라는 한계를 명확히 지적하고, 실제 병리학자의 진단 과정과 유사한 증거‑중심적 순환 프로세스 를 도입함으로써 새로운 연구 방향을 제시한다. 먼저, 모델 아키텍처는 세 가지 핵심 모듈로 구성된다. ① 시각 기반 파운데이션 모델 은 대용량 디지털 슬라이드에서 고해상도 특징을 추출하고, ② 비전‑언어 모델(VLM) 은 이미지 특징을 텍스트 형태의 임상 질문이나 설명과 연결한다. ③ 강화학습(RL) 기반 추론 에이전트 는 현재 진단 가설을 평가하고,

Computer Science Model Computer Vision
PathoSyn 해부학 기반 병변 편차 확산 MRI 합성

PathoSyn 해부학 기반 병변 편차 확산 MRI 합성

PathoSyn 논문은 MRI 합성 분야에서 기존 접근법이 안고 있던 두 가지 핵심 한계를 체계적으로 해결한다는 점에서 학술적·실용적 의의를 가진다. 첫 번째 한계는 “전역 픽셀‑레벨” 생성 모델이 해부학적 구조를 충분히 보존하지 못한다는 점이다. GAN‑기반 혹은 전체 확산 모델은 이미지 전체를 한 번에 샘플링하기 때문에, 병변과 정상 조직 사이의 미세한 경계가 흐려지거나 비현실적인 형태로 변형될 위험이 있다. 두 번째 한계는 “이진 마스크 기반” 조건부 생성이 병변 영역을 지나치게 단순화한다는 점이다. 마스크는 병변의 위치와 대

Computer Science Computer Vision
실시간 도로 상태 모니터링 시스템: 날씨와 이미지 기반의 깊은 학습 접근법

실시간 도로 상태 모니터링 시스템: 날씨와 이미지 기반의 깊은 학습 접근법

본 연구는 실시간 도로 상태 모니터링 시스템의 개발을 목표로 하며, 이를 통해 차량 관리 및 활성 차량 제어 시스템에 필요한 정보를 제공하고자 합니다. 전통적인 방법들이 비용과 시간이 많이 소요되는 반면, 본 연구에서는 날씨 조건 데이터와 도로 표면 상태 데이터를 활용한 새로운 접근법을 제시합니다. 특히, 칼스루에 공과대학교 주변 도로에서 모바일 폰 카메라를 이용해 수집된 이미지 데이터와 가속도 데이터를 통해 다양한 딥러닝 알고리즘의 성능을 비교하였습니다. 본 연구에서는 Alexnet, LeNet, VGG 및 Resnet 등 네 가

Learning
벤치마크는 성공 임상은 실패 강화학습이 환자보다 지표에 최적화될 때

벤치마크는 성공 임상은 실패 강화학습이 환자보다 지표에 최적화될 때

본 논문은 의료 영상 분야에서 최근 각광받고 있는 강화학습(RL) 기반 파인튜닝이 실제 임상 적용에 어떤 함의를 갖는지 심도 있게 탐구한다. 먼저 저자들은 “R1‑style”이라 명명한 두 단계 학습 파이프라인을 제시한다. 첫 단계는 비교적 적은 양(2,000개)의 라벨링된 이미지‑텍스트 쌍을 이용한 지도학습(Supervised Fine‑Tuning, SFT)이며, 두 번째 단계는 1,000개의 RL 샘플을 활용해 GRPO(Goal‑oriented Reward‑based Policy Optimization)라는 정책 최적화 기법을

Computer Science Artificial Intelligence Learning
양자 세계는 존재하지 않는다 버브의 논평을 파헤치다

양자 세계는 존재하지 않는다 버브의 논평을 파헤치다

이 논평은 양자 논리와 확률 이론 사이의 깊은 구조적 연관성을 강조한다. 직교 공간(orthogonal space)은 힐베르트 공간의 한 형태로, 양자역학에서 상태벡터가 서로 직교할 때 서로 배타적인 물리적 상태를 나타낸다. 이러한 공간에 대해 “직교성을 보존하는 사상”이라 함은 두 벡터가 직교일 때 그 이미지 역시 직교가 되는 선형 혹은 반선형 변환을 의미한다. Uhlhorn 정리는 이러한 사상이 실제로는 전체 내적을 보존하는(즉, 유니터리 혹은 반유니터리) 변환에 한정된다는 강력한 결과를 제공한다. 즉, 직교성을 보존하면 자동적

Quantum Physics
No Image

계속학습에서의 재현성과 공정한 비교를 위한 통합 플랫폼 LibContinual

이 논문은 계속학습(Continual Learning) 분야에서 중요한 문제인 치명적인 잊음을 해결하기 위해 LibContinual이라는 새로운 라이브러리를 제안하고 있습니다. 이 라이브러리는 고결합 저결착 모듈형 아키텍처를 기반으로, 5개의 주요 방법론 카테고리에 걸쳐 19개의 대표적인 알고리즘을 통합하여 제공합니다. 이러한 구조는 다양한 CL 방법들을 비교하고 재현 가능한 연구 환경을 제공하는 데 중요한 역할을 합니다. 논문은 또한 현재 평가에서 일반적으로 발견되는 세 가지 암묵적인 가정(오프라인 데이터 접근 가능성, 제한 없는

Learning
No Image

모듈화 확산 정책 프레임워크: 복잡한 로봇 행동 분포에 대한 효과적인 학습

본 논문은 다중 작업 학습의 복잡성을 해결하기 위해 새로운 접근법을 제시합니다. 로봇 행동 분포는 매우 다양하고, 이로 인해 일관된 모델이 이를 효과적으로 학습하는 데 어려움을 겪습니다. 이러한 문제를 해결하기 위해 논문은 모듈화된 확산 정책 프레임워크를 제안합니다. 이 프레임워크는 복잡한 행동 분포를 여러 개의 특수화된 확산 모델로 분해하여 각각이 특정 하위 모드를 포착하도록 합니다. 이러한 접근법은 각 모듈이 독립적으로 학습하고, 필요에 따라 추가하거나 조정할 수 있어 새로운 작업에 대한 유연한 적응을 가능하게 합니다. 또한,

Learning
터키어 자연어 이해를 위한 종합 벤치마크: TrGLUE와 SentiTurca 소개

터키어 자연어 이해를 위한 종합 벤치마크: TrGLUE와 SentiTurca 소개

이 논문은 터키어 자연어 처리(NLP)의 성능 평가를 위해 필요한 종합적인 벤치마크를 제시하고 있습니다. 특히, TrGLUE와 SentiTurca라는 두 가지 새로운 벤치마크를 소개하며, 이는 터키어 NLU 능력을 평가하는 데 중요한 역할을 합니다. GLUE 벤치마크가 영어 NLU의 성능 평가에 대한 표준을 제공한 것처럼, TrGLUE는 터키어에서도 유사한 기능을 수행합니다. 논문은 다양한 언어별로 개발된 벤치마크를 소개하며, 이러한 벤치마크의 중요성을 강조하고 있습니다. 특히, 터키어에 대한 종합적인 NLU 평가 벤치마크가 부재한

Analysis
S&P 500 주가 예측을 위한 다변량 데이터와 컨볼루션 신경망의 활용

S&P 500 주가 예측을 위한 다변량 데이터와 컨볼루션 신경망의 활용

이 논문은 S&P 500 지수를 구성하는 주식의 움직임을 예측하는데 초점을 맞추고 있다. 과거에는 다양한 방법론을 사용하여 주가 예측에 대한 많은 접근법들이 시장에서 알고리즘 거래와 알파 생성 시스템에 활용되어 왔다. 최근 인공 신경망의 성공은 기계 학습과 딥러닝 분야의 최신 연구를 통해 예측을 가능하게 하는 길을 열었다. 이 논문에서는 실세계 시장 데이터에서 발생하는 주식 분할/배당 이벤트를 포함한 다변량 원시 데이터를 사용하여, 이미지 분류에 가장 잘 알려진 도구인 컨볼루션 신경망(CNN)을 적용하고 있다. 이러한 접근법은 각각

의료 AI의 진단 능력: 현실과 간극

의료 AI의 진단 능력: 현실과 간극

이 논문은 의료 분야에서 인공 지능(AI)의 실제 성능을 평가하는 중요한 연구를 제공한다. 특히, 이 연구는 AI 모델들이 실제 임상 상황에서 얼마나 효과적으로 작동하는지에 대한 깊이 있는 통찰력을 제공한다. B&J 벤치마크는 의료 분야에서 AI의 성능을 종합적으로 평가하기 위한 체계적인 접근법을 제시하며, 이는 기존의 단순한 선택지 문제를 넘어 실제 환자 치료에 필요한 다양한 추론 능력을 평가한다. 연구 결과는 AI 모델들이 구조화된 질문에서는 높은 성능을 보이지만, 실제 임상 상황에서 요구되는 복잡하고 다중모달적인 추론에는 아직

Model
언어모델의 추론능력 향상: 잘못된 최종답안에도 불구하고 합성 데이터를 통한 개선

언어모델의 추론능력 향상: 잘못된 최종답안에도 불구하고 합성 데이터를 통한 개선

이 논문은 언어 모델의 추론 능력을 향상시키는 새로운 접근법을 제시합니다. 핵심 아이디어는 더 우수한 모델에서 생성된 사슬형 사고(CoT) 추적을 사용하여 합성 데이터셋을 만들어 이를 통해 학습하는 것입니다. 이 방법의 놀라운 점은 이러한 CoT 추적이 잘못된 최종 답안으로 이어진다 하더라도, 언어 모델의 성능이 향상된다는 것입니다. 논문에서는 두 가지 주요 가설을 제시합니다: 첫째, 합성 데이터의 분포가 언어 모델 자체의 분포와 더 가깝기 때문에 학습이 용이하다는 점입니다. 이를 검증하기 위해 인간 주석 추적을 문장 변환하여 분포

자연어 설명 기반 이미지 검색 경량 두 단계 시스템

자연어 설명 기반 이미지 검색 경량 두 단계 시스템

분석 요약 1. 논문의 주요 내용 및 목적: 이 논문은 자연어 설명을 기반으로 이미지를 검색하는 경량 두 단계 파이프라인 시스템을 제안하고 있습니다. 이 시스템은 실제 세계 캡션에서 시간적, 문맥적 신호를 포함한 복잡한 정보를 처리할 수 있도록 설계되었습니다. 2. 배경 및 동기: 응용 분야 : 이미지 검색은 웹 검색, 뉴스 아카이브, 전자상거래 등 다양한 분야에서 중요한 역할을 합니다. 문제점 : 기존 모델들은 짧은 캡션에 최적화되어 있어 복잡한 실제 세계 쿼리 처리 능력이 부족합니다. 이로 인해 뉴스나 이벤트 검색과 같은 도메인

No Image

컨텍스트 밴딧으로 최적화하는 Raft 타임아웃 적응 메커니즘 BALLAST

이 논문은 Raft 합의 프로토콜에서 가장 흔히 사용되는 무작위 선출 타임아웃이 장기 지연(long‑tail latency)이나 네트워크 파티션 복구 시에 발생하는 “분할 투표(split vote)” 현상으로 인해 시스템 가용성이 급격히 저하되는 문제점을 정확히 짚어낸다. 기존 연구들은 타임아웃 값을 고정하거나 단순히 평균 지연에 기반한 조정 방식을 제안했지만, 이러한 접근법은 네트워크 상태가 급변하거나 비정상적인 지연 분포가 나타날 때 적응성이 부족하다. BALLAST는 이러한 한계를 극복하기 위해 ‘컨텍스트 밴딧(contextu

Learning
클래스 프로토타입 기반 세그멘테이션 비전 트랜스포머를 활용한 고해상도 식물 이미지 다중 라벨 식별

클래스 프로토타입 기반 세그멘테이션 비전 트랜스포머를 활용한 고해상도 식물 이미지 다중 라벨 식별

이 연구는 PlantCLEF 2025라는 대규모 식물 이미지 인식 대회에서 고해상도 플롯 이미지의 다중 라벨 식별이라는 어려운 과제를 해결하기 위해 두 가지 핵심 아이디어를 결합하였다. 첫 번째는 클래스 프로토타입 을 활용한 지도 학습이다. 기존의 다중 클래스 분류와 달리, 여기서는 훈련 데이터에서 각 종마다 대표적인 특징 벡터(프로토타입)를 K‑Means 군집화로 추출한다. K값을 클래스 수와 동일하게 설정함으로써, 각 군집 중심이 곧 해당 종을 대표하도록 설계하였다. 이러한 프로토타입은 테스트 이미지에 대한 세그멘테이션 모델이

< 분야별 논문 현황 (Total: 791) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
9
HEP-EX
7
HEP-PH
12
HEP-TH
7
MATH-PH
4
NUCL-TH
1
Quantum Physics
11

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키