General

'General' 카테고리의 모든 글

총 273개의 글
시간순 정렬
초월적 그래프 임베딩으로 보는 이상 탐지 혁신

초월적 그래프 임베딩으로 보는 이상 탐지 혁신

하이퍼볼릭 그래프 임베딩은 최근 복잡하고 비유클리드적인 네트워크 구조를 모델링하는 데 주목받고 있다. 전통적인 유클리드 임베딩은 노드 간 거리와 관계를 평면 혹은 저차원 유클리드 공간에 투사함으로써 트리 구조나 스케일‑프리 네트워크와 같은 고차원적 계층성을 충분히 표현하지 못한다. 반면, 하이퍼볼릭 공간은 지수적으로 확장되는 볼륨 특성을 가지고 있어, 동일한 차원 내에서 더 많은 노드를 구분할 수 있다. 이러한 특성은 특히 이상 탐지와 같이 정상 패턴과 비정상 패턴 사이의 미세한 차이를 포착해야 하는 작업에 유리하다. 본 논문에서는

Detection
학습 역학을 위한 다층 형식 기술 프레임워크

학습 역학을 위한 다층 형식 기술 프레임워크

이 논문이 제시하는 다층 형식 기술 프레임워크는 학습 과정을 ‘기술’한다는 점에서 기존의 ‘예측·최적화’ 중심 모델과 근본적으로 차별화된다. 학습은 단순히 성과를 높이는 목표 함수의 최소화가 아니라, 학습자 내부의 상태가 외부 자극과 어떻게 상호작용하면서 변형되는가에 대한 서술적 이해가 필요하다. 이를 위해 저자는 학습을 네 개의 기능적 층—부하 생성층, 내부 변환층, 관찰·측정층, 평가·조절층—으로 분리하고, 각 층이 담당하는 책임을 명확히 정의한다. 첫 번째 부하 생성층은 외부 과제·자료가 학습자에게 제공될 때 발생하는 인지 부

Learning System
빅데이터 교육 실습 종합 보고서

빅데이터 교육 실습 종합 보고서

종합 분석: 빅데이터 교육 실습 보고서 1. 연구 개요와 방법론 본 연구는 빅데이터 프로젝트의 통합적 접근 방식을 취하며, 세 가지 사례를 통해 다양한 데이터 유형과 규모에 대한 분석 기법을 다룹니다. Epsilon 데이터셋 : 이진 분류 문제를 해결하기 위해 MLP 모델을 사용하여 2000개의 특징과 100,000개의 인스턴스로 훈련되었습니다. PyTorch와 GPU 가속(CUDA)을 활용해 88.98%의 정확도를 달성했습니다. Rest Mex 데이터셋 : 멕시코 관광 리뷰 데이터셋에 대해 감정 분석 파이프라인을 구현하였습니다.

Data Learning
독일 최고법원 보도자료 생성 데이터셋과 LLM 벤치마크

독일 최고법원 보도자료 생성 데이터셋과 LLM 벤치마크

본 논문은 법률 분야에서 일반 대중에게 판결을 전달하는 ‘보도자료’라는 특수한 텍스트 장르에 초점을 맞춘 최초의 대규모 데이터셋과 벤치마크를 제시한다는 점에서 학술적·실용적 의의가 크다. 기존 NLP 연구는 주로 판결문 자체의 구조적 요약이나 법률용어 추출 등에 머물렀으며, 시민이 이해하기 쉬운 형태의 커뮤니케이션을 다루지는 않았다. 따라서 CourtPressGER은 ‘판결문‑보도자료‑프롬프트’라는 삼중 트리플 구조를 통해, 원문과 인간이 만든 요약(보도자료) 사이의 정밀한 정렬을 제공한다. 이는 LLM이 단순히 요약을 넘어, 법적

Data
신뢰성은 설계다 에이전트형 AI의 구조적 원칙

신뢰성은 설계다 에이전트형 AI의 구조적 원칙

이 논문이 제시하는 핵심 논지는 “신뢰성은 모델 자체가 아니라 시스템의 구조에 달려 있다”는 점이다. 에이전트형 AI를 단순히 대규모 언어 모델이나 이미지 생성 모델의 집합으로 보는 관점에서 벗어나, 목표‑관리자, 플래너, 도구‑라우터, 실행기, 메모리, 검증기, 안전‑모니터, 텔레메트리 등으로 명확히 구분된 모듈들로 구성된 ‘아키텍처’를 강조한다. 각 모듈은 스키마‑제한 인터페이스 를 통해서만 통신하도록 설계되며, 이는 입력·출력 형식이 사전에 정의된 JSON 스키마 등으로 검증됨을 의미한다. 이렇게 하면 모델이 예기치 않은 형태

메타계층 강화학습을 이용한 O RAN 자원 관리와 네트워크 슬라이싱 최적화

메타계층 강화학습을 이용한 O RAN 자원 관리와 네트워크 슬라이싱 최적화

본 논문은 O‑RAN 환경에서 자원 할당과 네트워크 슬라이싱을 동시에 최적화하기 위한 새로운 학습 프레임워크를 제시한다는 점에서 학술적·실무적 의의가 크다. 첫 번째로, 기존 메타‑강화학습(Meta‑RL) 연구들은 주로 단일 레벨 정책을 학습하는 데 그쳤으며, 복잡한 O‑RAN 시스템처럼 다중 계층의 의사결정 구조를 반영하지 못했다. 저자는 이를 보완하기 위해 고수준 ‘자원 할당 컨트롤러’와 저수준 ‘슬라이스 내부 스케줄러’라는 두 개의 에이전트를 계층적으로 배치하고, 각각이 독립적인 강화학습 과정을 수행하도록 설계하였다. 이러한

Learning
인간 중심 공정성 프레임워크로 보는 AI 공정성 다중 목표 최적화

인간 중심 공정성 프레임워크로 보는 AI 공정성 다중 목표 최적화

본 논문은 AI 시스템의 공정성을 다루는 기존 연구들의 한계를 정확히 짚어낸다. 현재까지 대부분의 연구는 하나의 공정성 지표—예를 들어 그룹 공정성 혹은 개별 공정성—에 초점을 맞추어 해당 지표를 최적화하려는 접근을 취했다. 그러나 실제 사회적·법적 맥락에서는 여러 공정성 개념이 동시에 충돌하고, 이해관계자마다 중시하는 가치가 다르다. 예를 들어 사법 분야에서는 ‘동등 기회(EOP)’와 ‘결과 평등’ 사이에 뚜렷한 긴장이 존재하고, 의료 분야에서는 환자 그룹 간의 접근성 차이를 최소화하려는 동시에 치료 효율성을 유지해야 하는 복합적

Framework
다중프랙탈 비정상 시계열의 차원별 상관행렬 스펙트럼 분석 및 암호화폐 시장 적용

다중프랙탈 비정상 시계열의 차원별 상관행렬 스펙트럼 분석 및 암호화폐 시장 적용

본 논문은 복잡계 분석에서 흔히 마주치는 세 가지 핵심 난제—비정상성, 장기 의존성(롱 메모리), 그리고 헤비테일 분포—를 동시에 고려한 새로운 상관행렬 구축 방법을 제시한다는 점에서 학문적 의의가 크다. 기존의 공분산 행렬은 평균과 분산을 전제로 하여 비정상적인 트렌드나 비선형 변동을 제대로 포착하지 못한다. 저자들은 다중프랙탈 비정상 교차상관계수 ρ r을 도입함으로써, 시계열을 다중스케일로 분해하고 각 스케일에서 특정 진폭 범위의 변동만을 강조하도록 설계하였다. 여기서 r은 변동의 크기를 조절하는 차수 매개변수로, r > 0이면

인공지능의 약한 의지와 아크라시아 벤치마크: 일관성 붕괴와 목표 전이 분석

인공지능의 약한 의지와 아크라시아 벤치마크: 일관성 붕괴와 목표 전이 분석

분석 요약 1. 논문 주제 및 목표: 본 논문은 인공지능(AI) 시스템의 안전성과 관련된 문제를 다룹니다. 특히, '아크라시아'라는 개념을 통해 AI의 일관성 붕괴와 목표 전이를 분석합니다. 아크라시아는 고대 철학에서 인간의 판단과 충동 사이의 갈등을 설명하는 용어로, 이 논문에서는 이를 AI 맥락에 적용하여 모델이 글로벌 지식과 로컬 컨텍스트 사이에서 일관성을 유지하지 못할 때 발생하는 문제를 탐구합니다. 2. 아크라시아 벤치마크의 개발: 논문은 '아크라시아 벤치마크'라는 새로운 평가 방법을 제안합니다. 이 벤치마크는 모델이 글로

System
자동항체 언어 모델 pIgGen의 생성 조절을 위한 TopK 및 Ordered 희소 오토인코더 분석

자동항체 언어 모델 pIgGen의 생성 조절을 위한 TopK 및 Ordered 희소 오토인코더 분석

본 논문은 단백질 언어 모델, 특히 항체 서열을 생성하도록 설계된 pIgGen에 대한 메커니즘적 해석을 목표로 한다. 이를 위해 두 종류의 희소 오토인코더, 즉 TopK SAE와 Ordered SAE를 도입하였다. TopK SAE는 각 레이어에서 가장 큰 K개의 활성값만을 보존함으로써 희소성을 강제하고, 이를 통해 잠재 공간의 개별 차원이 특정 생물학적 특성과 강하게 연관되는지를 탐색한다. 실험에서는 특정 뉴런(또는 뉴런 집합)이 항체의 CDR(Complementarity Determining Region) 길이, 친화도, 혹은 특

Model
진화적 추론 최적화 약한 대형 언어 모델의 시스템2 능력 향상

진화적 추론 최적화 약한 대형 언어 모델의 시스템2 능력 향상

본 논문은 현재 대형 언어 모델이 보여주는 “특정 작업에 대한 뛰어난 성능”과 “일반적인 지능, 특히 시스템 2와 연관된 느린 사고 능력” 사이의 격차를 명확히 짚어낸다. 시스템 2는 인간이 복잡한 논리적 문제를 해결할 때 의식적으로 수행하는 고차원적 사고 과정을 의미한다. 기존 LLM은 대규모 데이터에 기반한 패턴 학습을 통해 빠른 시스템 1 스타일의 응답을 제공하지만, 논리적 일관성이나 다단계 추론이 요구되는 상황에서는 오류가 빈번히 발생한다. 이러한 한계를 극복하기 위해 저자들은 진화론적 메커니즘을 차용한 ERO 프레임워크를

System
문화 지능과 가치 추론 품질 벤치마크: 미국 흑인 커뮤니티를 위한 CIVIQ 개발

문화 지능과 가치 추론 품질 벤치마크: 미국 흑인 커뮤니티를 위한 CIVIQ 개발

이 논문은 현재 AI·LLM 분야에서 급부상하고 있는 문화적 편향 문제를 실질적으로 해결하려는 시도로서 의미가 크다. 기존의 대부분 LLM은 대규모 인터넷 텍스트를 기반으로 학습되기 때문에 서구 중심의 언어·문화적 서술이 과다하게 반영된다. 결과적으로 비서구·소수자 집단이 겪는 경험이나 가치관이 제대로 반영되지 않아, 이들 집단이 LLM을 활용할 때 오해·불쾌감을 유발하거나, 중요한 의사결정에서 부정확한 정보를 제공할 위험이 있다. 이러한 문제를 인식하고 ‘문화‑인식’ LLM을 개발하려는 움직임은 필수적이며, 특히 ChatBlack

멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

멀티모달 기반 모델을 활용한 해상예보 자동 텍스트 생성

본 연구는 최근 급부상하고 있는 멀티모달 기초 모델, 특히 비전‑언어 모델(Vision‑Language Model, VLM)의 기상 분야 적용 가능성을 최초로 시도한 사례라 할 수 있다. 전통적인 해상예보는 기상 관측값(위성, 레이더, 관측소 등)을 인간 기상학자가 해석하고, 정형화된 텍스트 형식으로 재작성하는 복합적인 워크플로우를 요구한다. 이러한 과정은 높은 인적 비용과 시간 지연을 초래하며, 특히 급변하는 기상 상황에 대한 실시간 대응력을 저해한다. 연구팀은 먼저 격자형 기상 데이터를 시간‑공간 차원을 포함한 비디오 시퀀스로

Model
3D 공간 언어 이해를 위한 지시 기반 마스킹 전략

3D 공간 언어 이해를 위한 지시 기반 마스킹 전략

본 논문은 3D 장면‑언어 멀티모달 모델에서 디코더의 어텐션 마스크가 성능에 미치는 영향을 심도 있게 탐구한다는 점에서 큰 의의를 가진다. 기존의 LLM 기반 3D 추론 방법들은 자연어 처리에서 검증된 인과적(causal) 마스크를 그대로 차용했는데, 이는 텍스트가 순차적 구조를 갖는다는 전제에 기반한다. 그러나 3D 객체는 공간적 위치와 관계에 의해 정의되며, 객체 간 순서는 의미가 없거나 오히려 방해가 될 수 있다. 인과 마스크는 이러한 순서‑무관성을 무시하고, 객체 토큰이 이전 토큰에만 의존하도록 강제함으로써 공간적 상호작용을

LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

LLM 기반 자연어‑논리 변환 및 CNF 생성 프레임워크

본 논문은 자연어‑논리 변환 작업에서 LLM의 환각 문제를 완화하기 위한 실용적인 접근법을 제시한다는 점에서 의미가 크다. 첫째, 저자는 “자연어 → 논리식 → CNF”라는 3단계 파이프라인을 명확히 정의하고, 각 단계에서 발생할 수 있는 오류 원인을 분석한다. 특히, 논리식 생성 단계에서 LLM이 문맥을 오해하거나 논리 연산자를 잘못 선택하는 경우가 빈번히 발생한다는 점을 지적하고, 이를 자체 정의 문법으로 제한함으로써 모델이 허용된 구조 내에서만 출력을 생성하도록 강제한다. 이러한 문법 기반 필터링은 기존의 후처리 방식보다 사전

Model
깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

깊이 일반화 한계와 재귀 문제 해결을 위한 루프형 위치찾기와 교체 파이프라인

본 논문은 현재 가장 널리 사용되는 트랜스포머 기반 대형 언어 모델(Large Language Model, LLM)이 “깊이 일반화(depth generalization)”라는 중요한 차원에서 한계를 보인다는 점을 명확히 규명한다. 기존 연구는 주로 시퀀스 길이가 훈련 데이터보다 길어질 때 모델이 어떻게 일반화되는지를 탐구했으며, 이를 “길이 일반화”라고 부른다. 그러나 실제 자연어와 수학·논리 문제에서는 단순히 시퀀스가 길어지는 것이 아니라, 괄호·연산자·논리 연산자의 중첩 구조가 깊어지는 경우가 빈번하다. 이러한 중첩 구조는 스

Model
고밀도 레이스트랙 메모리를 위한 압축 기반 다중비트 오류 정정 기법

고밀도 레이스트랙 메모리를 위한 압축 기반 다중비트 오류 정정 기법

본 연구는 차세대 고밀도 비휘발성 메모리인 레이스트랙 메모리(RTM)의 신뢰성 문제를 근본적으로 해결하고자 하는 시도이다. RTM은 전통적인 SRAM에 비해 10배 이상 높은 집적도를 제공하면서도 읽기·쓰기 지연이 짧아 캐시 메모리 교체 후보로 적합하지만, 전류 흐름을 제어하기 위한 도메인 이동 과정에서 발생하는 스토캐스틱한 오류와 데이터 셔플링 오류가 다중 비트 오류를 초래한다. 이러한 오류는 기존의 단일 비트 ECC(예: SEC)나 2비트 정정 ECC(예: DECTED)로는 충분히 방어할 수 없으며, 다중 비트 정정을 위해서는

Data
법률 AI의 환각 방지를 위한 그래프 기반 정합성 평가 프레임워크

법률 AI의 환각 방지를 위한 그래프 기반 정합성 평가 프레임워크

본 논문은 법률 분야에서 인공지능 기반 자동 문서 생성이 직면한 가장 핵심적인 문제인 ‘환각(hallucination)’을 그래프 이론을 활용해 체계적으로 해결하려는 시도다. 기존의 환각 탐지 방법은 주로 텍스트 간 의미 유사도를 계산하는 방식에 의존한다. 이러한 접근법은 문맥상 유사해 보이지만 실제로는 중요한 엔터티(예: 당사자명, 사건 일자, 조항 번호)가 잘못 교체되거나 누락되는 경우를 포착하지 못한다. 법률 문서는 작은 엔터티의 변형만으로도 판결 결과에 큰 영향을 미칠 수 있기 때문에, 보다 정밀하고 해석 가능한 검증 메커니

Detection System
세계 정합성을 위한 강화학습과 그라운드 제어

세계 정합성을 위한 강화학습과 그라운드 제어

본 논문이 제시하는 “Reinforcement Learning with World Grounding”(RLWG) 접근법은 기존 비디오 기반 세계 모델이 겪는 기하학적 불일치 문제를 근본적으로 해결하려는 시도이다. 전통적인 비디오 세계 모델은 주로 프레임‑간 재구성 손실을 최소화함으로써 학습되는데, 이러한 손실은 시각적 일관성은 확보하지만 물리적·기하학적 제약을 충분히 반영하지 못한다. 결과적으로 모델이 생성한 가상 환경은 인간이 직관적으로 인식하는 물리 법칙과 어긋나는 경우가 빈번하다. RLWG는 이러한 한계를 극복하기 위해 두 가

Model
신경연산자를 활용한 초대질량 블랙홀 서브그리드 모델링

신경연산자를 활용한 초대질량 블랙홀 서브그리드 모델링

초대질량 블랙홀(SMBH)과 그 숙주 은하의 공동 진화는 현대 천체물리학에서 가장 난제 중 하나이다. 물리적 과정이 블랙홀 주변의 밀리파섹 규모에서 은하 전체의 메가파섹 규모에 이르기까지 10⁹배에 달하는 거리와 시간 스케일을 포괄한다는 점에서, 전통적인 첫 원리 시뮬레이션은 계산 자원 한계로 인해 실현 불가능하다. 따라서 연구자들은 ‘서브그리드’ 접근법을 사용해 미세 스케일의 물리학을 거시 스케일 시뮬레이션에 삽입한다. 기존 서브그리드 모델은 보통 고정된 효율 파라미터(예: Eddington 제한, α 디스크 모델)나 이론적 추정

Framework
희소 스펙 메모리 효율적인 자기 추측 디코딩

희소 스펙 메모리 효율적인 자기 추측 디코딩

이 논문은 최근 대형 언어 모델이 복잡한 문제를 해결하기 위해 체인‑오브‑쓰루(Chain‑of‑Thought)와 같은 긴 추론 과정을 거칠 때, 메모리 대역폭이 주요 병목으로 작용한다는 점을 정확히 짚어낸다. 전통적인 디코딩 방식에서는 매 토큰마다 KV‑Cache에 저장된 모든 이전 토큰에 대해 완전 어텐션을 수행한다. 토큰 수가 늘어날수록 KV‑Cache의 크기도 선형적으로 증가하고, 이에 따라 메모리 읽기·쓰기 비용이 급증한다. 특히 GPU 메모리 용량이 제한적인 상황에서 이러한 메모리‑바운드 특성은 실시간 응용에 큰 제약이 된

Model
극심한 비용 비대칭을 극복한 인과 기반 예측 유지보수

극심한 비용 비대칭을 극복한 인과 기반 예측 유지보수

예측 유지보수는 설비 고장을 사전에 감지해 생산 중단을 방지하고, 유지보수 비용을 최소화하려는 핵심 전략이다. 그러나 제조 현장에서는 고장을 놓치는 비용이 오경보(불필요한 정비) 비용보다 수십 배에서 수백 배까지 크게 차이 나는 ‘비용 비대칭’ 현상이 존재한다. 이 비대칭은 단순히 정확도(accuracy)나 AUC와 같은 통계적 지표만으로는 모델의 실제 가치를 평가하기 어렵게 만든다. 예를 들어, 고장 발생률이 3.3%에 불과한 상황에서 99% 정확도를 달성하더라도 오경보가 과다하면 전체 비용이 급증한다. 따라서 비용 기반 목표 함

기계 학습 삭제의 프라이버시 위협과 텔레포테이션 방어: WARP의 실효성 분석

기계 학습 삭제의 프라이버시 위협과 텔레포테이션 방어: WARP의 실효성 분석

기계 학습 모델에서 특정 샘플을 ‘삭제’하는 작업은 실제 서비스 환경에서 개인정보 보호 규정을 준수하기 위해 필수적이다. 전통적인 완전 재학습 방식은 비용이 많이 들고 실시간 서비스에 적용하기 어렵다. 따라서 최근에는 근사 삭제(approximate unlearning) 기법이 활발히 연구되고 있다. 이들 기법은 원본 모델 파라미터를 약간만 조정하거나, 손실 함수에 삭제 대상 샘플을 제외한 형태로 재학습함으로써 빠른 삭제를 목표로 한다. 하지만 본 논문이 지적하듯, 근사 삭제는 두 가지 구조적 특성 때문에 프라이버시 위험을 내포한다

Learning
언어와 보상이 결합된 프롬프트 기반 정책 탐색

언어와 보상이 결합된 프롬프트 기반 정책 탐색

Prompted Policy Search(ProPS)는 기존 강화학습 패러다임에 근본적인 변화를 시도한다. 전통적인 RL 알고리즘은 주로 환경으로부터 얻는 스칼라 보상에 기반해 정책을 업데이트한다. 이 접근법은 수학적으로는 깔끔하지만, 실제 문제에서는 목표 설명, 제약 조건, 인간 전문가의 조언 등 텍스트 형태의 풍부한 메타 정보를 무시한다는 한계가 있다. ProPS는 이러한 한계를 극복하기 위해 대형 언어 모델(LLM)을 정책 최적화의 핵심 엔진으로 활용한다. 구체적으로, 에이전트가 환경에서 얻은 보상과 함께 “목표는 ‘공을 잡아

Learning
동작 편집 기반 비디오 변환: 모션 카운터팩추얼을 활용한 확산 모델

동작 편집 기반 비디오 변환: 모션 카운터팩추얼을 활용한 확산 모델

본 논문은 최근 급격히 발전하고 있는 텍스트‑투‑비디오·이미지‑투‑비디오 생성 모델의 ‘움직임 제어’ 라는 부수적 기능을, ‘정밀 움직임 편집’ 이라는 새로운 관점으로 전환한다는 점에서 학술적·산업적 의의가 크다. 기존 연구는 주로 텍스트 프롬프트에 따라 전반적인 동작을 생성하거나, 이미지에 부착된 포즈를 애니메이션화하는 방식에 머물렀다. 그러나 실제 영상 편집 현장에서는 특정 객체의 경로를 미세하게 수정하거나, 특정 구간에서만 움직임을 바꾸고 싶어하는 요구가 빈번히 발생한다. 이러한 요구를 충족시키기 위해 저자들은 입력 영상으로부

전체 차원 연관성을 활용한 고속 수렴 최적화기 HVAdam

전체 차원 연관성을 활용한 고속 수렴 최적화기 HVAdam

본 연구는 현재 딥러닝 커뮤니티에서 널리 사용되는 적응형 옵티마이저인 Adam·RMSProp이 갖는 근본적인 구조적 한계를 지적한다. 기존 적응형 방법은 1차원(각 파라미터)별로 순간적인 1차·2차 모멘트를 추정해 학습률을 조정한다. 이는 각 파라미터가 독립적으로 움직인다는 전제 하에 설계된 것이며, 실제 고차원 손실 표면에서는 파라미터 간 상관관계가 복잡하게 얽혀 있다. 이러한 상관관계를 무시하면, 예를 들어 손실이 좁은 골짜기 형태로 연속되는 경우 한 차원에서는 급격히 감소하지만 다른 차원에서는 완만히 변하는 상황에서, 개별 학

신뢰 기반 사회 학습으로 촉진되는 자생 커뮤니케이션

신뢰 기반 사회 학습으로 촉진되는 자생 커뮤니케이션

TSLEC 논문은 기존의 다중 에이전트 커뮤니케이션 연구에서 간과되던 ‘사회적 전이’를 체계적으로 모델링한 점이 가장 큰 혁신이다. 기존 접근법은 각 에이전트가 환경 보상만을 이용해 독립적으로 언어를 형성하도록 설계돼, 초기 탐색 단계에서 무수히 많은 비효율적인 신호 조합이 발생한다. 이러한 비효율성은 학습 곡선이 완만하고, 최종 프로토콜이 비구조적이며, 환경 변화에 취약한 단점으로 이어진다. TSLEC은 두 가지 핵심 메커니즘을 도입한다. 첫째, 교사‑학생 메커니즘 을 통해 에이전트가 자신의 성공적인 행동‑신호 매핑을 다른 에이전

Learning
자동화된 추론 공격 전문가 AttackPilot LLM 기반 무인 위험 평가 에이전트

자동화된 추론 공격 전문가 AttackPilot LLM 기반 무인 위험 평가 에이전트

본 연구는 추론 공격(inference attack)이라는 기존 보안 평가 기법에 LLM 기반 자율 에이전트를 결합함으로써, “전문가 수준의 공격 수행을 비전문가에게 제공한다”는 혁신적인 목표를 설정한다. 먼저, 공격 수행에 필요한 단계—목표 모델 식별, 데이터 수집, 공격 전략 선택, 파라미터 튜닝, 결과 해석—를 명시적으로 행동(action)으로 분해하고, 각각을 LLM이 호출할 수 있는 API 형태로 구현하였다. 이러한 작업‑특화 행동 공간은 에이전트가 불필요한 추론을 최소화하고, 토큰 비용을 크게 절감하도록 설계되었다는 점이

다중 LLM을 활용한 유전 알고리즘 기반 자연어 과제 최적화

다중 LLM을 활용한 유전 알고리즘 기반 자연어 과제 최적화

본 논문이 제시하는 MultiGA는 기존 LLM 활용 방식에 중요한 변화를 도입한다. 전통적으로 하나의 사전 학습된 모델을 선택하고, 필요에 따라 파인튜닝하거나 프롬프트 엔지니어링을 적용해 성능을 끌어올리는 것이 일반적이었다. 그러나 파인튜닝은 대규모 데이터와 연산 비용이 요구되며, 프롬프트 설계는 전문가 수준의 노하우가 필요하다. 이에 비해 MultiGA는 “다중 소스 시딩”이라는 아이디어를 통해 여러 LLM의 출력을 동시에 활용한다는 점에서 혁신적이다. 초기 집단을 다양한 모델에서 추출함으로써, 각 모델이 가진 고유한 강점(예:

실시간 도로 상태 모니터링 시스템: 날씨와 이미지 기반의 깊은 학습 접근법

실시간 도로 상태 모니터링 시스템: 날씨와 이미지 기반의 깊은 학습 접근법

본 연구는 실시간 도로 상태 모니터링 시스템의 개발을 목표로 하며, 이를 통해 차량 관리 및 활성 차량 제어 시스템에 필요한 정보를 제공하고자 합니다. 전통적인 방법들이 비용과 시간이 많이 소요되는 반면, 본 연구에서는 날씨 조건 데이터와 도로 표면 상태 데이터를 활용한 새로운 접근법을 제시합니다. 특히, 칼스루에 공과대학교 주변 도로에서 모바일 폰 카메라를 이용해 수집된 이미지 데이터와 가속도 데이터를 통해 다양한 딥러닝 알고리즘의 성능을 비교하였습니다. 본 연구에서는 Alexnet, LeNet, VGG 및 Resnet 등 네 가

Learning
No Image

계속학습에서의 재현성과 공정한 비교를 위한 통합 플랫폼 LibContinual

이 논문은 계속학습(Continual Learning) 분야에서 중요한 문제인 치명적인 잊음을 해결하기 위해 LibContinual이라는 새로운 라이브러리를 제안하고 있습니다. 이 라이브러리는 고결합 저결착 모듈형 아키텍처를 기반으로, 5개의 주요 방법론 카테고리에 걸쳐 19개의 대표적인 알고리즘을 통합하여 제공합니다. 이러한 구조는 다양한 CL 방법들을 비교하고 재현 가능한 연구 환경을 제공하는 데 중요한 역할을 합니다. 논문은 또한 현재 평가에서 일반적으로 발견되는 세 가지 암묵적인 가정(오프라인 데이터 접근 가능성, 제한 없는

Learning
No Image

모듈화 확산 정책 프레임워크: 복잡한 로봇 행동 분포에 대한 효과적인 학습

본 논문은 다중 작업 학습의 복잡성을 해결하기 위해 새로운 접근법을 제시합니다. 로봇 행동 분포는 매우 다양하고, 이로 인해 일관된 모델이 이를 효과적으로 학습하는 데 어려움을 겪습니다. 이러한 문제를 해결하기 위해 논문은 모듈화된 확산 정책 프레임워크를 제안합니다. 이 프레임워크는 복잡한 행동 분포를 여러 개의 특수화된 확산 모델로 분해하여 각각이 특정 하위 모드를 포착하도록 합니다. 이러한 접근법은 각 모듈이 독립적으로 학습하고, 필요에 따라 추가하거나 조정할 수 있어 새로운 작업에 대한 유연한 적응을 가능하게 합니다. 또한,

Learning
터키어 자연어 이해를 위한 종합 벤치마크: TrGLUE와 SentiTurca 소개

터키어 자연어 이해를 위한 종합 벤치마크: TrGLUE와 SentiTurca 소개

이 논문은 터키어 자연어 처리(NLP)의 성능 평가를 위해 필요한 종합적인 벤치마크를 제시하고 있습니다. 특히, TrGLUE와 SentiTurca라는 두 가지 새로운 벤치마크를 소개하며, 이는 터키어 NLU 능력을 평가하는 데 중요한 역할을 합니다. GLUE 벤치마크가 영어 NLU의 성능 평가에 대한 표준을 제공한 것처럼, TrGLUE는 터키어에서도 유사한 기능을 수행합니다. 논문은 다양한 언어별로 개발된 벤치마크를 소개하며, 이러한 벤치마크의 중요성을 강조하고 있습니다. 특히, 터키어에 대한 종합적인 NLU 평가 벤치마크가 부재한

Analysis
S&P 500 주가 예측을 위한 다변량 데이터와 컨볼루션 신경망의 활용

S&P 500 주가 예측을 위한 다변량 데이터와 컨볼루션 신경망의 활용

이 논문은 S&P 500 지수를 구성하는 주식의 움직임을 예측하는데 초점을 맞추고 있다. 과거에는 다양한 방법론을 사용하여 주가 예측에 대한 많은 접근법들이 시장에서 알고리즘 거래와 알파 생성 시스템에 활용되어 왔다. 최근 인공 신경망의 성공은 기계 학습과 딥러닝 분야의 최신 연구를 통해 예측을 가능하게 하는 길을 열었다. 이 논문에서는 실세계 시장 데이터에서 발생하는 주식 분할/배당 이벤트를 포함한 다변량 원시 데이터를 사용하여, 이미지 분류에 가장 잘 알려진 도구인 컨볼루션 신경망(CNN)을 적용하고 있다. 이러한 접근법은 각각

의료 AI의 진단 능력: 현실과 간극

의료 AI의 진단 능력: 현실과 간극

이 논문은 의료 분야에서 인공 지능(AI)의 실제 성능을 평가하는 중요한 연구를 제공한다. 특히, 이 연구는 AI 모델들이 실제 임상 상황에서 얼마나 효과적으로 작동하는지에 대한 깊이 있는 통찰력을 제공한다. B&J 벤치마크는 의료 분야에서 AI의 성능을 종합적으로 평가하기 위한 체계적인 접근법을 제시하며, 이는 기존의 단순한 선택지 문제를 넘어 실제 환자 치료에 필요한 다양한 추론 능력을 평가한다. 연구 결과는 AI 모델들이 구조화된 질문에서는 높은 성능을 보이지만, 실제 임상 상황에서 요구되는 복잡하고 다중모달적인 추론에는 아직

Model
언어모델의 추론능력 향상: 잘못된 최종답안에도 불구하고 합성 데이터를 통한 개선

언어모델의 추론능력 향상: 잘못된 최종답안에도 불구하고 합성 데이터를 통한 개선

이 논문은 언어 모델의 추론 능력을 향상시키는 새로운 접근법을 제시합니다. 핵심 아이디어는 더 우수한 모델에서 생성된 사슬형 사고(CoT) 추적을 사용하여 합성 데이터셋을 만들어 이를 통해 학습하는 것입니다. 이 방법의 놀라운 점은 이러한 CoT 추적이 잘못된 최종 답안으로 이어진다 하더라도, 언어 모델의 성능이 향상된다는 것입니다. 논문에서는 두 가지 주요 가설을 제시합니다: 첫째, 합성 데이터의 분포가 언어 모델 자체의 분포와 더 가깝기 때문에 학습이 용이하다는 점입니다. 이를 검증하기 위해 인간 주석 추적을 문장 변환하여 분포

자연어 설명 기반 이미지 검색 경량 두 단계 시스템

자연어 설명 기반 이미지 검색 경량 두 단계 시스템

분석 요약 1. 논문의 주요 내용 및 목적: 이 논문은 자연어 설명을 기반으로 이미지를 검색하는 경량 두 단계 파이프라인 시스템을 제안하고 있습니다. 이 시스템은 실제 세계 캡션에서 시간적, 문맥적 신호를 포함한 복잡한 정보를 처리할 수 있도록 설계되었습니다. 2. 배경 및 동기: 응용 분야 : 이미지 검색은 웹 검색, 뉴스 아카이브, 전자상거래 등 다양한 분야에서 중요한 역할을 합니다. 문제점 : 기존 모델들은 짧은 캡션에 최적화되어 있어 복잡한 실제 세계 쿼리 처리 능력이 부족합니다. 이로 인해 뉴스나 이벤트 검색과 같은 도메인

No Image

컨텍스트 밴딧으로 최적화하는 Raft 타임아웃 적응 메커니즘 BALLAST

이 논문은 Raft 합의 프로토콜에서 가장 흔히 사용되는 무작위 선출 타임아웃이 장기 지연(long‑tail latency)이나 네트워크 파티션 복구 시에 발생하는 “분할 투표(split vote)” 현상으로 인해 시스템 가용성이 급격히 저하되는 문제점을 정확히 짚어낸다. 기존 연구들은 타임아웃 값을 고정하거나 단순히 평균 지연에 기반한 조정 방식을 제안했지만, 이러한 접근법은 네트워크 상태가 급변하거나 비정상적인 지연 분포가 나타날 때 적응성이 부족하다. BALLAST는 이러한 한계를 극복하기 위해 ‘컨텍스트 밴딧(contextu

Learning
클래스 프로토타입 기반 세그멘테이션 비전 트랜스포머를 활용한 고해상도 식물 이미지 다중 라벨 식별

클래스 프로토타입 기반 세그멘테이션 비전 트랜스포머를 활용한 고해상도 식물 이미지 다중 라벨 식별

이 연구는 PlantCLEF 2025라는 대규모 식물 이미지 인식 대회에서 고해상도 플롯 이미지의 다중 라벨 식별이라는 어려운 과제를 해결하기 위해 두 가지 핵심 아이디어를 결합하였다. 첫 번째는 클래스 프로토타입 을 활용한 지도 학습이다. 기존의 다중 클래스 분류와 달리, 여기서는 훈련 데이터에서 각 종마다 대표적인 특징 벡터(프로토타입)를 K‑Means 군집화로 추출한다. K값을 클래스 수와 동일하게 설정함으로써, 각 군집 중심이 곧 해당 종을 대표하도록 설계하였다. 이러한 프로토타입은 테스트 이미지에 대한 세그멘테이션 모델이

신호 SGN++: 에너지 효율적인 동작 인식을 위한 위상 인식 스팽킹 그래프 프레임워크

신호 SGN++: 에너지 효율적인 동작 인식을 위한 위상 인식 스팽킹 그래프 프레임워크

이 논문은 신호 SGN++라는 새로운 프레임워크를 제안하여 그래프 컨볼루션 네트워크(GCNs)와 스팽킹 신경망(SNNs)의 장점을 결합하고자 합니다. GCNs는 관절 구조를 효과적으로 모델링할 수 있지만, 실수 계산에 따른 에너지 소비가 높은 반면, SNNs는 에너지 효율적이지만 인간 동작의 복잡한 시간 주파수 및 위상 의존성을 포착하는 데 한계가 있습니다. 신호 SGN++은 이러한 문제를 해결하기 위해 1D Spiking Graph Convolution(1D SGC)과 Frequency Spiking Convolution(FSC)

Network
시간을 꿈꾸는 로봇 조작을 위한 행동조건 세계모델

시간을 꿈꾸는 로봇 조작을 위한 행동조건 세계모델

ChronoDreamer는 로봇 매니퓰레이션 분야에서 가장 난해한 문제 중 하나인 ‘접촉 예측’을 시각‑언어‑물리 통합 프레임워크로 풀어낸 점이 혁신적이다. 기존 세계 모델은 주로 이미지와 관절 상태만을 이용해 미래 프레임을 예측했지만, 접촉 정보가 결여돼 실제 물리적 상호작용을 안전하게 계획하기 어려웠다. 본 연구는 접촉을 ‘깊이 가중 가우시안 스플랫’이라는 2D 이미지 형태로 변환함으로써, 기존 비전 백본(ViT 등)과 자연스럽게 결합한다. 이 방식은 3D 힘 벡터를 카메라 좌표계에 투사해 시각적 특징과 동시 학습이 가능하도록

Model
3D 재조명 가능한 PBR 재질 생성 위한 2D 확산 모델 기반 매터리얼 스프레이

3D 재조명 가능한 PBR 재질 생성 위한 2D 확산 모델 기반 매터리얼 스프레이

MatSpray는 최근 급부상한 2차원 확산 모델의 풍부한 재질 표현 능력을 3차원 가우시안 스플래팅 파이프라인에 접목함으로써, 기존 3D 재구성 방법이 직면하던 물리 기반 렌더링(PBR) 재질의 정확도와 일관성 문제를 효과적으로 해결한다. 첫 단계에서는 다중 시점 이미지로부터 각 시점마다 베이스 컬러, 러프니스, 메탈릭과 같은 PBR 파라미터를 추출한다. 여기서 중요한 점은 ‘any 2D diffusion‑based material model’을 사용할 수 있다는 점이다. 즉, Stable Diffusion, Imagen 등 최신

건조기후의 영향 예측: 머신러닝을 활용한 신속 대응 시스템 개발

건조기후의 영향 예측: 머신러닝을 활용한 신속 대응 시스템 개발

본 논문은 최근 증가하는 건조의 심각성과 빈도에 대응하기 위해 머신러닝 기법을 활용한 건조 영향 예측 모델 개발에 초점을 맞추고 있습니다. 특히, Drought Severity and Coverage Index (DSCI)와 Evaporative Stress Index (ESI)를 사용하여 건조의 영향을 예측하고자 하였습니다. 연구는 2005년부터 2024년까지의 데이터를 활용하였으며, Fire와 Relief 영역에서 가장 높은 예측 정확도를 보였고, Agriculture와 Water 분야에서는 그 다음으로 높은 정확도가 나타났습니

Learning
대규모 언어 모델을 활용한 가상 환자 시뮬레이션 교육적 정확성과 피드백 제공을 위한 에이전트 기반 프레임워크

대규모 언어 모델을 활용한 가상 환자 시뮬레이션 교육적 정확성과 피드백 제공을 위한 에이전트 기반 프레임워크

본 연구는 의료 교육 분야에서 가상 환자 시뮬레이션(VSP)의 실용성을 크게 향상시킬 수 있는 새로운 패러다임을 제시한다. 기존 VSP는 실제 환자를 대체하기 위해 고도로 정교한 시나리오와 피드백을 제공해야 함에도 불구하고, 인력·시간·비용 측면에서 한계가 있었다. 특히, 의료 정확성 부족과 역할 연기의 일관성 결여는 학습 효과를 저해하는 주요 요인으로 지적되어 왔다. 이 논문이 제안하는 ‘에이전트 기반 프레임워크’는 세 가지 핵심 모듈을 명확히 분리한다. 첫째, 구성 가능한 증거 기반 사례 생성 모듈은 최신 임상 가이드라인과 데이

Framework
그래프 이론과 GNN을 활용한 인간의 추상적 사고 모델링

그래프 이론과 GNN을 활용한 인간의 추상적 사고 모델링

이 논문은 인간의 추상적 사고와 문제 해결 능력에 초점을 맞추며, 이를 가능하게 하는 귀납적 편향성의 계산적 구조와 신경학적 구현을 탐구하고 있습니다. 연구진은 그래프 이론과 GNN을 결합한 프레임워크를 제시하여 이러한 편향성을 명확히 정식화하고, 이를 통해 인간의 추론 과정을 더 잘 이해할 수 있는 방법을 제공합니다. 특히, 본 논문에서 사용된 데이터셋은 Abstraction and Reasoning Corpus (ARC)에서 적응된 것으로, 이는 인간 행동 데이터를 기반으로 하여 실제 인간의 문제 해결 능력을 반영하고 있습니다.

Network Framework
No Image

대규모 감독 학습을 위한 3D ConvNeXt 백본 MedNeXt 버전2 효율적 표현 학습과 스케일링 전략

본 논문은 최근 의료 영상 분야에서 급부상하고 있는 ‘대규모 감독 사전학습(Supervised Pre‑training)’ 흐름에 중요한 질문을 제기한다. 대부분의 연구가 데이터 양을 늘리는 방향에만 집중한 반면, 실제 모델이 대규모 데이터에서 얼마나 효율적으로 특징을 추출하고 일반화할 수 있는지는 충분히 검증되지 않았다. 저자들은 이러한 공백을 메우기 위해 ConvNeXt라는 최신 2D 비전 백본을 3차원 볼류메트릭 작업에 맞게 재설계하고, 이를 ‘MedNeXt‑v2’라는 이름으로 제시한다. 핵심 기여는 크게 네 가지로 정리할 수

Learning
딥페이크 기술의 도전과 이슬람 윤리적 프레임워크

딥페이크 기술의 도전과 이슬람 윤리적 프레임워크

딥페이크 기술은 AI의 발전으로 인해 급속도로 진보하면서, 정보 조작과 디지털 신분 침해 등에 대한 우려가 증가하였습니다. 이러한 문제는 단순히 기술적 측면을 넘어 윤리적 차원까지 확장되며, 기존의 반응적인 관리 방식만으로 해결하기 어렵습니다. 본 연구에서는 이슬람 윤리 원칙을 바탕으로 딥페이크 기술의 오남용을 예방하고자 합니다. 이를 위해 시스템 리터러처 검토를 통해 2018년부터 2025년 사이에 발표된 주요 출판물을 분석하였습니다. 연구 결과, 이슬람 윤리 원칙인 Maqās . id al Sharī'ah의 h . ifz al

Framework

< 분야별 논문 현황 (Total: 742) >

Electrical Engineering and Systems Science
7
General
273
General Relativity
7
HEP-EX
5
HEP-PH
12
HEP-TH
5
MATH-PH
3
NUCL-TH
1
Quantum Physics
10

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키