Posts

Here are all published articles, sorted by date in descending order.

820 posts total

17 pages total

Quantifying Memory Use in Reinforcement Learning with Temporal Range

Temporal Range는 강화학습 에이전트가 과거 관측을 얼마나 활용하는지를 정량화하려는 시도에서 출발한다. 기존 연구에서는 정책 네트워크의 구조적 메모리 용량(예: RNN의 hidden size)이나 훈련된 모델의 성능을 통해 간접적으로 추정했지만, 실제 입력‑출력 관계가 어느 시점까지 영향을 미치는지는 명확히 드러나지 않았다. 이 논문은 그런 공백을 메우기 위해 “시간적 영향 프로파일”이라는 개념을 도입한다. 구체적으로, 시점 t 에서 입력 x t 가 이후 시점 s ( t < s ≤ T )의 출력 y s 에 미치는 1차 민감

December 05, 2025

Learning

The Seeds of Scheming: Weakness of Will in the Building Blocks of Agentic Systems

분석 요약 1. 논문 주제 및 목표: 본 논문은 인공지능(AI) 시스템의 안전성과 관련된 문제를 다룹니다. 특히, '아크라시아'라는 개념을 통해 AI의 일관성 붕괴와 목표 전이를 분석합니다. 아크라시아는 고대 철학에서 인간의 판단과 충동 사이의 갈등을 설명하는 용어로, 이 논문에서는 이를 AI 맥락에 적용하여 모델이 글로벌 지식과 로컬 컨텍스트 사이에서 일관성을 유지하지 못할 때 발생하는 문제를 탐구합니다. 2. 아크라시아 벤치마크의 개발: 논문은 '아크라시아 벤치마크'라는 새로운 평가 방법을 제안합니다. 이 벤치마크는 모델이 글로

December 05, 2025

System

Variational Quantum Rainbow Deep Q-Network for Optimizing Resource Allocation Problem

본 논문은 전통적인 심층 강화학습이 직면한 표현력 한계를 양자 컴퓨팅의 고유 특성을 이용해 극복하고자 하는 시도이다. 기존 Rainbow DQN은 Double DQN, Prioritized Experience Replay, Dueling Network, Multi‑step Learning, Distributional RL 등 여섯 가지 개선 기법을 통합해 성능을 끌어올렸다. 그러나 이들 모두는 고전적인 뉴럴 네트워크를 기반으로 하며, 파라미터 수가 급격히 증가하면 학습이 불안정해지고 메모리 요구량이 커지는 문제가 있다. 변분 양자

December 05, 2025

Network

Back to Basics: Motion Representation Matters for Human Motion Generation Using Diffusion Model

본 논문은 최근 급부상하고 있는 인간 동작 합성용 확산 모델의 핵심 설계 요소인 ‘동작 표현 방식’과 ‘손실 함수’를 체계적으로 검증한 점에서 학술적·실용적 의의가 크다. 먼저, 저자는 기존 연구에서 제안된 6가지 대표적인 동작 표현(예: 관절 각도, 관절 위치, 회전 행렬, 쿼터니언, 속도·가속도 기반 표현, 그리고 혼합형 표현)을 동일한 MDM 기반 프레임워크에 적용해 비교하였다. 이때 사용된 평가지표는 흔히 쓰이는 Frechet Inception Distance(FID)와 Diversity Score 등으로, 품질과 다양성을

December 04, 2025

Model

From Kinematics to Interference: Operational Requirements for the Quantum Principle of Relativity

이 논문은 양자역학과 상대성 이론 사이의 오래된 불일치를 새로운 관점에서 접근한다는 점에서 학술적 의미가 크다. 기존의 ‘양자 상대성 원리(QPR)’는 초광속 로렌츠 변환을 허용함으로써, 특수 상대성 이론의 기본 가정인 빛속도 상한을 형식적으로 깨뜨린다. 그러나 저자는 이 변환 자체가 물리적 실재를 의미하지 않으며, 실제 물리학은 실험적 운영 정의에 의해 규정된다고 강조한다. 특히 양자 중첩을 ‘다중 경로’를 그리는 행위가 아니라, 서로 다른 대안이 간섭 고리에서 재결합할 때 나타나는 관측 가능한 위상 차이와 확률 분포로 정의한다는

December 04, 2025

KH-FUNSD: A Hierarchical and Fine-Grained Layout Analysis Dataset for Low-Resource Khmer Business Document

Paper Analysis: KH FUNSD Introduction and Background The paper introduces KH FUNSD , the first publicly available hierarchical dataset for understanding Cambodian business documents. The authors highlight that structured information extraction is crucial for digitizing form like documents, which can

December 04, 2025

Analysis Data

Measuring the Unspoken: A Disentanglement Model and Benchmark for Psychological Analysis in the Wild

본 논문은 인간 대화의 비언어적 단서를 시각‑언어 모델에 통합하려는 시도 중 가장 포괄적인 접근법이라 할 수 있다. 첫 번째 문제인 ‘발화‑감정 모호성’은 입술 움직임이 감정 표현과 겹쳐 보이는 현상으로, 기존 VLM이 텍스트와 이미지 간의 연관성을 학습할 때 이중 의미를 구분하지 못해 심리적 추론에 오류를 일으킨다. MIND는 이러한 모호성을 해결하기 위해 계층적 구조를 채택하고, 각 레이어에서 시간적 특징 분산을 계산해 변동성이 낮은(즉, 감정과 무관한) 입술 패턴을 억제한다. 이 ‘상태 판단’ 모듈은 기존의 단순 attenti

December 04, 2025

Analysis Model

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

본 논문은 지진공학 분야에서 현장별 강진 기록을 인공적으로 생성할 수 있는 새로운 데이터‑드리븐 모델을 제시한다는 점에서 큰 의미를 가진다. 기존의 강진 합성 방법은 주로 스펙트럼 기반 혹은 물리‑기반 시뮬레이션에 의존했으며, 현장 특성을 충분히 반영하기 위해서는 복잡한 파라미터 튜닝이 필요했다. 반면 본 연구는 시간 영역에서 직접 가속도 신호를 다루는 TimesNet‑Gen을 도입함으로써, 현장별 고유의 “잠재적 병목”(latent bottleneck)이라는 작은 차원의 임베딩을 통해 현장 특성을 압축하고 재현한다. 이는 현장마다

December 04, 2025

Learning

Tokenizing Buildings: A Transformer for Layout Synthesis

본 논문은 건축 설계 자동화라는 실용적 과제에 트랜스포머 기반의 시퀀스‑투‑시퀀스 모델을 적용한 점에서 의미가 크다. 기존 연구들은 주로 2D 평면도나 3D 모델을 직접 입력으로 사용하거나, 규칙 기반 시스템에 의존해 레이아웃을 생성하였다. 그러나 이러한 방식은 복잡한 공간 제약을 충분히 반영하기 어렵고, 데이터 요구량이 높으며, 일반화 능력이 제한적이다. SBM은 ‘룸 엔벨로프’라는 최소한의 입력만으로도 방 내부의 가구 배치, 동선, 기능 구역을 동시에 고려한 레이아웃을 생성한다는 점에서 입력 효율성이 뛰어나다. 모델 아키텍처는

December 04, 2025

Towards A Cultural Intelligence and Values Inferences Quality Benchmark for Community Values and Common Knowledge

이 논문은 현재 AI·LLM 분야에서 급부상하고 있는 문화적 편향 문제를 실질적으로 해결하려는 시도로서 의미가 크다. 기존의 대부분 LLM은 대규모 인터넷 텍스트를 기반으로 학습되기 때문에 서구 중심의 언어·문화적 서술이 과다하게 반영된다. 결과적으로 비서구·소수자 집단이 겪는 경험이나 가치관이 제대로 반영되지 않아, 이들 집단이 LLM을 활용할 때 오해·불쾌감을 유발하거나, 중요한 의사결정에서 부정확한 정보를 제공할 위험이 있다. 이러한 문제를 인식하고 ‘문화‑인식’ LLM을 개발하려는 움직임은 필수적이며, 특히 ChatBlack

December 04, 2025

When GenAI Meets Fake News: Understanding Image Cascade Dynamics on Reddit

본 논문은 AI‑생성 이미지와 허위 정보가 소셜 미디어, 특히 Reddit이라는 포럼 기반 플랫폼에서 어떻게 확산되는지를 정량적으로 규명한 최초의 대규모 연구로 평가할 수 있다. 연구자는 이념적 스펙트럼이 넓은 다섯 개 서브레딧을 선정함으로써, 좌파·우파·중도·대안·기술 중심 커뮤니티 등 다양한 정치·사회적 배경을 포괄하였다. 데이터 수집 단계에서는 2022‑2024년 사이에 게시된 1백만 건 이상의 포스트와 그에 연결된 재게시(cascade) 데이터를 크롤링했으며, 각 포스트에 포함된 이미지가 AI‑생성 여부를 판별하기 위해 최신

December 04, 2025

Balancing Safety and Helpfulness in Healthcare AI Assistants through Iterative Preference Alignment

본 논문은 의료 현장에서 LLM 기반 대화형 보조 시스템이 직면한 두 가지 핵심 과제—‘위험한 요청에 대한 과잉 순응’과 ‘무해한 요청에 대한 과잉 거부’를 동시에 해결하고자 하는 시도를 담고 있다. 이를 위해 저자들은 기존 사후 정렬(Post‑Deployment Alignment) 접근법에 Kahneman‑Tversky Optimization(KTO)과 Direct Preference Optimization(DPO)을 결합한 새로운 프레임워크를 설계하였다. KTO는 인간의 인지 편향을 모델링해 위험 신호에 대한 민감도를 조절하고,

December 03, 2025

Educational Cone Model in Embedding Vector Spaces

본 논문은 교육용 텍스트의 난이도 평가에 있어 기존의 단순 통계 기반 접근법이 갖는 한계를 지적하고, 의미론적 임베딩 공간을 활용한 새로운 프레임워크를 제시한다. 현재 자연어 처리 분야에서는 Word2Vec, GloVe, FastText, BERT, RoBERTa 등 수십 가지 임베딩 기법이 존재하며, 각각이 텍스트의 의미적 유사성을 다른 방식으로 포착한다. 그러나 교육 현장에서 요구되는 “난이도”라는 추상적 특성은 단순한 의미 유사도와는 별개의 차원을 가진다. 따라서 어떤 임베딩이 난이도 구분에 가장 적합한지를 사전에 알기 어렵다

December 03, 2025

Model

Learning Single-Image Super-Resolution in the JPEG Compressed Domain

본 논문은 딥러닝 기반 이미지 복원 분야에서 흔히 간과되는 데이터 전처리 단계, 즉 JPEG 디코딩 과정이 전체 파이프라인의 효율성을 크게 저해한다는 점을 정확히 짚어냈다. JPEG 포맷은 이미지 데이터를 8×8 블록 단위의 이산 코사인 변환(DCT) 계수와 양자화 테이블로 압축하는데, 이 과정에서 원본 픽셀값을 복원하기 위해서는 역변환과 역양자화가 필요하다. 이러한 연산은 CPU 중심의 작업으로, GPU 가속이 가능한 딥러닝 연산과는 별도로 수행되며 메모리 대역폭과 I/O 병목을 초래한다. 논문은 이러한 병목을 해소하기 위해, D

December 03, 2025

Learning

NavMapFusion: Diffusion-based Fusion of Navigation Maps for Online Vectorized HD Map Construction

본 논문은 자율주행 차량이 필요로 하는 고정밀 지도(HD 맵)를 실시간으로 생성하기 위한 새로운 접근법을 제시한다. 기존의 HD 맵은 사전 구축된 정적 지도에 의존했으며, 도로 공사, 일시적 차선 변경 등 환경 변화에 즉각적으로 대응하지 못하는 한계가 있었다. 반면, 전 세계적으로 널리 배포되는 표준정밀 지도(SD 맵, 예: OpenStreetMap)는 최신성을 유지하기는 어려우나, 대략적인 도로 구조와 위치 정보를 제공한다는 점에서 유용한 ‘거친 사전(prior)’으로 활용될 수 있다. 논문은 이러한 저해상도 사전을 고해상도 센서

December 03, 2025

SELF: A Robust Singular Value and Eigenvalue Approach for LLM Fingerprinting

SELF 논문은 LLM의 지식재산 보호를 위한 근본적인 접근법을 제시한다는 점에서 의미가 크다. 기존 연구들은 주로 모델의 출력 행동(예: 특정 프롬프트에 대한 응답)이나 구조적 메타데이터(예: 레이어별 파라미터 분포)를 활용해 지문을 생성했으며, 이러한 방식은 공격자가 모델을 미세조정하거나 가중치를 재배열하는 경우 쉽게 회피될 수 있었다. SELF는 이러한 문제점을 해결하기 위해 ‘내재적 가중치 기반’이라는 새로운 패러다임을 도입한다. 구체적으로, 어텐션 메커니즘의 가중치 행렬을 특이값 분해(SVD)와 고유값 분해(EVD)로 분석

December 03, 2025

Text-Printed Image: Bridging the Image-Text Modality Gap for Text-centric Training of Large Vision-Language Models

본 논문은 대형 비전‑언어 모델(LVLM)의 학습 비용을 크게 낮출 수 있는 새로운 데이터 생성 방식을 제시한다는 점에서 의미가 크다. 기존 LVLM은 이미지‑텍스트 쌍을 대규모로 수집해야 하는데, 이는 촬영·저작권·프라이버시 등 여러 제약으로 인해 특히 의료·법률·산업 현장 등 특수 도메인에서 어려움을 겪는다. 반면 텍스트는 웹·논문·보고서 등에서 손쉽게 확보할 수 있으며, 대형 언어 모델(LLM)을 이용해 자동으로 변형·확장할 수 있다. 그러나 텍스트만으로 LVLM을 학습하면 ‘모달리티 격차(modality gap)’가 발생한다

December 03, 2025

Model

The promising potential of vision language models for the generation of textual weather forecasts

본 연구는 최근 급부상하고 있는 멀티모달 기초 모델, 특히 비전‑언어 모델(Vision‑Language Model, VLM)의 기상 분야 적용 가능성을 최초로 시도한 사례라 할 수 있다. 전통적인 해상예보는 기상 관측값(위성, 레이더, 관측소 등)을 인간 기상학자가 해석하고, 정형화된 텍스트 형식으로 재작성하는 복합적인 워크플로우를 요구한다. 이러한 과정은 높은 인적 비용과 시간 지연을 초래하며, 특히 급변하는 기상 상황에 대한 실시간 대응력을 저해한다. 연구팀은 먼저 격자형 기상 데이터를 시간‑공간 차원을 포함한 비디오 시퀀스로

December 03, 2025

Model

Exploring Depth Generalization in Large Language Models for Solving Recursive Logic Tasks

본 논문은 현재 가장 널리 사용되는 트랜스포머 기반 대형 언어 모델(Large Language Model, LLM)이 “깊이 일반화(depth generalization)”라는 중요한 차원에서 한계를 보인다는 점을 명확히 규명한다. 기존 연구는 주로 시퀀스 길이가 훈련 데이터보다 길어질 때 모델이 어떻게 일반화되는지를 탐구했으며, 이를 “길이 일반화”라고 부른다. 그러나 실제 자연어와 수학·논리 문제에서는 단순히 시퀀스가 길어지는 것이 아니라, 괄호·연산자·논리 연산자의 중첩 구조가 깊어지는 경우가 빈번하다. 이러한 중첩 구조는 스

December 02, 2025

Model

Fine-Tuned Large Language Models for Logical Translation: Reducing Hallucinations with Lang2Logic

본 논문은 자연어‑논리 변환 작업에서 LLM의 환각 문제를 완화하기 위한 실용적인 접근법을 제시한다는 점에서 의미가 크다. 첫째, 저자는 “자연어 → 논리식 → CNF”라는 3단계 파이프라인을 명확히 정의하고, 각 단계에서 발생할 수 있는 오류 원인을 분석한다. 특히, 논리식 생성 단계에서 LLM이 문맥을 오해하거나 논리 연산자를 잘못 선택하는 경우가 빈번히 발생한다는 점을 지적하고, 이를 자체 정의 문법으로 제한함으로써 모델이 허용된 구조 내에서만 출력을 생성하도록 강제한다. 이러한 문법 기반 필터링은 기존의 후처리 방식보다 사전

December 02, 2025

Model

From Panel to Pixel: Zoom-In Vision-Language Pretraining from Biomedical Scientific Literature

Panel2Patch는 바이오메디컬 이미지‑텍스트 학습 분야에서 기존의 “그림‑전체” 접근법이 갖는 근본적인 한계를 뛰어넘는다. 전통적인 사전학습 파이프라인은 논문에 실린 복합적인 멀티패널 그림을 하나의 이미지‑캡션 쌍으로 단순화한다. 이 과정에서 각 패널이 전달하는 구체적인 실험 결과, 세포 구조, 혹은 마커 라벨링과 같은 미세한 의미가 손실된다. 임상의나 연구자는 실제 진단·분석 단계에서 특정 영역을 확대해 확인하므로, 이러한 미세 정보가 모델에 반영되지 않으면 실제 활용도는 제한적이다. Panel2Patch는 먼저 그림 레이아

December 02, 2025

Masking Matters: Unlocking the Spatial Reasoning Capabilities of LLMs for 3D Scene-Language Understanding

본 논문은 3D 장면‑언어 멀티모달 모델에서 디코더의 어텐션 마스크가 성능에 미치는 영향을 심도 있게 탐구한다는 점에서 큰 의의를 가진다. 기존의 LLM 기반 3D 추론 방법들은 자연어 처리에서 검증된 인과적(causal) 마스크를 그대로 차용했는데, 이는 텍스트가 순차적 구조를 갖는다는 전제에 기반한다. 그러나 3D 객체는 공간적 위치와 관계에 의해 정의되며, 객체 간 순서는 의미가 없거나 오히려 방해가 될 수 있다. 인과 마스크는 이러한 순서‑무관성을 무시하고, 객체 토큰이 이전 토큰에만 의존하도록 강제함으로써 공간적 상호작용을

December 02, 2025

SPARK: Stepwise Process-Aware Rewards for Reference-Free Reinforcement Learning

본 논문은 강화학습(RL)에서 핵심적인 보상 설계 문제를 새로운 관점에서 해결한다. 전통적인 PRM은 단계별 정답 레퍼런스나 인간 주석에 의존해 학습 데이터를 구축한다. 그러나 이러한 데이터는 비용이 많이 들고, 특히 수학·과학·코드와 같이 정답이 복잡하거나 존재하지 않을 때는 실용성이 떨어진다. SPARK는 이 한계를 “생성‑검증” 루프를 통해 극복한다. 첫 번째 단계에서 생성기 모델은 프롬프트에 따라 다채로운 풀이 경로를 생성한다. 여기서 중요한 점은 다양성을 확보하기 위해 온도 조절, 샘플링 기법 등을 활용해 다수의 후보 풀이

December 02, 2025

Learning

Towards a fully differentiable digital twin for solar cells

본 논문은 태양전지 연구에서 가장 실용적인 목표 중 하나인 연간 에너지 수율(EY) 최적화를 위한 통합 시뮬레이션 프레임워크를 제시한다. 기존의 계산 접근법은 광학, 전기, 열, 재료 과학 등 각각의 분야를 별도로 다루는 경우가 많아, 실제 현장 적용 시 발생하는 복합적인 변수들을 동시에 고려하기 어렵다. 이러한 한계를 극복하기 위해 저자들은 ‘차별 가능한 디지털 트윈(Differentiable Digital Twin)’이라는 개념을 도입하였다. 디지털 트윈은 물리적 시스템을 가상 공간에 정밀히 복제하는 기술이며, 여기서 차별 가능

December 02, 2025

Video4Spatial: Towards Visuospatial Intelligence with Context-Guided Video Generation

VIDEO4SPATIAL은 최근 비디오 기반 인공지능 연구에서 눈에 띄는 전환점을 제공한다. 기존 연구들은 주로 RGB‑D, 포즈 추정, 혹은 3D 메쉬와 같은 다중 모달리티를 결합해 공간 정보를 보강했지만, 이 논문은 순수 비디오 프레임만으로 동일하거나 그 이상의 성능을 달성한다는 점에서 혁신적이다. 핵심은 두 가지 설계 선택에 있다. 첫째, 데이터 큐레이션 단계에서 ‘시공간 일관성’과 ‘다양한 시점 전이’를 강조한 고품질 시퀀스를 선별함으로써 모델이 자연스러운 움직임과 물체 변화를 학습하도록 유도했다. 둘째, 프레임워크 내부에

December 02, 2025

A Low-Cost Reliable Racetrack Cache Based on Data Compression

본 연구는 차세대 고밀도 비휘발성 메모리인 레이스트랙 메모리(RTM)의 신뢰성 문제를 근본적으로 해결하고자 하는 시도이다. RTM은 전통적인 SRAM에 비해 10배 이상 높은 집적도를 제공하면서도 읽기·쓰기 지연이 짧아 캐시 메모리 교체 후보로 적합하지만, 전류 흐름을 제어하기 위한 도메인 이동 과정에서 발생하는 스토캐스틱한 오류와 데이터 셔플링 오류가 다중 비트 오류를 초래한다. 이러한 오류는 기존의 단일 비트 ECC(예: SEC)나 2비트 정정 ECC(예: DECTED)로는 충분히 방어할 수 없으며, 다중 비트 정정을 위해서는

Quantifying Memory Use in Reinforcement Learning with Temporal Range

The Seeds of Scheming: Weakness of Will in the Building Blocks of Agentic Systems

Variational Quantum Rainbow Deep Q-Network for Optimizing Resource Allocation Problem

Back to Basics: Motion Representation Matters for Human Motion Generation Using Diffusion Model

From Kinematics to Interference: Operational Requirements for the Quantum Principle of Relativity

KH-FUNSD: A Hierarchical and Fine-Grained Layout Analysis Dataset for Low-Resource Khmer Business Document

Measuring the Unspoken: A Disentanglement Model and Benchmark for Psychological Analysis in the Wild

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Tokenizing Buildings: A Transformer for Layout Synthesis

Towards A Cultural Intelligence and Values Inferences Quality Benchmark for Community Values and Common Knowledge

When GenAI Meets Fake News: Understanding Image Cascade Dynamics on Reddit

Balancing Safety and Helpfulness in Healthcare AI Assistants through Iterative Preference Alignment

Educational Cone Model in Embedding Vector Spaces

Learning Single-Image Super-Resolution in the JPEG Compressed Domain

NavMapFusion: Diffusion-based Fusion of Navigation Maps for Online Vectorized HD Map Construction

SELF: A Robust Singular Value and Eigenvalue Approach for LLM Fingerprinting

Text-Printed Image: Bridging the Image-Text Modality Gap for Text-centric Training of Large Vision-Language Models

The promising potential of vision language models for the generation of textual weather forecasts

Exploring Depth Generalization in Large Language Models for Solving Recursive Logic Tasks

Fine-Tuned Large Language Models for Logical Translation: Reducing Hallucinations with Lang2Logic

From Panel to Pixel: Zoom-In Vision-Language Pretraining from Biomedical Scientific Literature

Masking Matters: Unlocking the Spatial Reasoning Capabilities of LLMs for 3D Scene-Language Understanding

SPARK: Stepwise Process-Aware Rewards for Reference-Free Reinforcement Learning

Towards a fully differentiable digital twin for solar cells

Video4Spatial: Towards Visuospatial Intelligence with Context-Guided Video Generation

A Low-Cost Reliable Racetrack Cache Based on Data Compression

Accelerating Large-Scale Reasoning Model Inference with Sparse Self-Speculative Decoding

Agentic Policy Optimization via Instruction-Policy Co-Evolution

AI-Enabled grading with near-domain data for scaling feedback with human-level accuracy

An Empirical Study of Agent Developer Practices in AI Agent Frameworks

Community Quality and Influence Maximization: An Empirical Study

Data assimilation and discrepancy modeling with shallow recurrent decoders

fMRI2GES: Co-speech Gesture Reconstruction from fMRI Signal with Dual Brain Decoding Alignment

From Black Hole to Galaxy: Neural Operator: Framework for Accretion and Feedback Dynamics

From monoliths to modules: Decomposing transducers for efficient world modelling

GrndCtrl: Grounding World Models via Self-Supervised Reward Alignment

HalluGraph: Auditable Hallucination Detection for Legal RAG Systems via Knowledge Graph Alignment

InnoGym: Benchmarking the Innovation Potential of AI Agents

IVE: An Accelerator for Single-Server Private Information Retrieval Using Versatile Processing Elements

Spatiotemporal Pyramid Flow Matching for Climate Emulation

Zero-Overhead Introspection for Adaptive Test-Time Compute

A Benchmark of Causal vs Correlation AI for Predictive Maintenance

ChromouVQA: Benchmarking Vision-Language Models under Chromatic Camouflaged Images

IndiMathBench: Autoformalizing Mathematical Reasoning Problems with a Human Touch

Integrating Causal Foundation Model in Prescriptive Maintenance Framework for Optimizing Production Line OEE

Optimizing Text Search: A Novel Pattern Matching Algorithm Based on Ukkonen's Approach

Teleportation-Based Defenses for Privacy in Approximate Machine Unlearning

Polynomial Neural Sheaf Diffusion: A Spectral Filtering Approach on Cellular Sheaves

Hierarchical clustering of complex energy systems using pretopology

Privacy in Federated Learning with Spiking Neural Networks

< Category Statistics (Total: 822) >

Start searching

No results found