◆ Daily Papers — May 22, 2026

HUGGINGFACE · AI RESEARCH DIGEST

HUGGINGFACE DAILY PAPERS

오늘 AI 연구자들이 주목한 논문 10편. 강화학습부터 멀티모달, 3D 생성, 과학 예측까지.

Today's Papers

Top Upvotes

10 Papers · 카테고리별 탐색

01 ▲ 182

강화학습

DelTA: 판별적 토큰 크레딧 할당

Discriminative Token Credit Assignment for RL from Verifiable Rewards

검증 가능한 보상 기반 강화학습에서 어떤 토큰이 최종 보상에 기여했는지를 토큰 단위로 세분화하여 학습 효율을 높이는 RLVR 기법.

Cardlnal

02 ▲ 167

벤치마크

TransitLM: 지도 없는 대중교통 경로 생성

A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

지도 정보 없이 자연어 기반으로 대중교통 경로를 생성하는 LLM 벤치마크 및 대규모 데이터셋. 내비게이션·모빌리티 AI의 새 기준.

AMAP-ML · 알리바바 지도

03 ▲ 160

멀티모달

인식인가 편견인가: MLLM의 성격 판단

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

MLLM이 사람의 외모 등 첫인상만으로 성격을 판단하는 편향을 갖는지 분석. AI 윤리·공정성 연구의 핵심 논문.

도쿄대학교

04 ▲ 90

벤치마크

π-Bench: 능동적 AI 에이전트 평가

Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

사용자 명령을 기다리지 않고 능동적으로 행동하는 개인 비서 에이전트를 장기 워크플로우에서 평가하는 벤치마크.

Simplified Reasoning

05 ▲ 83

모델 효율화

풀 어텐션의 귀환: 100스텝 전환

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

희소 어텐션 모델을 100스텝 미만의 파인튜닝으로 풀 어텐션 성능으로 복원. 속도와 품질을 동시에 추구하는 역방향 접근.

RTP-LLM

06 ▲ 56

강화학습

ACC: 에이전트 궤적 장문 학습 데이터화

Compiling Agent Trajectories for Long-Context Training

에이전트가 수행한 행동 궤적을 장문 컨텍스트 학습 데이터로 자동 변환하는 프레임워크. LLM의 장문 추론 능력을 향상.

USTC · 중국과학기술대

07 ▲ 45

3D 생성

PhysX-Omni: 물리 기반 통합 3D 생성

Unified Simulation-Ready Physical 3D Generation for Rigid, Deformable, and Articulated Objects

강체·변형체·관절 객체를 통합 생성하며 즉시 물리 시뮬레이션에 사용 가능. 로보틱스·게임·메타버스 활용.

Ziqi

08 ▲ 37

멀티모달

LatentOmni: 통합 오디오-비주얼 추론

Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning

오디오와 비주얼을 통합된 잠재 공간에서 함께 추론하는 옴니 모달 프레임워크. 차세대 멀티모달 AI 패러다임 제시.

Kling Team

09 ▲ 34

AI × 과학

AI로 과학적 진보를 예측한다

Forecasting Scientific Progress with Artificial Intelligence

AI를 사용해 과학 분야의 미래 연구 방향과 성과를 예측. 논문 인용 패턴과 트렌드로 연구 진보의 궤적을 모델링.

옥스퍼드대학교

10 ▲ 32

모델 효율화

WorldKV: 효율적 월드 메모리 시스템

Efficient World Memory with World Retrieval and Compression

월드 모델의 KV 캐시를 검색과 압축으로 효율화하는 WorldKV 프레임워크. 장기 기억 병목을 해결해 실용화에 기여.

KAIST AI

오늘의 트렌드

4가지 주요 흐름

에이전트 평가 부상

단순 QA를 넘어 장기 워크플로우에서 능동적으로 행동하는 에이전트를 평가하는 프레임워크 연구가 증가하고 있습니다.

π-BenchACC

모델 효율화 지속

어텐션 메커니즘과 메모리 최적화 연구가 꾸준히 발표되며 대형 모델의 실용적 서빙을 향한 노력이 계속됩니다.

Full AttentionWorldKV

멀티모달 편향·공정성

MLLM의 첫인상 편향 연구가 AI 윤리 분야의 핵심 의제로 부상. 공정하고 깊이 있는 인간 이해를 향한 연구가 주목받습니다.

Perception/PrejudiceLatentOmni

물리 기반 3D 즉시 활용

시뮬레이션에 즉시 사용 가능한 물리 속성을 가진 3D 자산 자동 생성. 로보틱스·메타버스·게임 분야 활용 가능성 확대.

PhysX-Omni

분야별 분류

6개 연구 카테고리

강화학습 / 학습 효율

DelTA · ACC

벤치마크 / 평가

TransitLM · π-Bench

모델 아키텍처 / 효율화

Full Attention · WorldKV

멀티모달

Perception · LatentOmni

3D / 시뮬레이션

PhysX-Omni

AI × 과학

Forecasting Scientific Progress