LOADING PAPERS — 2026.05.22
◆ Daily Papers — May 22, 2026
HUGGINGFACE · AI RESEARCH DIGEST

HUGGINGFACE DAILY PAPERS

오늘 AI 연구자들이 주목한 논문 10편. 강화학습부터 멀티모달, 3D 생성, 과학 예측까지.

0
Today's Papers
0
Top Upvotes
0
Categories
0
Total Upvotes
SCROLL
#1 · 182 UPVOTES · BEST PAPER
DelTA: Discriminative Token Credit Assignment
for Reinforcement Learning from Verifiable Rewards
강화학습에서 어떤 토큰이 최종 보상에 기여했는지를 토큰 단위로 세분화하는 획기적 접근. 기존 RLVR의 비효율적 보상 분배 방식을 극복하고 LLM 학습 효율을 크게 향상시킵니다. 제출자: Cardlnal

10 Papers · 카테고리별 탐색

01 182
강화학습
DelTA: 판별적 토큰 크레딧 할당
Discriminative Token Credit Assignment for RL from Verifiable Rewards
검증 가능한 보상 기반 강화학습에서 어떤 토큰이 최종 보상에 기여했는지를 토큰 단위로 세분화하여 학습 효율을 높이는 RLVR 기법.
Cardlnal
02 167
벤치마크
TransitLM: 지도 없는 대중교통 경로 생성
A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation
지도 정보 없이 자연어 기반으로 대중교통 경로를 생성하는 LLM 벤치마크 및 대규모 데이터셋. 내비게이션·모빌리티 AI의 새 기준.
AMAP-ML · 알리바바 지도
03 160
멀티모달
인식인가 편견인가: MLLM의 성격 판단
Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?
MLLM이 사람의 외모 등 첫인상만으로 성격을 판단하는 편향을 갖는지 분석. AI 윤리·공정성 연구의 핵심 논문.
도쿄대학교
04 90
벤치마크
π-Bench: 능동적 AI 에이전트 평가
Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows
사용자 명령을 기다리지 않고 능동적으로 행동하는 개인 비서 에이전트를 장기 워크플로우에서 평가하는 벤치마크.
Simplified Reasoning
05 83
모델 효율화
풀 어텐션의 귀환: 100스텝 전환
Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps
희소 어텐션 모델을 100스텝 미만의 파인튜닝으로 풀 어텐션 성능으로 복원. 속도와 품질을 동시에 추구하는 역방향 접근.
RTP-LLM
06 56
강화학습
ACC: 에이전트 궤적 장문 학습 데이터화
Compiling Agent Trajectories for Long-Context Training
에이전트가 수행한 행동 궤적을 장문 컨텍스트 학습 데이터로 자동 변환하는 프레임워크. LLM의 장문 추론 능력을 향상.
USTC · 중국과학기술대
07 45
3D 생성
PhysX-Omni: 물리 기반 통합 3D 생성
Unified Simulation-Ready Physical 3D Generation for Rigid, Deformable, and Articulated Objects
강체·변형체·관절 객체를 통합 생성하며 즉시 물리 시뮬레이션에 사용 가능. 로보틱스·게임·메타버스 활용.
Ziqi
08 37
멀티모달
LatentOmni: 통합 오디오-비주얼 추론
Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning
오디오와 비주얼을 통합된 잠재 공간에서 함께 추론하는 옴니 모달 프레임워크. 차세대 멀티모달 AI 패러다임 제시.
Kling Team
09 34
AI × 과학
AI로 과학적 진보를 예측한다
Forecasting Scientific Progress with Artificial Intelligence
AI를 사용해 과학 분야의 미래 연구 방향과 성과를 예측. 논문 인용 패턴과 트렌드로 연구 진보의 궤적을 모델링.
옥스퍼드대학교
10 32
모델 효율화
WorldKV: 효율적 월드 메모리 시스템
Efficient World Memory with World Retrieval and Compression
월드 모델의 KV 캐시를 검색과 압축으로 효율화하는 WorldKV 프레임워크. 장기 기억 병목을 해결해 실용화에 기여.
KAIST AI

4가지 주요 흐름

6개 연구 카테고리

02
강화학습 / 학습 효율
DelTA · ACC
02
벤치마크 / 평가
TransitLM · π-Bench
02
모델 아키텍처 / 효율화
Full Attention · WorldKV
02
멀티모달
Perception · LatentOmni
01
3D / 시뮬레이션
PhysX-Omni
01
AI × 과학
Forecasting Scientific Progress