10 9

E Sanchez

esanchez43

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

liked a model 4 days ago

tencent/HY-Embodied-0.5

liked a dataset 6 days ago

FreedomIntelligence/medical-o1-reasoning-SFT

View all activity

Organizations

None yet

upvoted a paper 2 days ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

Paper • 2604.11626 • Published 5 days ago • 99

liked a model 4 days ago

tencent/HY-Embodied-0.5

Image-Text-to-Text • 4B • Updated 4 days ago • 1.45k • 855

liked a dataset 6 days ago

FreedomIntelligence/medical-o1-reasoning-SFT

Viewer • Updated Apr 22, 2025 • 90.1k • 7.53k • 1.08k

upvoted 2 papers 6 days ago

SkillClaw: Let Skills Evolve Collectively with Agentic Evolver

Paper • 2604.08377 • Published 9 days ago • 277

Faithful GRPO: Improving Visual Spatial Reasoning in Multimodal Language Models via Constrained Policy Optimization

Paper • 2604.08476 • Published 9 days ago • 8

liked a model 9 days ago

openbmb/VoxCPM2

Text-to-Speech • Updated 2 days ago • 35.9k • 1.11k

liked a model 10 days ago

mistralai/Mistral-7B-Instruct-v0.2

Text Generation • 7B • Updated Jul 24, 2025 • 2.12M • • 3.12k

upvoted a paper 10 days ago

GrandCode: Achieving Grandmaster Level in Competitive Programming via Agentic Reinforcement Learning

Paper • 2604.02721 • Published 15 days ago • 361

liked a model 14 days ago

tencent/HY-OmniWeaving

Image-to-Video • Updated 1 day ago • 256

liked a dataset 15 days ago

daaxila/twitter-xiaogualu7-2026.02.21-2025173711356387780-dDiqhFDk36Aa7Pk3-part1

Viewer • Updated 15 days ago • 1 • 76 • 1

upvoted a paper 16 days ago

CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence

Paper • 2603.28032 • Published 19 days ago • 340

liked a dataset 17 days ago

HuggingFaceH4/ultrachat_200k

Viewer • Updated Oct 16, 2024 • 515k • 43.7k • 691

liked a model 17 days ago

Neuralog/GLM-OCR-GGUF

0.9B • Updated 17 days ago • 302 • 1

liked a dataset 25 days ago

OpenMOSS-Team/OmniAction

Updated 22 days ago • 49.4k • 278

upvoted 3 papers about 1 month ago

Demystifing Video Reasoning

Paper • 2603.16870 • Published Mar 17 • 369

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

Paper • 2603.04597 • Published Mar 4 • 210

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 194

upvoted 2 papers about 2 months ago

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Paper • 2602.10693 • Published Feb 11 • 220

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

E Sanchez

AI & ML interests

Recent Activity

Organizations

esanchez43's activity