Yikun Ban's picture

Yikun Ban

Yikunb

·

AI & ML interests

Reinforcement Learning

Recent Activity

authored a paper 5 days ago

Heterogeneous Agent Collaborative Reinforcement Learning

upvoted a paper 6 days ago

Heterogeneous Agent Collaborative Reinforcement Learning

upvoted a paper 9 days ago

dLLM: Simple Diffusion Language Modeling

View all activity

Organizations

None yet

authored a paper 5 days ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published 8 days ago • 161

authored a paper 16 days ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published about 1 month ago • 261

submitted a paper to Daily Papers 16 days ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published about 1 month ago • 261

authored a paper 29 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published about 1 month ago • 282

submitted a paper to Daily Papers 29 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published about 1 month ago • 282

authored a paper about 1 month ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published Jan 30 • 15

submitted a paper to Daily Papers about 1 month ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published Jan 30 • 15

submitted a paper to Daily Papers about 2 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 157

authored 2 papers about 2 months ago

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Paper • 2505.16270 • Published May 22, 2025 • 7

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 157