Xiang Cheng's picture

3

Xiang Cheng

FFFc2

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 23 hours ago

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

upvoted a collection 2 days ago

authored a paper 9 days ago

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

View all activity

Organizations

None yet

Papers 1

arxiv:2602.10693

models 0

None public yet

datasets 0

None public yet