Ruizhe Li's picture

1 4 1

Ruizhe Li

rzdiversity

·

https://www.ruizhe.space/

AI & ML interests

Mechanistic Interpretability, Multimodal LLMs

Recent Activity

authored a paper about 8 hours ago

Spurious Rewards Paradox: Mechanistically Understanding How RLVR Activates Memorization Shortcuts in LLMs

upvoted a paper about 8 hours ago

Spurious Rewards Paradox: Mechanistically Understanding How RLVR Activates Memorization Shortcuts in LLMs

submitted a paper about 8 hours ago

Spurious Rewards Paradox: Mechanistically Understanding How RLVR Activates Memorization Shortcuts in LLMs

View all activity

Organizations

None yet

Papers 10

arxiv:2601.11061

arxiv:2505.16415

arxiv:2407.21712

arxiv:2406.18259

models 0

None public yet

datasets 0

None public yet