Alexander Gurung's picture

Alexander Gurung PRO

agurung

·

alex-gurung

AI & ML interests

None yet

Recent Activity

updated a model 2 days ago

agurung/ncp-qwen25-7b-lengthpenalty

updated a model 3 days ago

agurung/flawed-fictions-qwen3-4b-lengthpenalty-litereason

published a model 4 days ago

agurung/colar-qwen3-4b-ff-sft

View all activity

Organizations

models 73

agurung/ncp-qwen25-7b-lengthpenalty

Reinforcement Learning • 8B • Updated 2 days ago • 218

agurung/flawed-fictions-qwen3-4b-lengthpenalty-litereason

Reinforcement Learning • 4B • Updated 3 days ago • 84

agurung/colar-qwen3-4b-ff-sft

4B • Updated 4 days ago • 23

agurung/colar-qwen3-4b-ff-rl

Reinforcement Learning • 4B • Updated 4 days ago • 14

agurung/flawed-fictions-gemma-3-4b-lengthpenalty

Reinforcement Learning • 4B • Updated 16 days ago • 63

agurung/flawed-fictions-qwen3-4b-lengthpenalty

Reinforcement Learning • 4B • Updated 17 days ago • 61

agurung/qwen3-4b-ff-grpo-lengthpenalty

4B • Updated 17 days ago • 51

agurung/colar-ff-qwen3-4b

4B • Updated 17 days ago • 29

agurung/qwen-coconut-ff-v2

8B • Updated 18 days ago • 9

agurung/flawed-fictions-qwen25-7b-lengthpenalty-litereason

Reinforcement Learning • 8B • Updated 19 days ago • 77

datasets 2

agurung/generalization-eval-data

Preview • Updated 18 days ago • 14

agurung/mc-training-data

Viewer • Updated Jan 20 • 733 • 15