Fahim Tajwar

ftajwar

https://tajwarfahim.github.io/

AI & ML interests

LLMs, RLHF

Recent Activity

updated a dataset 4 days ago

ftajwar/knights_and_knaves_fraction_reward

published a dataset 4 days ago

ftajwar/knights_and_knaves_fraction_reward

updated a dataset 7 days ago

ftajwar/knights_and_knaves

View all activity

Organizations

Collections 3

View 3 collections

models 6

datasets 24

ftajwar/knights_and_knaves_fraction_reward

Viewer • Updated 4 days ago • 21k • 48

ftajwar/knights_and_knaves

Viewer • Updated 7 days ago • 11k • 19

ftajwar/evaluation_bitwise_arithmetic-2

Viewer • Updated Oct 5, 2025 • 110 • 9

ftajwar/training_bitwise_arithmetic-2

Viewer • Updated Oct 5, 2025 • 20k • 12

ftajwar/evaluation_family_relationships_5

Viewer • Updated Oct 5, 2025 • 100 • 6

ftajwar/evaluation_family_relationships_4

Viewer • Updated Oct 5, 2025 • 100 • 8

ftajwar/training_family_relationships_5

Viewer • Updated Oct 5, 2025 • 20k • 8

ftajwar/training_family_relationships_4

Viewer • Updated Oct 5, 2025 • 20k • 15

ftajwar/evaluation_bitwise_arithmetic-4

Viewer • Updated Oct 5, 2025 • 110 • 9

ftajwar/evaluation_bitwise_arithmetic-3

Viewer • Updated Oct 5, 2025 • 110 • 15

View 24 datasets

Fahim Tajwar

AI & ML interests

Recent Activity

Organizations

Collections 3

ftajwar/qwen3_4B_Base_MaxRL_Polaris_1000_steps

ftajwar/qwen3_4B_Base_GRPO_Polaris_1000_steps

ftajwar/qwen3_1.7B_Base_MaxRL_Polaris_1000_steps

ftajwar/qwen3_1.7B_Base_GRPO_Polaris_1000_steps

ftajwar/paprika_Meta-Llama-3.1-8B-Instruct

ftajwar/paprika_SFT_dataset

ftajwar/paprika_preference_dataset

ftajwar/paprika_Meta-Llama-3.1-8B-Instruct_SFT_only

ftajwar/qwen3_4B_Base_MaxRL_Polaris_1000_steps

ftajwar/qwen3_4B_Base_GRPO_Polaris_1000_steps

ftajwar/qwen3_1.7B_Base_MaxRL_Polaris_1000_steps

ftajwar/qwen3_1.7B_Base_GRPO_Polaris_1000_steps

ftajwar/paprika_Meta-Llama-3.1-8B-Instruct

ftajwar/paprika_SFT_dataset

ftajwar/paprika_preference_dataset

ftajwar/paprika_Meta-Llama-3.1-8B-Instruct_SFT_only

models 6

ftajwar/qwen3_1.7B_Base_GRPO_Polaris_1000_steps

ftajwar/qwen3_1.7B_Base_MaxRL_Polaris_1000_steps

ftajwar/qwen3_4B_Base_GRPO_Polaris_1000_steps

ftajwar/qwen3_4B_Base_MaxRL_Polaris_1000_steps

ftajwar/paprika_Meta-Llama-3.1-8B-Instruct_SFT_only

ftajwar/paprika_Meta-Llama-3.1-8B-Instruct

datasets 24

ftajwar/knights_and_knaves_fraction_reward

ftajwar/knights_and_knaves

ftajwar/evaluation_bitwise_arithmetic-2

ftajwar/training_bitwise_arithmetic-2

ftajwar/evaluation_family_relationships_5

ftajwar/evaluation_family_relationships_4

ftajwar/training_family_relationships_5

ftajwar/training_family_relationships_4

ftajwar/evaluation_bitwise_arithmetic-4

ftajwar/evaluation_bitwise_arithmetic-3

Fahim Tajwar

AI & ML interests

Recent Activity

Organizations

Collections 3

models 6 Sort: Recently updated

datasets 24 Sort: Recently updated

models 6

datasets 24