In a Training Loop 🔄

16 20 36

Constantin

Alexandre-Numind

https://www.numind.ai/

AI & ML interests

Training AI models @Numind

Recent Activity

upvoted a paper about 23 hours ago

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

upvoted an article 7 days ago

From GRPO to DAPO and GSPO: What, Why, and How

liked a model 15 days ago

Qwen/Qwen3.5-9B

View all activity

Organizations

New activity in Qwen/Qwen3.5-35B-A3B 18 days ago

I would like a recommended training environment setup for the Qwen3.5-MoE model (e.g., Qwen3.5-35B-A3B, model_type: qwen3_5_moe).

👍 1

#16 opened 19 days ago by

444515liuxin

New activity in numind/NuMarkdown-8B-Thinking 7 months ago

fixing numind.svg width

#1 opened 7 months ago by

NathanFradet

New activity in numind/NuExtract-tiny over 1 year ago

Add base_model metadata

#2 opened over 1 year ago by

davanstrien

New activity in numind/NuExtract over 1 year ago

How to provide examples in predict_NuExtract

#2 opened over 1 year ago by

vijayg

New activity in numind/NuExtract-large over 1 year ago

NuExtract-large 7b and NuExtract 3.8B have same size model file

#4 opened over 1 year ago by

mohit0928

Error Sample Code

#2 opened over 1 year ago by

joon09

New activity in microsoft/Phi-3-small-8k-instruct almost 2 years ago

RuntimeError: FlashAttention only support fp16 and bf16 data type during fine tuning.

➕ 👍 7

#11 opened almost 2 years ago by

faizsameerahmed96

New activity in numind/NuNER about 2 years ago

Change to non commercial license

#3 opened about 2 years ago by

saattrupdan

New activity in numind/NuSentiment about 2 years ago

Change to non commercial license

#2 opened about 2 years ago by

saattrupdan

[bot] Conversion to Parquet

#1 opened about 2 years ago by

parquet-converter

New activity in numind/NuNER about 2 years ago

[bot] Conversion to Parquet

#1 opened about 2 years ago by

parquet-converter

Librarian Bot: Add language metadata for dataset

#2 opened about 2 years ago by

librarian-bot

New activity in numind/NuSentiment-multilingual about 2 years ago

Adding `safetensors` variant of this model

#1 opened over 2 years ago by

SFconvertbot

New activity in numind/NuSentiment-multilingual over 2 years ago

Adding `safetensors` variant of this model

#2 opened over 2 years ago by

SFconvertbot

New activity in numind/NuSentiment over 2 years ago

Adding `safetensors` variant of this model

#1 opened over 2 years ago by

SFconvertbot

Constantin

AI & ML interests

Recent Activity

Organizations

Alexandre-Numind's activity

I would like a recommended training environment setup for the Qwen3.5-MoE model (e.g., Qwen3.5-35B-A3B, model_type: qwen3_5_moe).

fixing numind.svg width

Add base_model metadata

How to provide examples in predict_NuExtract

NuExtract-large 7b and NuExtract 3.8B have same size model file

Error Sample Code

RuntimeError: FlashAttention only support fp16 and bf16 data type during fine tuning.

Change to non commercial license

Change to non commercial license

[bot] Conversion to Parquet

[bot] Conversion to Parquet

Librarian Bot: Add language metadata for dataset

Adding `safetensors` variant of this model

Adding `safetensors` variant of this model

Adding `safetensors` variant of this model