13 9 132

Pritish Mishra

pritish

AI & ML interests

Machine Learning, Computer Vision, NLP, ODML, ML Ops

Recent Activity

liked a model 11 days ago

Qwen/Qwen3.5-397B-A17B

upvoted an article 12 days ago

KV Caching Explained: Optimizing Transformer Inference Efficiency

liked a model 30 days ago

arcee-ai/Trinity-Large-Preview

View all activity

Organizations

None yet

liked a model 11 days ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 4 days ago • 602k • • 1.1k

upvoted an article 12 days ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

Jan 30, 2025

•

233

liked a model 30 days ago

arcee-ai/Trinity-Large-Preview

Text Generation • 399B • Updated 7 days ago • 2k • 151

upvoted an article about 1 month ago

Article

Transformers v5: Simple model definitions powering the AI ecosystem

Dec 1, 2025

•

302

liked 5 models about 1 month ago

liked a model about 2 months ago

LiquidAI/LFM2.5-Audio-1.5B

Audio-to-Audio • Updated Jan 6 • 1.24k • 355

upvoted a collection 2 months ago

NVIDIA Nemotron v3

Collection

Open, Production-ready Enterprise Models • 7 items • Updated 3 days ago • 146

liked 2 models 3 months ago

arcee-ai/Trinity-Mini

Text Generation • Updated Dec 11, 2025 • 3.67k • • 179

nari-labs/Dia2-2B

Text-to-Speech • Updated Dec 1, 2025 • 9.74k • 157

liked 5 models 4 months ago

baidu/ERNIE-4.5-VL-28B-A3B-Thinking

Image-Text-to-Text • 30B • Updated about 14 hours ago • 771 • 522

moonshotai/Kimi-K2-Thinking

Text Generation • Updated 28 days ago • 174k • • 1.67k

unsloth/Qwen3-14B

Updated May 13, 2025 • 18.4k • 16

unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF

31B • Updated Jul 31, 2025 • 59.4k • 294

deepseek-ai/DeepSeek-OCR

Image-Text-to-Text • Updated Nov 4, 2025 • 3.25M • 3.17k

liked 2 models 5 months ago

google/embeddinggemma-300m

Qwen/Qwen3-30B-A3B-Instruct-2507-FP8

Text Generation • 31B • Updated Sep 17, 2025 • 894k • 113

Pritish Mishra

AI & ML interests

Recent Activity

Organizations

pritish's activity

KV Caching Explained: Optimizing Transformer Inference Efficiency

Transformers v5: Simple model definitions powering the AI ecosystem