Models

87

Full-text search

Active filters: math-reasoning

jaygala24/Qwen2.5-0.5B-GRPO-math-reasoning

Text Generation • 0.5B • Updated 11 days ago • 582

jaygala24/Qwen2.5-0.5B-GRPO-KL-math-reasoning

Text Generation • 0.5B • Updated 11 days ago • 551

jaygala24/Qwen2.5-1.5B-GRPO-math-reasoning

Text Generation • 2B • Updated 11 days ago • 581

jaygala24/Qwen2.5-1.5B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 11 days ago • 539

jaygala24/Qwen3-1.7B-ReMax-math-reasoning

Text Generation • 2B • Updated 11 days ago • 942

jaygala24/Qwen3-4B-ReMax-math-reasoning

Text Generation • 4B • Updated 11 days ago • 853

jaygala24/Qwen2.5-0.5B-ReMax-math-reasoning

Text Generation • 0.5B • Updated 11 days ago • 452

jaygala24/Qwen2.5-1.5B-ReMax-math-reasoning

Text Generation • 2B • Updated 11 days ago • 455

jaygala24/Qwen2.5-3B-ReMax-math-reasoning

Text Generation • 3B • Updated 11 days ago • 471

decompute/Nebula-S-v1

Text Generation • 4B • Updated 14 days ago • 1.11k

decompute/Nebula-S-v1-4bit

Text Generation • 4B • Updated 15 days ago • 7

Flexan/decompute-Nebula-S-v1-GGUF

4B • Updated 15 days ago • 922

decompute/Nebula-S-v1-lite

Text Generation • Updated 14 days ago • 307

decompute/Nebula-S-v1-4bit-optimized

Text Generation • Updated 14 days ago • 4

mradermacher/Nebula-S-v1-GGUF

4B • Updated 14 days ago • 886

mradermacher/Nebula-S-v1-i1-GGUF

4B • Updated 14 days ago • 1.95k • 1

deepgo/Mobile-Flash-v1.5-1.5B

Text Generation • Updated 9 days ago • 592

jaygala24/Qwen2.5-0.5B-DAPO-math-reasoning

Text Generation • 0.5B • Updated 5 days ago • 606

jaygala24/Qwen2.5-1.5B-DAPO-math-reasoning

Text Generation • 2B • Updated 5 days ago • 604

jaygala24/Qwen2.5-3B-DAPO-math-reasoning

Text Generation • 3B • Updated 5 days ago • 614

jaygala24/Qwen3-1.7B-DAPO-math-reasoning

Text Generation • 2B • Updated 5 days ago • 632

jaygala24/Qwen2.5-0.5B-RLOO-math-reasoning

Text Generation • 0.5B • Updated 5 days ago • 618

jaygala24/Qwen2.5-1.5B-RLOO-math-reasoning

Text Generation • 2B • Updated 5 days ago • 655

jaygala24/Qwen2.5-3B-RLOO-math-reasoning

Text Generation • 3B • Updated 5 days ago • 708

jaygala24/Qwen3-1.7B-RLOO-math-reasoning

Text Generation • 2B • Updated 5 days ago • 769

jaygala24/Qwen3-4B-RLOO-math-reasoning

Text Generation • 4B • Updated 5 days ago • 286

jaygala24/Qwen3-4B-DAPO-math-reasoning

Text Generation • 4B • Updated 1 day ago • 477