Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

381

Full-text search

Active filters: 4bit

sweatSmile/Phi3-Mini-FinSight-FinancialQA

Text Generation • 4B • Updated Nov 2 • 5 • 1

ikarius/Granite-3.2-8b-instruct-Abliterated-NF4

Text Generation • 8B • Updated Nov 17 • 3 • 1

ikarius/NeuralDaredevil-8B-abliterated-NF4

Text Generation • 8B • Updated 15 days ago • 10 • 1

ikarius/Qwen2.5-Coder-14B-Instruct-Abliterated-NF4

Text Generation • 15B • Updated Nov 18 • 4 • 1

Infiniaai/teddy-3.5b

4B • Updated Nov 17 • 11

wcosmas/sbcc-qwen

lunovian/Qwen2.5-Math-7B-Instruct-4bit

2B • Updated Nov 21 • 2

Plurigrid/DR-Tulu-8B-MLX-4bit

1B • Updated Nov 22 • 6

ujjwal52/Llama-2-7b-FLASH-UK

Text Generation • 7B • Updated Nov 22 • 5 • 1

Plurigrid/Olmo-3-32B-Think-MLX-4bit

Text Generation • 32B • Updated Nov 22 • 16

gawadx1/Krvn

Updated Nov 24 • 1

beta3/gemma3_1b_title_generator

Updated Nov 24 • 1

Sugandha-Chauhan/BioMistral-7B-SymptomDiagnosis

Text Classification • Updated Nov 29 • 7

hunterbown/dante-qwen-4b

Text Generation • 0.6B • Updated 26 days ago • 299 • 3

ikarius/Qwen2.5-Coder-32B-Instruct-Abliterated-NF4

33B • Updated 29 days ago • 11 • 1

smkrv/Qwen3-0.6B-CoreML-4bit

Text Generation • Updated 28 days ago • 32

atabaza/WeThink-Qwen2.5VL-7B-bnb-4bit

Text Generation • 8B • Updated 7 days ago • 39

codewithdark/Llama-3.2-3B-4bit-mlx

Text Generation • 3B • Updated 11 days ago • 99

mhmdelbadry1/qwen-reasoning-grpo-4bit

Reinforcement Learning • 2B • Updated 3 days ago • 33

seochan99/Qwen-Image-Edit-2511-bnb-nf4

Image-to-Image • Updated 4 days ago • 75

bisonnetworking/MediPhi-Instruct-mlx-4bit

Text Generation • 0.6B • Updated about 14 hours ago • 40