Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

32

Full-text search

Active filters: FP4

nvidia/Qwen3-30B-A3B-FP4

Text Generation • 16B • Updated Sep 10 • 2.55k • 8

NVFP4/Qwen3-32B-FP4

Text Generation • 19B • Updated Jul 23 • 534 • 3

NVFP4/Qwen3-30B-A3B-Instruct-2507-FP4

Text Generation • 16B • Updated Aug 1 • 1.95k • 10

nvidia/Qwen3-8B-FP4

Text Generation • 5B • Updated Sep 9 • 37.8k • 3

nvidia/Llama-4-Scout-17B-16E-Instruct-FP4

56B • Updated Aug 27 • 20.9k • 2

nvidia/DeepSeek-V3-0324-FP4

Text Generation • Updated Aug 22 • 15.5k • 12

nvidia/DeepSeek-R1-0528-FP4

Text Generation • Updated Aug 22 • 91.1k • 36

NVFP4/DeepSeek-Prover-V2-7B-FP4

4B • Updated Jul 23 • 5

NVFP4/DeepSeek-R1-0528-Qwen3-8B-FP4

5B • Updated Jul 23 • 9 • 1

NVFP4/Polaris-4B-Preview-FP4

2B • Updated Jul 23 • 5

NVFP4/Polaris-7B-Preview-FP4

5B • Updated Jul 23 • 4

nvidia/Qwen3-235B-A22B-FP4

Text Generation • Updated Jul 8 • 2.44k • 1

apolloparty/LFM2-350M-NVFP4A16

Text Generation • 0.2B • Updated Jul 12 • 14

apolloparty/LFM2-700M-NVFP4A16

Text Generation • 0.5B • Updated Jul 12 • 14

apolloparty/LFM2-1.2B-NVFP4A16

Text Generation • 0.7B • Updated Jul 12 • 4 • 1

tachyphylaxis/DeepSeek-R1-0528-FP4

Text Generation • Updated Jul 18 • 14

nvidia/DeepSeek-R1-0528-FP4-v2

Text Generation • 394B • Updated Sep 2 • 42.5k • 8

nvidia/DeepSeek-R1-FP4-v2

Text Generation • 394B • Updated Jul 22 • 554 • 3

NVFP4/Qwen3-235B-A22B-Instruct-2507-FP4

Text Generation • Updated Jul 23 • 172 • 1

NVFP4/Qwen3-Coder-480B-A35B-Instruct-FP4

Text Generation • Updated Jul 23 • 166 • 1

NVFP4/Qwen3-235B-A22B-Thinking-2507-FP4

Text Generation • Updated Jul 26 • 76 • 1

BitPhinix/DeepSeek-V3-0324-FP4

Text Generation • Updated Jul 30 • 3

NVFP4/Qwen3-30B-A3B-Thinking-2507-FP4

Text Generation • 16B • Updated Aug 1 • 502 • 2

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5 • 1.26k • 2

NVFP4/Qwen3-0.6B-FP4

Text Generation • 0.4B • Updated Aug 10 • 412

nvidia/Phi-4-multimodal-instruct-FP4

4B • Updated Sep 5 • 667 • 3

nvidia/Phi-4-reasoning-plus-FP4

8B • Updated Sep 5 • 346 • 4

nvidia/Llama-3.1-8B-Instruct-FP4

5B • Updated Sep 15 • 5.11k

nvidia/Qwen3-14B-FP4

Text Generation • 8B • Updated Sep 9 • 2.2k • 1

nvidia/Qwen3-32B-FP4

Text Generation • 17B • Updated Sep 9 • 10.1k • 1