-
-
-
-
-
-
Inference Providers
Active filters:
sglang
bullpoint/Qwen3-Coder-Next-AWQ-4bit
Text Generation
•
14B
•
Updated
•
22.8k
•
3
bartowski/VibeStudio_MiniMax-M2-THRIFT-GGUF
Text Generation
•
173B
•
Updated
•
189
•
8
Doradus-AI/MiroThinker-v1.0-30B-FP8
Text Generation
•
31B
•
Updated
•
12
•
4
Image-Text-to-Text
•
138B
•
Updated
•
222
•
1
SurfaceData/llava-v1.6-mistral-7b-sglang
Image-Text-to-Text
•
8B
•
Updated
•
4
•
9
SurfaceData/llava-v1.6-vicuna-7b-sglang
Image-Text-to-Text
•
7B
•
Updated
•
2
•
1
tclf90/qwen2.5-72b-instruct-gptq-int4
Text Generation
•
73B
•
Updated
•
30
•
2
tclf90/qwen2.5-72b-instruct-gptq-int3
Text Generation
•
69B
•
Updated
•
33
alvarobartt/grok-2-tokenizer
Text Generation
•
Updated
•
8
•
3
VibeStudio/MiniMax-M2-THRIFT
173B
•
Updated
•
1.54k
•
35
mradermacher/MiniMax-M2-THRIFT-GGUF
JasmineBBB/Kimi-Linear-48B-A3B-Instruct-bnb-4bit
Text Generation
•
49B
•
Updated
•
4
•
1
mradermacher/MiniMax-M2-THRIFT-i1-GGUF
173B
•
Updated
•
224
•
10
VibeStudio/MiniMax-M2-THRIFT-55
106B
•
Updated
•
127
•
5
JinnP/SGLang-EAGLE3-Qwen3-Coder-30B-A3B-Instruct
Text Generation
•
0.2B
•
Updated
•
211
•
1
mradermacher/MiniMax-M2-THRIFT-55-GGUF
106B
•
Updated
•
26
•
2
mradermacher/MiniMax-M2-THRIFT-55-i1-GGUF
106B
•
Updated
•
297
•
2
VibeStudio/MiniMax-M2-THRIFT-55-MLX-4bit
106B
•
Updated
•
104
•
2
VibeStudio/MiniMax-M2-THRIFT-55-MLX-6bit
106B
•
Updated
•
92
Doradus-AI/Hermes-4.3-36B-FP8
Text Generation
•
36B
•
Updated
•
116
•
2
Doradus-AI/RnJ-1-Instruct-FP8
Text Generation
•
9B
•
Updated
•
1
•
4
QuantTrio/Qwen3-Coder-Next-E336
Text Generation
•
53B
•
Updated
•
39
QuantTrio/Qwen3-Coder-Next-E400
Text Generation
•
63B
•
Updated
•
50