| Qwen 3.5 9B |
Dense |
~5–6 GB |
KomfortabelPasst vollständig in VRAM; ~1–2 GB Puffer |
Sehr komfortabelViel Platz für langen Kontext |
Sehr komfortabelMassig Reserven; höhere Quant möglich |
Ultra-LeichtMassig Platz für parallele Agenten oder Q8 |
Gut nutzbar~10–14 Tok/Sek · Passt komplett in RAM |
| Qwen 3.5 27B |
Dense |
~17 GB |
Nicht möglichVRAM viel zu klein |
Nicht möglichAuch Q3 (~14 GB) passt kaum; kein Puffer |
Q3 möglichQ3_K_M (~14 GB) passt; Q4 (~17 GB) läuft über |
Sehr gut (Q4–Q6)~34 Tok/Sek · Komfortabel; Q6 empfohlen |
Nicht möglichModell sprengt 16 GB RAM → starker Swap |
| Qwen 3.6 27B |
Dense |
~17 GB |
Nicht möglichVRAM viel zu klein |
Nicht möglichQ3 (~14 GB) passt kaum; kein Puffer |
Q3 möglichQ3_K_M (~14 GB) passt; Q4 (~17 GB) läuft über |
Sehr gut (Q4–Q6)~34 Tok/Sek · Hybrid-Attn · Bild unterstützt |
Nicht möglichModell sprengt 16 GB RAM |
| Qwen 3.5 / 3.6 · 35B-A3B |
MoE 8/256 |
~22 GB |
Nicht möglichVRAM viel zu klein |
Nicht möglichVRAM zu klein für Q3+ |
Nicht möglichOffload möglich, aber <5 Tok/Sek |
Empfohlen (Q4)~111 Tok/Sek · 3× schneller als 27B Dense dank MoE |
Nicht möglichSprengt 16 GB RAM vollständig |
| Qwen 3.5 122B-A10B |
MoE |
~70 GB |
Nicht möglich— |
Nicht möglich— |
Nicht möglich— |
Nicht möglichBraucht Multi-GPU: 4× A100 / 2× H100 |
Nicht möglich— |