VRAM Calculator

Zeigt den VRAM-Bedarf (Modellgewichte + KV-Cache) für LLM-Modelle in verschiedenen Quantisierungen und Kontextlängen.

Modell-Familien Gemma 4 Mistral Qwen 3.5 / 36 Deepseek V3 Phi-4

Kontext

Architektur

Quantisierung

Suche

Rote ausblenden

6 GB 12 GB 16 GB 24 GB

Modell	Arch	Quant	Größe	KV-Cache	Max Ctx	VRAM Total	6 GB	12 GB	16 GB	24 GB