| Gemma 4 E2B (5,1 B) |
Dense |
~3–4 GB |
PerfektLäuft voll im VRAM, ~2 GB Puffer für Basis-Kontext |
Ultra-komfortabelViel Platz für langen Kontext und Bilder |
Sehr komfortabelMassig Reserven für parallele Anfragen |
Ultra-LeichtMassig Platz für parallel laufende Agenten |
Gut nutzbar~12–15 Tok/Sek · Modell passt komplett in RAM, ~12 GB frei |
| Gemma 4 E4B (8 B) |
Dense |
~5–6 GB |
GrenzbereichPasst gerade so; kaum Platz für Bild-/Audio-Kontext |
KomfortabelAusreichend Puffer für Kontext und Bilder |
Sehr komfortabelRiesiger Kontext-Puffer frei |
Sehr komfortabelRiesiger Kontext-Puffer frei |
Akzeptabel~8–10 Tok/Sek · Belegt fast halben RAM; träge bei Bildern |
| Gemma 4 12B (Unified) |
Dense |
~7–9 GB |
Nicht möglichVRAM läuft über; Absturz oder extremer Einbruch |
GrenzbereichPasst knapp; kaum Puffer für Multimodalität |
Sweet-SpotBeste Balance aus Intelligenz, Audio & Kontext |
Sweet-SpotBeste Balance aus Intelligenz, Audio & Kontext |
Sehr träge / Limit~4–6 Tok/Sek · Belegt inkl. System fast den gesamten RAM |
| Gemma 4 26B A4B (MoE) |
MoE 8/128 |
~14–16 GB |
Nicht möglichVRAM viel zu klein |
Nicht möglichVRAM zu klein |
GrenzbereichPasst knapp; kaum Puffer für Chat-Verlauf |
Sehr gutHohe Logik-Intelligenz, genug Platz für Chat-Verlauf |
Nicht möglichSprengt 16 GB RAM komplett → System fängt an zu swappen |
| Gemma 4 31B (Dense) |
Dense |
~18–21 GB |
Nicht möglichVRAM viel zu klein |
Nicht möglichVRAM zu klein |
Nicht möglichVRAM reicht bei Weitem nicht aus |
Knapp (Limit)Modell passt, aber bei langen Texten/Bildern droht Überlauf |
Nicht möglichVRAM/RAM reicht bei Weitem nicht aus |