Oder: Wie ich $10 bei Grok verbrannte und lernte, dass AI-Agents nichts für arme Homelabber sind
TL;DR
- ✅ OpenClaw installiert auf Proxmox CT
- ❌ $10 bei Grok in wenigen Stunden verbrannt
- ⚠️ Gemini Free Tier (1.500 req/Tag) reicht nicht für autonome Agents
- 💡 Fazit: Für Homelab zu teuer, besser On-Demand nutzen
Die Idee: Ein autonomer AI-Agent für mein Homelab
Ich betreibe ein zweistufiges Proxmox-Cluster mit 15+ Services – von Paperless-NGX über OpenHAB bis hin zu einem kompletten AI Office Stack. Als ich von OpenClaw hörte (einem Open-Source autonomen AI-Agent), dachte ich: „Perfekt! Das könnte meine Infrastruktur noch smarter machen!“
Die Vision:
- Automatische Log-Analysen
- Smart Home Automationen via Natural Language
- Dokumenten-Zusammenfassungen aus Paperless
- Proaktive System-Überwachung
Klingt cool, oder? Spoiler: Ist es auch – aber teuer.
Die Installation: Überraschend einfach
OpenClaw lässt sich mit einem One-Liner installieren:
curl -fsSL https://openclaw.ai/install.sh | bash
Code-Sprache: JavaScript (javascript)
Ich habe einen neuen LXC Container (CT 115) auf meinem stärkeren Proxmox-Node (pve2) erstellt:
Specs:
- CPU: 4 Cores (i5-7500)
- RAM: 4 GB
- Storage: 50 GB
- OS: Ubuntu 24.04
Die Installation lief durch, OpenClaw startete drei Prozesse:
openclaw-gateway– WebSocket Gatewayopenclaw– Haupt-Agentopenclaw-models– LLM Integration
Soweit, so gut! ✅
Der erste Schock: Token-Verbrauch
OpenClaw zeigte mir in der TUI:
tokens 36k/1.0m (3%)
36.000 Tokens pro Request?! Zum Vergleich: Ein normaler Chat mit ChatGPT verbraucht 100-500 Tokens.
Warum so viel?
OpenClaw sendet bei jedem Request:
- Komplette Conversation History
- Agent Memory
- Workspace Context
- System Prompts
- Subagent-Contexts
Meine Config war schuld:
{
"maxConcurrent": 4,
"subagents": {
"maxConcurrent": 8
},
"compaction": {
"mode": "safeguard" // Behält viel Context
}
}
Code-Sprache: JSON / JSON mit Kommentaren (json)
Pro Task also potenziell 12 parallele Requests mit je 36k Tokens = 432k Tokens auf einmal! 💸
Der zweite Schock: Die Grok-Rechnung
Ich hatte während des Setups X.AI Grok 4 als LLM konfiguriert. Das Pricing:
Input: $5.00 / 1M tokens
Output: $15.00 / 1M tokens
Code-Sprache: HTTP (http)
Nach ein paar Test-Sessions und etwas Debugging: $10 verbrannt.
Die Rechnung:
~3-4 komplexe Agent-Tasks mit Subagents
= ~40-50 Requests à 36k tokens
= ~2M Input + 500k Output tokens
= $10 + $7.50 = $17.50
Mein Credit-Guthaben: $10 → aufgebraucht 😱
Grok ist 28x teurer als Gemini Flash für die gleiche Arbeit!
Der Umzug zu Gemini: Free Tier als Rettung?
Ich schwenkte schnell auf Google Gemini 1.5 Flash um:
Input: $0.075 / 1M tokens (67x günstiger!)
Output: $0.30 / 1M tokens (50x günstiger!)
Free Tier: 1.500 Requests/Tag
Code-Sprache: HTTP (http)
Das klang nach der Lösung! Aber…
Problem: Setup-Phase frisst das Limit
Am ersten Tag mit OpenClaw:
- Onboarding Wizard: ~500 Requests
- Config-Tests: ~300 Requests
- Meine Experimente: ~700 Requests
- Total: ~1.500 Requests = Limit erreicht ⚠️
Und das war nur ein Tag mit aktivem Testen!
Die Erkenntnis: Autonome Agents sind teuer
Warum OpenClaw so viele Requests verbraucht:
1. Subagents spawnen wie verrückt
Ein Task: "Check my emails and summarize"
Spawnt:
├─ Subagent 1: Email abrufen
├─ Subagent 2: Inhalte analysieren
├─ Subagent 3: Zusammenfassung erstellen
└─ Subagent 4: Formatierung
= 4-5 API Calls statt 1
Code-Sprache: JavaScript (javascript)
2. Lange Context History
OpenClaw behält ALLES im Context:
- Alle bisherigen Messages
- Agent Memory
- Workspace Files
- System State
→ 36k tokens pro Request
→ Schnell teuer bei vielen Requests
3. 24/7 Betrieb
Autonome Agents laufen kontinuierlich:
- Background Monitoring
- Scheduled Tasks
- Proaktive Checks
- Auto-Responses
→ 2.000+ Requests/Tag
→ Free Tier reicht nicht
Kostenvergleich: Was wäre wenn…?
Szenario: 100 Requests/Tag (moderate Nutzung)
| Provider | Model | Monat | Faktor |
|---|---|---|---|
| Gemini Flash | $0.81 | 1x | |
| OpenAI | GPT-4o Mini | $1.62 | 2x |
| Anthropic | Haiku | $8.64 | 11x |
| X.AI | Grok 4 | $22.50 | 28x |
Mit meiner unoptimierter Config (36k tokens/Request):
| Provider | Monat | Jahr |
|---|---|---|
| Gemini | $17 | $204 |
| Grok | $990 | $11.880 💀 |
Grok wäre teurer als meine komplette Homelab-Stromrechnung!
Optimierungsversuche
Config-Tuning
Ich versuchte, den Token-Verbrauch zu reduzieren:
{
"agents": {
"defaults": {
"compaction": {
"mode": "aggressive", // Statt "safeguard"
"maxTokens": 8000
},
"maxConcurrent": 1, // Statt 4
"subagents": {
"maxConcurrent": 1 // Statt 8
}
}
}
}
Code-Sprache: JSON / JSON mit Kommentaren (json)
Problem: OpenClaw überschrieb meine Config immer wieder!
Die Lösung: Config-Commands nutzen statt manuelles Editieren:
openclaw config set agents.defaults.maxConcurrent 1
Code-Sprache: CSS (css)
Aber selbst dann: OpenClaw hat keine granularen Token-Limits wie ich sie wollte.
Die Alternativen-Recherche
1. Lokales Ollama?
Meine Hardware:
- Intel i5-7500 (keine GPU)
- 31 GB RAM
Ollama Performance:
- Llama 3.1 8B: 20-30 Sekunden pro Response 🐌
- Bei Subagents: 60-90 Sekunden Wartezeit
Fazit: ❌ Zu langsam für einen autonomen Agent
2. Hugging Face Inference API?
Free Tier:
- ~30.000 tokens/Tag
- ~100 req/Stunde
Probleme:
- ❌ Keine native OpenClaw-Integration
- ❌ Schlechtere Tool-Use Fähigkeiten
- ❌ Instabil (Shared Infrastructure)
- ❌ Rate Limits zu niedrig
Fazit: ⚠️ Zu viel Aufwand für schlechteres Ergebnis
3. Gemini Free Tier richtig nutzen?
Das könnte funktionieren, WENN:
- ✅ Nur On-Demand statt 24/7
- ✅ Optimierte Config (1+1 concurrent)
- ✅ Web Search deaktiviert
- ✅ Keine autonomen Background-Tasks
Realistische Nutzung im Free Tier:
Morgens: 10 Requests (Email-Check, News)
Tagsüber: 20 Requests (Queries, Automationen)
Abends: 10 Requests (Reports)
────────────────────────────────────
Total: 40 Requests/Tag ✅
→ Unter 1.500 Limit
→ Kostenlos!
Hardware-Überlegung: DS916+ statt Proxmox?
Ich fragte mich: Sollte OpenClaw auf meiner Synology DS916+ laufen statt auf pve2?
DS916+ Specs:
- CPU: Celeron N3060 (2 Cores @ 1.6 GHz)
- RAM: 8 GB
- Storage: 16.8 TB (!)
Pro:
- ✅ Unbegrenzter Storage (vs. 157 GB auf pve2)
- ✅ Läuft eh 24/7 (keine Extra-Stromkosten)
- ✅ Native Backup-Integration
Contra:
- ❌ CPU 2x schwächer als pve2
- ❌ Weniger RAM (8 vs. 31 GB)
- ❌ HDD statt NVMe (10-50x langsamer)
Fazit: Hybrid-Ansatz ist optimal:
- Runtime auf pve2 (schnelle CPU/RAM)
- Workspace/Logs auf DS916+ (viel Storage)
Mein Fazit nach 24 Stunden
Was ich gelernt habe:
1. Autonome AI-Agents sind (noch) zu teuer für Homelab
Für $10-30/Monat könnte ich:
- Einen VPS mieten
- Mehr Storage kaufen
- Meine Stromrechnung bezahlen
- 10 Monate Netflix haben
2. Token-Verbrauch wird unterschätzt
36k tokens/Request klingt abstrakt, aber:
- Bei 100 Requests/Tag = 3.6M tokens
- Bei Gemini: $1/Tag = $30/Monat
- Bei Grok: $18/Tag = $540/Monat 💀
3. Free Tiers sind für Testing, nicht Production
Gemini Free (1.5k/Tag) reicht für:
- ✅ Manuelle Queries
- ✅ Gelegentliche Automationen
- ❌ 24/7 autonome Agents
4. OpenClaw ist cool, aber…
…nicht für Homelab-Budgets optimiert:
- Keine granularen Cost-Controls
- Keine Token-Budgets pro Agent
- Subagents spawnen unkontrolliert
- Context-Compaction zu konservativ
Was ich jetzt mache
Option A: On-Demand statt 24/7
Statt OpenClaw kontinuierlich laufen zu lassen:
# Nur starten wenn ich es brauche:
openclaw gateway
# Spezifische Tasks:
openclaw agent --message "Fasse Paperless-Dokumente zusammen"
openclaw agent --message "Analysiere OpenHAB Logs"
# Dann wieder stoppen:
pkill -f openclaw
Code-Sprache: PHP (php)
Kosten: $0/Monat (im Free Tier)
Option B: Einfach lassen
- OpenClaw installiert lassen
- Nicht aktiv nutzen
- Falls ich mal Bock habe: Da
- Kostet nichts wenn nicht genutzt
Option C: Deinstallieren
openclaw uninstall
npm uninstall -g openclaw
rm -rf ~/.openclaw
pct destroy 115 # CT in Proxmox löschen
Code-Sprache: PHP (php)
Aktuell: Tendiere zu Option B – installiert lassen, aber nicht aktiv nutzen.
Empfehlungen für andere Homelabber
OpenClaw macht Sinn wenn:
✅ Du ein Business-Budget hast ($50-100/Monat OK)
✅ Du wirklich 24/7 Automationen brauchst
✅ Du bereit bist, Paid Tiers zu nutzen
✅ Du die Kosten monitoren und kontrollieren kannst
Besser für Homelab:
✅ Paperless-NGX + RAG (nur bezahlen wenn du fragst)
✅ OpenHAB Automationen (keine Cloud-Kosten)
✅ Cron-Jobs + Scripts (kostenlos, zuverlässig)
✅ Gemini Free für manuelle Queries (1.5k/Tag reicht)
Alternativen zu OpenClaw
Wenn du AI im Homelab willst, aber nicht $30/Monat ausgeben:
1. Paperless-NGX + LLM-Integration
Kosten: $1-3/Monat
Use Case: Dokumente durchsuchbar + AI-Queries
On-Demand: Nur bezahlen wenn du fragst
Code-Sprache: PHP (php)
2. Home Assistant + AI Voice
Kosten: $0 (lokal) oder $5/Monat (Cloud)
Use Case: Smart Home Steuerung
Besser integriert als OpenClaw
Code-Sprache: PHP (php)
3. n8n + AI Nodes
Kosten: $0 (self-hosted)
Use Case: Workflow-Automationen mit AI
Mehr Kontrolle über API Calls
Code-Sprache: PHP (php)
4. Ollama für Batch-Jobs
Kosten: $0 (nur Strom)
Use Case: Nächtliche Analysen
Egal ob 30 Sek oder 5 Min
Code-Sprache: PHP (php)
Die harte Wahrheit
Autonome AI-Agents sind die Zukunft – aber noch nicht für Homelab-Budgets.
Die Technologie ist da, aber:
- Token-Preise sind für Business optimiert
- Free Tiers sind zu limitiert für 24/7 Betrieb
- Lokale LLMs (ohne GPU) sind zu langsam
- Cost-Controls fehlen in den Tools
Meine Prognose:
- In 2-3 Jahren: Günstigere/effizientere Models
- Bessere lokale LLMs (NPU-Support)
- Tools mit eingebauten Cost-Controls
- Dann wird es für Homelab interessant
Bis dahin: On-Demand > Autonomous
Ressourcen & Links
- OpenClaw: https://openclaw.ai
- Mein Setup: Proxmox Cluster, 15+ Services, 16TB NAS
- LLM Pricing Vergleich: https://artificialanalysis.ai/models
- Gemini Free Tier: https://aistudio.google.com
Kommentare & Diskussion
Habt ihr ähnliche Erfahrungen mit AI-Agents im Homelab? Wie managed ihr die Kosten?
Teilt eure Setups in den Kommentaren! 👇
Geschrieben am 13. März 2026 nach 24 Stunden OpenClaw-Experiment
Tags: #homelab #ai #openclaw #llm #kostenoptimierung #proxmox #selfhosted


Schreibe einen Kommentar