🤖 Open WebUI als persönlicher 24/7-Hermes-Agent
Open WebUI ist die UI. Sie braucht ein Modell dahinter. Du hast drei Optionen — kombinier sie nach Lust.
Option A — externe API (empfohlen, schnell, kein VRAM nötig)
Beste Qualität pro Euro. Open WebUI unterstützt OpenAI-kompatible APIs out-of-the-box.
OpenAI / GPT-5 / GPT-4o
- Account auf https://platform.openai.com/ → API Keys → neuen Key generieren.
- Karte hinterlegen + Limit setzen (z. B. 10 €/Monat).
- In Open WebUI → ⚙️ Einstellungen → Verbindungen → OpenAI API:
- URL:https://api.openai.com/v1
- Key: einfügen. - Speichern → oben links Modell wählen (
gpt-4o,gpt-5, …).
Anthropic Claude
- URL:
https://api.anthropic.com/v1 - braucht Anthropic-Key, dann gleicher Ablauf.
Google Gemini / OpenRouter / Groq / DeepSeek
- alle kompatibel, in Open WebUI als „Custom OpenAI-compatible Endpoint" eintragen.
- Tipp: OpenRouter → eine API für 200+ Modelle.
Option B — lokal mit Ollama (deine GPU/CPU)
Datenschutzfreundlich, kostenlos, langsamer auf CPU-only Servern.
# auf dem Server (SSH)
curl -fsSL https://ollama.com/install.sh | sh
ollama pull llama3.1:8b
ollama serve # läuft als systemd-Unit, auto-start
In Open WebUI → ⚙️ → Verbindungen → Ollama → URL http://host.docker.internal:11434. Modelle erscheinen automatisch.
Achtung: Ohne GPU (du hast eine vServer-CPU) läuft 8B-Modell ca. 2–5 Tokens/s. Für „mal schnell fragen" ok, für Daueragent zu langsam → nimm Option A.
Option C — Mix (das tun die meisten)
Externe API für die schweren Anfragen, lokales 3B-Modell für triviales Routing/Summarization.
Hermes als „persönlicher Agent" — was heißt das konkret?
Open WebUI ist 24/7 online auf deinem Server. Du erreichst ihn von Handy/Laptop/iPad — überall. Konkrete Konfigurationsschritte:
1. Eigene Persona (System Prompt)
In Open WebUI → ⚙️ Einstellungen → Personalisierung → System-Prompt:
Du bist Hermes, der persönliche Assistent von Johannes.
Sprich Deutsch, sei knapp, sachlich, direkt. Keine Floskeln.
Du kennst meinen Server (Ubuntu 24.04, Hetzner, IP 168.119.232.59) und
darfst Server-Themen technisch beantworten. Du kannst Tools nutzen
(n8n-Webhooks, Web-Suche, Code-Interpreter).
2. „Memories" aktivieren
⚙️ → Personalisierung → Memory → an. Das Modell merkt sich automatisch Fakten über dich (Beruf, Vorlieben, Kontext) über Sessions hinweg.
3. Web-Search anschalten
⚙️ → Web-Suche → Provider wählen:
- DuckDuckGo (kostenlos, kein Key)
- Tavily / Searxng / Bing — bessere Qualität, Key nötig.
Damit kann Hermes live im Web recherchieren.
4. Tools / Functions
In Open WebUI gibt es eine Tools-Bibliothek (https://openwebui.com/tools). Du kannst Tools per Klick aktivieren — z. B. „send_email", „get_weather", „run_python". Die Tools sind Python-Snippets, die Open WebUI als Funktionen ans LLM gibt.
5. Auto-Pipeline an n8n koppeln (siehe n8n)
Beispiel: Telegram-Bot → n8n empfängt → ruft Open WebUI API → antwortet.
6. Mobile App / PWA
Open WebUI ist eine PWA. Auf dem Handy:
- Browser → https://ai.168-119-232-59.sslip.io/
- Menü → „Zum Startbildschirm hinzufügen".
- Sieht aus wie eine App, läuft offline-fähig.
Wo liegen meine Daten?
- Chats + Konfig: Docker-Volume
open-webui→/var/lib/docker/volumes/open-webui/_dataauf dem Server. - Backup:
docker run --rm -v open-webui:/d -v /root/.hermes/backups:/b alpine tar czf /b/openwebui-$(date +%F).tgz -C /d .
Häufige Fragen
- „Modell antwortet nicht / Fehler" → in Logs (https://logs.168-119-232-59.sslip.io/) Container
open-webuiöffnen, Stack-Trace lesen. - „Möchte mehrere User" → Settings → Admin Panel → User einladen. Jeder bekommt eigenen Workspace.
- „Kostet das was?" → Open WebUI ist kostenlos. Externe API-Modelle kosten pro Token. Lokale Modelle kosten Strom.