🤖 Open WebUI als persönlicher 24/7-Hermes-Agent

Open WebUI ist die UI. Sie braucht ein Modell dahinter. Du hast drei Optionen — kombinier sie nach Lust.

Option A — externe API (empfohlen, schnell, kein VRAM nötig)

Beste Qualität pro Euro. Open WebUI unterstützt OpenAI-kompatible APIs out-of-the-box.

OpenAI / GPT-5 / GPT-4o

Account auf https://platform.openai.com/ → API Keys → neuen Key generieren.
Karte hinterlegen + Limit setzen (z. B. 10 €/Monat).
In Open WebUI → ⚙️ Einstellungen → Verbindungen → OpenAI API:
- URL: https://api.openai.com/v1
- Key: einfügen.
Speichern → oben links Modell wählen (gpt-4o, gpt-5, …).

Anthropic Claude

URL: https://api.anthropic.com/v1
braucht Anthropic-Key, dann gleicher Ablauf.

Google Gemini / OpenRouter / Groq / DeepSeek

alle kompatibel, in Open WebUI als „Custom OpenAI-compatible Endpoint" eintragen.
Tipp: OpenRouter → eine API für 200+ Modelle.

Option B — lokal mit Ollama (deine GPU/CPU)

Datenschutzfreundlich, kostenlos, langsamer auf CPU-only Servern.

# auf dem Server (SSH)
curl -fsSL https://ollama.com/install.sh | sh
ollama pull llama3.1:8b
ollama serve  # läuft als systemd-Unit, auto-start

In Open WebUI → ⚙️ → Verbindungen → Ollama → URL http://host.docker.internal:11434. Modelle erscheinen automatisch.

Achtung: Ohne GPU (du hast eine vServer-CPU) läuft 8B-Modell ca. 2–5 Tokens/s. Für „mal schnell fragen" ok, für Daueragent zu langsam → nimm Option A.

Option C — Mix (das tun die meisten)

Externe API für die schweren Anfragen, lokales 3B-Modell für triviales Routing/Summarization.

Hermes als „persönlicher Agent" — was heißt das konkret?

Open WebUI ist 24/7 online auf deinem Server. Du erreichst ihn von Handy/Laptop/iPad — überall. Konkrete Konfigurationsschritte:

1. Eigene Persona (System Prompt)

In Open WebUI → ⚙️ Einstellungen → Personalisierung → System-Prompt:

Du bist Hermes, der persönliche Assistent von Johannes.
Sprich Deutsch, sei knapp, sachlich, direkt. Keine Floskeln.
Du kennst meinen Server (Ubuntu 24.04, Hetzner, IP 168.119.232.59) und
darfst Server-Themen technisch beantworten. Du kannst Tools nutzen
(n8n-Webhooks, Web-Suche, Code-Interpreter).

2. „Memories" aktivieren

⚙️ → Personalisierung → Memory → an. Das Modell merkt sich automatisch Fakten über dich (Beruf, Vorlieben, Kontext) über Sessions hinweg.

3. Web-Search anschalten

⚙️ → Web-Suche → Provider wählen:
- DuckDuckGo (kostenlos, kein Key)
- Tavily / Searxng / Bing — bessere Qualität, Key nötig.

Damit kann Hermes live im Web recherchieren.

4. Tools / Functions

In Open WebUI gibt es eine Tools-Bibliothek (https://openwebui.com/tools). Du kannst Tools per Klick aktivieren — z. B. „send_email", „get_weather", „run_python". Die Tools sind Python-Snippets, die Open WebUI als Funktionen ans LLM gibt.

5. Auto-Pipeline an n8n koppeln (siehe n8n)

Beispiel: Telegram-Bot → n8n empfängt → ruft Open WebUI API → antwortet.

6. Mobile App / PWA

Open WebUI ist eine PWA. Auf dem Handy:
- Browser → https://ai.168-119-232-59.sslip.io/
- Menü → „Zum Startbildschirm hinzufügen".
- Sieht aus wie eine App, läuft offline-fähig.

Wo liegen meine Daten?

Chats + Konfig: Docker-Volume open-webui → /var/lib/docker/volumes/open-webui/_data auf dem Server.
Backup: docker run --rm -v open-webui:/d -v /root/.hermes/backups:/b alpine tar czf /b/openwebui-$(date +%F).tgz -C /d .

Häufige Fragen

„Modell antwortet nicht / Fehler" → in Logs (https://logs.168-119-232-59.sslip.io/) Container open-webui öffnen, Stack-Trace lesen.
„Möchte mehrere User" → Settings → Admin Panel → User einladen. Jeder bekommt eigenen Workspace.
„Kostet das was?" → Open WebUI ist kostenlos. Externe API-Modelle kosten pro Token. Lokale Modelle kosten Strom.