Hermes

🤖 Open WebUI als persönlicher 24/7-Hermes-Agent

🤖 Open WebUI als persönlicher 24/7-Hermes-Agent

Open WebUI ist die UI. Sie braucht ein Modell dahinter. Du hast drei Optionen — kombinier sie nach Lust.

Option A — externe API (empfohlen, schnell, kein VRAM nötig)

Beste Qualität pro Euro. Open WebUI unterstützt OpenAI-kompatible APIs out-of-the-box.

OpenAI / GPT-5 / GPT-4o

  1. Account auf https://platform.openai.com/ → API Keys → neuen Key generieren.
  2. Karte hinterlegen + Limit setzen (z. B. 10 €/Monat).
  3. In Open WebUI → ⚙️ Einstellungen → VerbindungenOpenAI API:
    - URL: https://api.openai.com/v1
    - Key: einfügen.
  4. Speichern → oben links Modell wählen (gpt-4o, gpt-5, …).

Anthropic Claude

Google Gemini / OpenRouter / Groq / DeepSeek

Option B — lokal mit Ollama (deine GPU/CPU)

Datenschutzfreundlich, kostenlos, langsamer auf CPU-only Servern.

# auf dem Server (SSH)
curl -fsSL https://ollama.com/install.sh | sh
ollama pull llama3.1:8b
ollama serve  # läuft als systemd-Unit, auto-start

In Open WebUI → ⚙️ → VerbindungenOllama → URL http://host.docker.internal:11434. Modelle erscheinen automatisch.

Achtung: Ohne GPU (du hast eine vServer-CPU) läuft 8B-Modell ca. 2–5 Tokens/s. Für „mal schnell fragen" ok, für Daueragent zu langsam → nimm Option A.

Option C — Mix (das tun die meisten)

Externe API für die schweren Anfragen, lokales 3B-Modell für triviales Routing/Summarization.

Hermes als „persönlicher Agent" — was heißt das konkret?

Open WebUI ist 24/7 online auf deinem Server. Du erreichst ihn von Handy/Laptop/iPad — überall. Konkrete Konfigurationsschritte:

1. Eigene Persona (System Prompt)

In Open WebUI → ⚙️ Einstellungen → PersonalisierungSystem-Prompt:

Du bist Hermes, der persönliche Assistent von Johannes.
Sprich Deutsch, sei knapp, sachlich, direkt. Keine Floskeln.
Du kennst meinen Server (Ubuntu 24.04, Hetzner, IP 168.119.232.59) und
darfst Server-Themen technisch beantworten. Du kannst Tools nutzen
(n8n-Webhooks, Web-Suche, Code-Interpreter).

2. „Memories" aktivieren

⚙️ → PersonalisierungMemory → an. Das Modell merkt sich automatisch Fakten über dich (Beruf, Vorlieben, Kontext) über Sessions hinweg.

3. Web-Search anschalten

⚙️ → Web-Suche → Provider wählen:
- DuckDuckGo (kostenlos, kein Key)
- Tavily / Searxng / Bing — bessere Qualität, Key nötig.

Damit kann Hermes live im Web recherchieren.

4. Tools / Functions

In Open WebUI gibt es eine Tools-Bibliothek (https://openwebui.com/tools). Du kannst Tools per Klick aktivieren — z. B. „send_email", „get_weather", „run_python". Die Tools sind Python-Snippets, die Open WebUI als Funktionen ans LLM gibt.

5. Auto-Pipeline an n8n koppeln (siehe n8n)

Beispiel: Telegram-Bot → n8n empfängt → ruft Open WebUI API → antwortet.

6. Mobile App / PWA

Open WebUI ist eine PWA. Auf dem Handy:
- Browser → https://ai.168-119-232-59.sslip.io/
- Menü → „Zum Startbildschirm hinzufügen".
- Sieht aus wie eine App, läuft offline-fähig.

Wo liegen meine Daten?

Häufige Fragen