Zum Inhalt springen
stackschmiede.de
EN
2025 industry Live

KI-Chatbot im eigenen Messenger — 3motiBot-Proof

Matrix-Bot mit LLM-Backend, den ich auf meinem 3motibot-Server betreibe. Wahlweise mit on-prem Mistral Small 3.1 oder angebundener Cloud-API. Konversationsgedächtnis, System-Prompts, Domänen-Tuning — alles selbst implementiert.

Jahr
2025
Dauer
Produktiv seit 2025
Rolle
Entwicklung, Betrieb (Solo, KI-augmented)
Sektor
industry
Tech-Stack
Matrix SDK (matrix-nio, Python)vLLM / Mistral Small 3.1 (on-prem Default)Kommerzielle Cloud-LLM-API (optional)Python 3.12PostgreSQL (Gesprächsverlauf)Dockersystemd

Worum geht es?

3motiBot — mein eigener Matrix-Server unter 3motibot.de — hat einen integrierten KI-Chatbot. Jeder Nutzer kann den Bot in einen Raum einladen oder per DM anschreiben und bekommt KI-Antworten auf Fragen. Der Bot nutzt ein großes Sprachmodell als Backend und einen Python-Wrapper, den ich selbst geschrieben habe — für Kontext-Handling, System-Prompts und Rate-Limit.

Was ist technisch drin?

  • Matrix-Pipeline — der Bot ist ein reiner Matrix-Client (Python matrix-nio). Keine Message verlässt den Matrix-Raum unnötig; nur der Nutzer-Text wandert an das LLM-Backend.
  • Austauschbares LLM-Backend — die Architektur ist so gebaut, dass on-prem Mistral Small 3.1 oder Codestral per vLLM/Ollama direkt eingesetzt werden kann. Alternativ binde ich eine kommerzielle Cloud-LLM-API an, wenn maximale Antwort-Qualität wichtiger ist als Datensouveränität. Entscheidung pro Kundenprojekt.
  • Wrapper-Framework (selbst geschrieben):
    • Kontext-Handling mit Token-Budget pro Gespräch
    • System-Prompts pro Raum/Nutzer konfigurierbar (Persona, Domänen-Wissen, Tonfall)
    • Rate-Limit pro Nutzer und Stunde
    • Error-Handling mit Fallback auf Zweit-Backend bei API-Ausfall
  • Persistenter Gesprächsverlauf in PostgreSQL, pro Matrix-Raum separiert.
  • Admin-Befehle per DM: /reset, /persona <name>, /stats.

Wofür ist das interessant?

Szenario A — Kunden-Support-Bot auf eigener Infrastruktur: Ihr Support beantwortet wiederkehrende Fragen — eine KI übernimmt 70–80 % der Erstanfragen. Auf Matrix läuft der Gesprächsverlauf direkt bei Ihnen, nicht bei einem SaaS-Anbieter.

Szenario B — Interner Wissens-Assistent: Handbücher, Prozesse, FAQs als System-Prompt oder RAG-Kontext. Der Bot beantwortet Mitarbeiter-Fragen, besonders wertvoll für Neueinsteiger und Dokumentations-Navigation.

Szenario C — Branchenspezifischer Assistent: Rechtsberatung (Erstprüfung), Steuer-Vorprüfung, technische Erstdiagnose — Bot mit domänenspezifischem Prompt liefert strukturierte Erstantworten. Menschliche Expertise bleibt im Prozess.

Backend-Wahl: on-prem oder Cloud-API?

KriteriumMistral Small 3.1 on-premKommerzielle Cloud-API
Antwort-Qualitätgut, je nach Hardwareausgezeichnet
Datenschutzbleibt vollständig bei IhnenDaten gehen an den API-Anbieter
KostenHardware + Stromca. 0,003–0,015 €/Nachricht
Hardware-Anforderungmind. 24 GB VRAM (z.B. RTX 4090)keine
Verfügbarkeitintern kontrolliertCloud-abhängig

Meine Empfehlung: wenn Datenhoheit wichtig ist, gleich mit on-prem starten. Wenn maximale Antwort-Qualität oder ein schneller Proof-of-Concept ohne GPU-Investment gefragt ist, startet man mit einer Cloud-API und migriert später. Der Wrapper-Code funktioniert für beide Backends ohne Änderung am Bot-Verhalten.

Das Angebot

Setup eines eigenen KI-Chatbots inkl. Matrix-Integration, Wrapper-Code, System-Prompt-Design, 30 Tage Support.

  • Typ. Kosten Setup: 3.900–8.900 € einmalig (je nach Komplexität des Use-Cases)
  • Laufend: ab 39 €/Monat (Server + API-Kontingent) oder variabel bei eigenem API-Key
  • Optional: Retainer für Prompt-Tuning und Backend-Updates

Status

Produktiv seit 2025 auf meinem eigenen 3motibot-Server. Als Leistung angeboten — auf Anfrage für erste Pilotkunden zu Pilot-Konditionen.

Ergebnisse

  • Eigener KI-Chatbot auf 3motibot.de live
  • Wrapper-Framework: Kontext-Handling, System-Prompts, Rate-Limit, Fehler-Behandlung
  • Austauschbares Backend: on-prem LLM oder Cloud-API per Konfiguration
  • Persistenter Gesprächsverlauf je Matrix-Raum
  • Admin-Befehle per DM: /reset, /persona, /stats
Für Ihr Unternehmen

Eigener KI-Chatbot für Ihr Team?

Egal ob Kunden-Support, interner Knowledge-Bot oder branchenspezifischer Assistent — ich baue den Bot auf Ihrer eigenen Matrix-Infrastruktur. Backend wählen Sie: on-prem Mistral Small 3.1 für strikten Datenschutz oder Cloud-API für maximale Antwort-Qualität.

Kickoff anfragen