Question 1

Bedeutet „souveräne KI" wirklich, dass keine Daten zu OpenAI oder Gemini fließen?

Accepted Answer

Ja — im Standard-Setup läuft das komplette LLM auf Ihrem Server (oder auf einem meiner GPU-Server in Deutschland). Es gibt kein Fallback zu externen APIs, es sei denn, Sie konfigurieren das explizit für unkritische Use-Cases.

Question 2

Kommt Mistral Small 3.1 an GPT-4 heran?

Accepted Answer

Für strukturierte Domänen-Aufgaben (Dokumenten-Extraktion, Zusammenfassung, RAG-Antworten) ja — teils besser durch Fine-Tuning. Für kreatives Long-Form-Writing: Knapp dahinter. Wir evaluieren im Projekt-Kontext. Für Code-spezifische Workflows nutze ich Codestral, für Voice-to-Text Voxtral.

Question 3

Brauche ich eigene Hardware?

Accepted Answer

Nein. Dedizierte GPU-Server (in Deutschland) ab ~200 €/Monat sind der Standard-Weg. Wer lieber im eigenen Haus betreibt: meine KI-Werkstatt-Pakete liefern fertige On-Prem-Systeme ab 3.499 €. Eigene Hardware nur für sehr hohe Last oder bestimmte Compliance-Anforderungen.

Question 4

Was kostet der Betrieb nach Launch?

Accepted Answer

GPU-Hosting 30-300 €/Monat je nach Modell-Größe und Last, mit socket-activation deutlich reduzierbar bei geringer Last. Plus Monitoring und Updates. Typisch günstiger als OpenAI-Rechnungen bei gleichem Volumen — und kosten-predictable.

Question 5

Integriert sich das in mein bestehendes System?

Accepted Answer

Über REST, GraphQL oder WebSocket. Standard-Patterns: Chat-Widget, Dokument-Upload, Batch-Verarbeitung, Webhooks. Auch als MCP-Server (Model Context Protocol) möglich.

Question 6

Was passiert bei EU-AI-Act?

Accepted Answer

On-Prem-LLMs sind bezüglich Transparenz einfacher zu dokumentieren. Für Hochrisiko-Anwendungen vermittle ich KI-Rechtsanwält:innen — juristische Einschätzung ist nicht mein Metier.

KI ist ein Werkzeug. Nicht ein Abonnement bei OpenAI.

Warum nicht einfach OpenAI oder Gemini?

Ihre Dokumente. Ihr Modell. Ihr Server.

Vier Säulen der souveränen KI

Lokal laufende LLMs

RAG über eigene Dokumente

Domänen-spezifische Modelle

Observability + Monitoring

Häufige Fragen

Lass uns reden.