Zum Inhalt springen
stackschmiede.de
EN
2026 selbst

Ausmalbild-Generator (KI)

Lokal laufender Proof-of-Concept: textbasierte Eingabe → druckbares Ausmalbild. Komplett auf eigener Hardware, ohne OpenAI, ohne Cloud-Upload.

Jahr
2026
Dauer
Laufendes Experiment
Rolle
Solo-Entwickler (KI-augmented) — ML-Pipeline, Backend, UI, Deployment-Konzept
Sektor
selbst
Tech-Stack
Python 3.12FastAPIStable Diffusion XLLoRA für Line-Art-StilPyTorchAstro Frontend

Idee

Ausmalbilder zu konkreten Themen sind in Kitas, Schulen und Familien beliebt — aber meist nur generische Stock-Motive verfügbar. Wer mal ein Ausmalbild zu einem speziellen Wunsch („Drachen mit Astronautenhelm”, „Pferd auf Mondoberfläche”, „Lieblings-Tier mit Krone”) braucht, findet selten passendes Material. Vorhandene KI-Tools sind dabei oft:

  • Cloud-gebunden (Eingaben an US-Server)
  • Pay-per-Bild teuer bei häufiger Nutzung
  • Schwer zu steuern auf das gewünschte Line-Art-Format

Dieses Experiment zeigt, wie es lokal und on-prem geht.

Lösung (lokaler Proof-of-Concept)

Eine schlanke Pipeline mit Text-Prompt als Eingabe:

  1. Prompt: Nutzer:in tippt z.B. „Drache mit Krone vor Burg”.
  2. Prompt-Engineering: System ergänzt Stil-Anker („coloring book line art, black and white, bold outlines, no shading, A4 portrait”).
  3. SDXL-Rendering: Stable Diffusion XL mit Line-Art-LoRA generiert das Bild.
  4. Post-Processing: Linien-Schärfung, Weißflächen-Reinigung, Kontrast-Optimierung.
  5. PDF-Output: A4-druckfertig, randlos.
 [Text-Prompt] → [Stil-Anker hinzufügen] → [SDXL + LoRA] → [Post] → [PDF]
       ↑                                                            ↓
       └────────── alles lokal / on-prem (DE) ─────────────────────┘

Status heute

  • Lokal: läuft, liefert gute Ergebnisse bei Test-Bildern.
  • Nicht deployt: noch keine öffentliche Demo. Geplanter nächster Schritt: Hetzner GPU (GEX44, ~200 €/Monat, mit socket-activation auf ~20-50 €/Monat effektiv reduzierbar).
  • Keine Kunden: dies ist ein Lern- und Showcase-Projekt für KI-Integration auf Hetzner, kein Produkt in Vermarktung.

Was das Projekt zeigt

  • KI-Integration ohne OpenAI: Ich habe die komplette Pipeline selbst umgesetzt — nicht nur einen API-Wrapper.
  • ControlNet-Verständnis: Vorverarbeitung ist der Löwenanteil der Qualität.
  • Hetzner-GPU-Kosten-Modell: socket-activation macht on-prem wirtschaftlich sinnvoll.
  • Realistischer Scope eines Solo-Projekts mit KI-Assist.

Warum für Sie interessant?

Weil genau dieselbe Architektur — lokaler Workflow, keine US-Cloud, kosten-predictable — für andere Domänen funktioniert: Dokumenten-Verarbeitung, Vertrags-Analyse, Patenten-Recherche, interne Wissens-Bots mit RAG.

Wenn Sie für Ihren Use-Case etwas Ähnliches wollen — siehe Paket Souveräne KI-Integration.

Ergebnisse

  • Lokal laufender Prototyp mit sehr guten Ergebnissen
  • Aus Text-Prompt entsteht direkt ein druckfertiges Ausmalbild (Line-Art, A4)
  • Verarbeitung vollständig on-premises — keine Eingaben zu US-Cloud
  • Zeigt, dass Hetzner GPU + SDXL eine realistische Alternative zu OpenAI/Midjourney ist
  • Noch nicht öffentlich deployt — nächster Schritt: Demo auf demo.stackschmiede.de