Ausmalbild-Generator (KI)
Lokal laufender Proof-of-Concept: textbasierte Eingabe → druckbares Ausmalbild. Komplett auf eigener Hardware, ohne OpenAI, ohne Cloud-Upload.
- Jahr
- 2026
- Dauer
- Laufendes Experiment
- Rolle
- Solo-Entwickler (KI-augmented) — ML-Pipeline, Backend, UI, Deployment-Konzept
- Sektor
- selbst
Idee
Ausmalbilder zu konkreten Themen sind in Kitas, Schulen und Familien beliebt — aber meist nur generische Stock-Motive verfügbar. Wer mal ein Ausmalbild zu einem speziellen Wunsch („Drachen mit Astronautenhelm”, „Pferd auf Mondoberfläche”, „Lieblings-Tier mit Krone”) braucht, findet selten passendes Material. Vorhandene KI-Tools sind dabei oft:
- Cloud-gebunden (Eingaben an US-Server)
- Pay-per-Bild teuer bei häufiger Nutzung
- Schwer zu steuern auf das gewünschte Line-Art-Format
Dieses Experiment zeigt, wie es lokal und on-prem geht.
Lösung (lokaler Proof-of-Concept)
Eine schlanke Pipeline mit Text-Prompt als Eingabe:
- Prompt: Nutzer:in tippt z.B. „Drache mit Krone vor Burg”.
- Prompt-Engineering: System ergänzt Stil-Anker („coloring book line art, black and white, bold outlines, no shading, A4 portrait”).
- SDXL-Rendering: Stable Diffusion XL mit Line-Art-LoRA generiert das Bild.
- Post-Processing: Linien-Schärfung, Weißflächen-Reinigung, Kontrast-Optimierung.
- PDF-Output: A4-druckfertig, randlos.
[Text-Prompt] → [Stil-Anker hinzufügen] → [SDXL + LoRA] → [Post] → [PDF]
↑ ↓
└────────── alles lokal / on-prem (DE) ─────────────────────┘Status heute
- Lokal: läuft, liefert gute Ergebnisse bei Test-Bildern.
- Nicht deployt: noch keine öffentliche Demo. Geplanter nächster Schritt: Hetzner GPU (GEX44, ~200 €/Monat, mit socket-activation auf ~20-50 €/Monat effektiv reduzierbar).
- Keine Kunden: dies ist ein Lern- und Showcase-Projekt für KI-Integration auf Hetzner, kein Produkt in Vermarktung.
Was das Projekt zeigt
- KI-Integration ohne OpenAI: Ich habe die komplette Pipeline selbst umgesetzt — nicht nur einen API-Wrapper.
- ControlNet-Verständnis: Vorverarbeitung ist der Löwenanteil der Qualität.
- Hetzner-GPU-Kosten-Modell: socket-activation macht on-prem wirtschaftlich sinnvoll.
- Realistischer Scope eines Solo-Projekts mit KI-Assist.
Warum für Sie interessant?
Weil genau dieselbe Architektur — lokaler Workflow, keine US-Cloud, kosten-predictable — für andere Domänen funktioniert: Dokumenten-Verarbeitung, Vertrags-Analyse, Patenten-Recherche, interne Wissens-Bots mit RAG.
Wenn Sie für Ihren Use-Case etwas Ähnliches wollen — siehe Paket Souveräne KI-Integration.
Ergebnisse
- Lokal laufender Prototyp mit sehr guten Ergebnissen
- Aus Text-Prompt entsteht direkt ein druckfertiges Ausmalbild (Line-Art, A4)
- Verarbeitung vollständig on-premises — keine Eingaben zu US-Cloud
- Zeigt, dass Hetzner GPU + SDXL eine realistische Alternative zu OpenAI/Midjourney ist
- Noch nicht öffentlich deployt — nächster Schritt: Demo auf demo.stackschmiede.de