
DictateStack — Diktat, Snippets und Text-Politur in jedem Feld
Per Push-to-Talk in jedes Textfeld diktieren. Windows-Client verfügbar (kein App-Store) — Android in Arbeit, iOS geplant. Mistral Voxtral auf eigenem EU-Server. Auto-Transforms, Voice-Snippets, Live-Kostenanzeige.
Kurz die Sicherheitsprüfung bestätigen — danach kannst du diktieren.
Self-hosted Captcha — kein Tracking, keine Cookies. Browser-CPU rechnet kurz.
Inferenz: Mistral Voxtral (FR) auf eigenem Hetzner-Server (DE).
Public Beta — aktive Entwicklung. Funktionen und API können sich kurzfristig ändern. Feedback und Bug-Reports willkommen.
Worum geht es?
Viele Diktat-Funktionen der großen Anbieter senden den gesprochenen Text an US-Server zur Transkription. Für Notizen über Patienten, Mandanten oder interne Prozesse ist das keine Option — und auch im Alltag spricht wenig dafür, jede gesprochene Zeile durch fremde Rechenzentren zu schicken.
DictateStack ist eine kleine, fokussierte Voice-to-Text-App für Windows. Android-Build ist in Arbeit, iOS in Planung. Die Transkription läuft über das eigene Backend auf einem Hetzner-Server in Deutschland — die Modell-Inferenz selbst bei Mistral in Frankreich. Kein US-Pfad, keine Telemetrie, kein App-Store. Updates kommen direkt vom Hersteller.
Drei Dinge, die DictateStack ausmachen
System-weites Diktat Push-to-Talk-Hotkey im Hintergrund — Mic gedrückt halten, sprechen, Text landet im fokussierten Feld. Auch in Drittanbieter-Apps (Mail, Messenger, Notizen, Browser-Formulare). Aktuell für Windows; Android und iOS folgen.
Auto-Transforms Sieben Presets, jederzeit umschaltbar: Light Clean-Up (Füllwörter raus, Groß-/Kleinschreibung), Medium Polish, High Polish, Mail-Style (Anrede, Schluss-Formel), code (Transkript-Cleaner für Code-Blöcke), Kürzen 50 % und Bullet Points. Auto-Apply läuft nach jedem Diktat automatisch, wenn aktiviert.
Voice-Snippets (Shorts) Sprich snippet gruss und es landet Mit freundlichen Grüßen, Steve im Feld. Platzhalter wie {{1}}, {{2}} erlauben parametrisierte Snippets (z. B. snippet anrede → Hallo {{1}},).
Einblicke in die Desktop-App





Technik
- Backend — Rust + Axum, schlanke REST-API auf eigenem Hetzner-Server (DE), erreichbar unter
dictate.stackschmiede.de - Transkription — Mistral
voxtral-small-latestüber die EU-API von Mistral (FR) - Transforms & Polish — Mistral Small / Large; Kosten pro Call im HUD sichtbar
- Auth — JWT (15 min) + Refresh-Token (7 d), SHA256-gehashte Tokens in SQLite
- Privacy — Audio nur im RAM (nie auf Disk), Privacy-Mode skippt DB-Insert komplett, Retention 24 h / nie / normal über Header steuerbar
- Windows-Client — Tauri 2 mit Global-Hotkey, Push-to-Talk, Auto-Paste in fokussiertes Feld; signierter Direkt-Download — kein Microsoft-Store
- Android — Flutter-Build in Arbeit (Accessibility Service für system-weites Diktat ohne Tastatur-Wechsel)
- iOS — geplant (Custom Keyboard, später TestFlight-Track)
- Sprache umschaltbar, Default DE/EN; weitere Sprachen vorbereitet
Status
Public Beta — aktive Entwicklung. Backend-Instanz läuft unter dictate.stackschmiede.de, Tauri-Windows-Client als Direkt-Download verfügbar (Code-Signing in Vorbereitung). Android-Client in Arbeit, iOS-Variante geplant. Es gibt bewusst keine App-Store-Distribution — Updates kommen direkt vom Hersteller.
Nächste Schritte: Custom-Lexicon (Fach-Vokabular) finalisieren, Android-Accessibility-Service aushärten, iOS-Custom-Keyboard prototypisieren, in-Browser-Demo auf dieser Seite (siehe unten).
Positionierung
DictateStack ist bewusst klein gehalten. Kein Assistent, keine KI-Plauderei, keine US-Cloud-Pfade. Ein Werkzeug für Menschen, die Texte schneller tippen wollen — und die Kontrolle über ihre Sprache-zu-Text-Daten behalten möchten.
Distribution ohne App-Store: Tauri-Windows-Build kommt direkt vom Hersteller, keine Plattform-Gatekeeper, keine 30 %-Marge an Apple oder Google. Nachteil ehrlich genannt: kein automatisches Auffinden im Store, kein One-Click-Install, Code-Signing-Vertrauen aufzubauen kostet Zeit.
Ergebnisse
- Diktat in jedes Textfeld per Global-Hotkey — auch in Drittanbieter-Apps (Mail, Browser, Notizen)
- Auto-Transforms: Light Clean-Up, Medium/High Polish, Mail-Style, Code, Kürzen 50 %, Bullet Points — jederzeit umschaltbar
- Voice-Snippets (Shorts): sprich `snippet gruss` und Signatur-Text landet im Feld
- Eigenes Backend auf Hetzner (DE), Inferenz via Mistral (FR) — kein US-Cloud-Pfad
- Privacy Mode (kein DB-Insert) und Datenspeicherung wählbar: Normal · 24 h löschen · nie speichern
- Live-Kostenanzeige pro Call; Plan-Limits transparent (Basic 60 min/100 Polish/200 Transforms · Pro unbegrenzt)
- Direkt-Download statt App-Store — keine Plattform-Gatekeeper, keine 30 %-Marge
- Zweisprachig DE/EN ausgeliefert, weitere Sprachen vorbereitet
Eigenes Diktat-Modul für Ihre App?
Sie haben eine Fach- oder Branchenanwendung, in der Spracheingabe Tippzeit sparen würde — z. B. Pflegedokumentation, Außendienst-Reports, Ticket-Systeme? Ich integriere DictateStack oder eine maßgeschneiderte Variante mit Ihrem Fach-Vokabular. EU-Hosting, ohne Cloud-Zwang.
Integration besprechen