Zum Inhalt springen
stackschmiede.de
EN
2026 selbst Live Public Beta

DictateStack — Diktat, Snippets und Text-Politur in jedem Feld

Per Push-to-Talk in jedes Textfeld diktieren. Windows-Client verfügbar (kein App-Store) — Android in Arbeit, iOS geplant. Mistral Voxtral auf eigenem EU-Server. Auto-Transforms, Voice-Snippets, Live-Kostenanzeige.

Jahr
2026
Dauer
Seit 2026 in aktiver Entwicklung
Rolle
Konzept, Entwicklung, Deployment (Solo)
Sektor
selbst
Beta Public Beta — Demo-Server, keine Persistierung. Limits: 5 Aufnahmen/h, 30 s pro Aufnahme.

Kurz die Sicherheitsprüfung bestätigen — danach kannst du diktieren.

Self-hosted Captcha — kein Tracking, keine Cookies. Browser-CPU rechnet kurz.

Inferenz: Mistral Voxtral (FR) auf eigenem Hetzner-Server (DE).

Tech-Stack
Rust · Axum (API-Backend, Hetzner DE)Mistral Voxtral · Mistral Small (EU-API)Tauri 2 (Windows-Client, verfügbar)Flutter · Dart (Android in Arbeit, iOS geplant)SQLite · Stripe · JWT

Public Beta — aktive Entwicklung. Funktionen und API können sich kurzfristig ändern. Feedback und Bug-Reports willkommen.

Worum geht es?

Viele Diktat-Funktionen der großen Anbieter senden den gesprochenen Text an US-Server zur Transkription. Für Notizen über Patienten, Mandanten oder interne Prozesse ist das keine Option — und auch im Alltag spricht wenig dafür, jede gesprochene Zeile durch fremde Rechenzentren zu schicken.

DictateStack ist eine kleine, fokussierte Voice-to-Text-App für Windows. Android-Build ist in Arbeit, iOS in Planung. Die Transkription läuft über das eigene Backend auf einem Hetzner-Server in Deutschland — die Modell-Inferenz selbst bei Mistral in Frankreich. Kein US-Pfad, keine Telemetrie, kein App-Store. Updates kommen direkt vom Hersteller.

Drei Dinge, die DictateStack ausmachen

System-weites Diktat Push-to-Talk-Hotkey im Hintergrund — Mic gedrückt halten, sprechen, Text landet im fokussierten Feld. Auch in Drittanbieter-Apps (Mail, Messenger, Notizen, Browser-Formulare). Aktuell für Windows; Android und iOS folgen.

Auto-Transforms Sieben Presets, jederzeit umschaltbar: Light Clean-Up (Füllwörter raus, Groß-/Kleinschreibung), Medium Polish, High Polish, Mail-Style (Anrede, Schluss-Formel), code (Transkript-Cleaner für Code-Blöcke), Kürzen 50 % und Bullet Points. Auto-Apply läuft nach jedem Diktat automatisch, wenn aktiviert.

Voice-Snippets (Shorts) Sprich snippet gruss und es landet Mit freundlichen Grüßen, Steve im Feld. Platzhalter wie {{1}}, {{2}} erlauben parametrisierte Snippets (z. B. snippet anredeHallo {{1}},).

Einblicke in die Desktop-App

Technik

  • Backend — Rust + Axum, schlanke REST-API auf eigenem Hetzner-Server (DE), erreichbar unter dictate.stackschmiede.de
  • Transkription — Mistral voxtral-small-latest über die EU-API von Mistral (FR)
  • Transforms & Polish — Mistral Small / Large; Kosten pro Call im HUD sichtbar
  • Auth — JWT (15 min) + Refresh-Token (7 d), SHA256-gehashte Tokens in SQLite
  • Privacy — Audio nur im RAM (nie auf Disk), Privacy-Mode skippt DB-Insert komplett, Retention 24 h / nie / normal über Header steuerbar
  • Windows-Client — Tauri 2 mit Global-Hotkey, Push-to-Talk, Auto-Paste in fokussiertes Feld; signierter Direkt-Download — kein Microsoft-Store
  • Android — Flutter-Build in Arbeit (Accessibility Service für system-weites Diktat ohne Tastatur-Wechsel)
  • iOS — geplant (Custom Keyboard, später TestFlight-Track)
  • Sprache umschaltbar, Default DE/EN; weitere Sprachen vorbereitet

Status

Public Beta — aktive Entwicklung. Backend-Instanz läuft unter dictate.stackschmiede.de, Tauri-Windows-Client als Direkt-Download verfügbar (Code-Signing in Vorbereitung). Android-Client in Arbeit, iOS-Variante geplant. Es gibt bewusst keine App-Store-Distribution — Updates kommen direkt vom Hersteller.

Nächste Schritte: Custom-Lexicon (Fach-Vokabular) finalisieren, Android-Accessibility-Service aushärten, iOS-Custom-Keyboard prototypisieren, in-Browser-Demo auf dieser Seite (siehe unten).

Positionierung

DictateStack ist bewusst klein gehalten. Kein Assistent, keine KI-Plauderei, keine US-Cloud-Pfade. Ein Werkzeug für Menschen, die Texte schneller tippen wollen — und die Kontrolle über ihre Sprache-zu-Text-Daten behalten möchten.

Distribution ohne App-Store: Tauri-Windows-Build kommt direkt vom Hersteller, keine Plattform-Gatekeeper, keine 30 %-Marge an Apple oder Google. Nachteil ehrlich genannt: kein automatisches Auffinden im Store, kein One-Click-Install, Code-Signing-Vertrauen aufzubauen kostet Zeit.

Ergebnisse

  • Diktat in jedes Textfeld per Global-Hotkey — auch in Drittanbieter-Apps (Mail, Browser, Notizen)
  • Auto-Transforms: Light Clean-Up, Medium/High Polish, Mail-Style, Code, Kürzen 50 %, Bullet Points — jederzeit umschaltbar
  • Voice-Snippets (Shorts): sprich `snippet gruss` und Signatur-Text landet im Feld
  • Eigenes Backend auf Hetzner (DE), Inferenz via Mistral (FR) — kein US-Cloud-Pfad
  • Privacy Mode (kein DB-Insert) und Datenspeicherung wählbar: Normal · 24 h löschen · nie speichern
  • Live-Kostenanzeige pro Call; Plan-Limits transparent (Basic 60 min/100 Polish/200 Transforms · Pro unbegrenzt)
  • Direkt-Download statt App-Store — keine Plattform-Gatekeeper, keine 30 %-Marge
  • Zweisprachig DE/EN ausgeliefert, weitere Sprachen vorbereitet
Für Ihr Unternehmen

Eigenes Diktat-Modul für Ihre App?

Sie haben eine Fach- oder Branchenanwendung, in der Spracheingabe Tippzeit sparen würde — z. B. Pflegedokumentation, Außendienst-Reports, Ticket-Systeme? Ich integriere DictateStack oder eine maßgeschneiderte Variante mit Ihrem Fach-Vokabular. EU-Hosting, ohne Cloud-Zwang.

Integration besprechen