Preise aktuell
Verifiziert 2026-05-26 — 34 Quellen

💰 Kostenzähler

API-Kosten im Dispatcher-System — verifiziert 2026-05-26

Teuerste Pipeline
~$0.63/h
Flaneur Live (Claude + TTS alle 30s)
Günstigste Option
$0.15/MTok
gpt-4o-mini Input
Services & Preise
Anthropic Claude ab $1.00/MTok
ModellInput $/MTokOutput $/MTokNotes
claude-opus-4-7$5.00$25.00
claude-sonnet-4-6$3.00$15.00Flaneur primär
claude-haiku-4-5$1.00$5.00Pipecat Voice
Batch (alle)50% Rabatt50% Rabattasync
Cache Write1.25× InputPrompt-Cache
Cache Hit0.10× InputPrompt-Cache
Nutzung im Code
cockpit/sancho_cockpit_server.py:393
claude-3-5-sonnet-latest — Meeting-Transkript-Analyse
flaneur/flaneur_live_loop.py:441–458
claude-sonnet-4-6 — Primärpfad alle 30s, ~200 Token
reisebericht/reisebericht_v2.py:449–454
claude-opus-4-7 — ~1500 Token Output pro Bericht
pipecat_server.py:119–126
claude-haiku-4-5 — Voice-Turns, max 256 Token Streaming
OpenAI ab $0.15/MTok
ModellInputCachedOutput
gpt-4o$2.50/MTok$1.25/MTok$10.00/MTok
gpt-4o-mini$0.15/MTok$0.60/MTok
o1$15.00/MTok$60.00/MTok
Speech-to-TextPreisNotes
gpt-4o-transcribe$0.006/MinSTT Standard
gpt-realtime-whisper$0.017/MinRealtime-Modus
Realtime AudioPreis~Min-Äquivalent
Audio Input$32.00/MTok~$0.06/Min
Audio Output$64.00/MTok~$0.24/Min
Nutzung im Code
cockpit/sancho_cockpit_server.py:393
gpt-4o-transcribe — STT Meeting-Aufnahmen
cockpit/sancho_cockpit_server.py:449
gpt-4o-mini — Transkript-Analyse nach Meeting
cockpit/sancho_cockpit_server.py:903, 910
gpt-4o-transcribe — Push-to-Talk
cockpit/sancho_cockpit_server.py:969, 973
gpt-4o-transcribe — Victor Input Polishing
cockpit/sancho_cockpit_server.py:977
gpt-4o-mini — Text-Polishing
cockpit/sancho_cockpit_server.py:1288, 1299
gpt-4o-realtime-preview — WebRTC SDP-Proxy
cockpit/sancho_cockpit_server.py:3341, 3347
gpt-4o-transcribe — voice_v2 WebSocket
cockpit/sancho_cockpit_server.py:3472
gpt-4o-realtime-preview-2024-12-17 — Realtime WS-Proxy
flaneur/flaneur_live_loop.py:462–474
gpt-4o — Fallback wenn Claude nicht antwortet, alle 30s
Rat der Weisen/rdw.py:454
gpt-4o — Rat-Anfragen bis 4000 Token
Rat der Weisen/rdw.py:2102, 2121
gpt-4o — Multi-Runden-Eval Phase 2
ElevenLabs ab $0.05/1k Zeichen
ServiceModellPreis
TTS Standardmultilingual_v2 / v3$0.10/1.000 Zeichen
TTS Flash/TurboFlash / Turbo$0.05/1.000 Zeichen
TTS Turbo v2.5turbo_v2_5$0.05/1.000 Zeichen
ConvAI$0.08/Minute
STT ScribeScribe v1 / v2$0.22/Stunde
Nutzung im Code
cockpit/sancho_cockpit_server.py:1419–1422
multilingual_v2 — TTS-Endpoint
cockpit/sancho_cockpit_server.py:2328
ConvAI — signed URL
flaneur/flaneur_live_loop.py:478–498
multilingual_v2 — ~80–100 Wörter alle 30s
reisebericht/reisebericht_v2.py:481–498
v3 — 2× pro Bericht, ~620 Wörter
watson_speak.py:27–44
multilingual_v2 — Watson-Sprachausgabe
pipecat_server.py:128–133
turbo_v2_5 — Streaming pro Turn
watson_voices/02_clone_and_generate.py:42, 67
v3 — Einmalig Voice-Klonung
watson_voices/03_pumuckl_ivc.py:32, 78
v3 — Einmalig Voice-Klonung
Deepgram ⚠️ Preis ausstehend
ServicePreisStatus
nova-2 / nova-3 STT ⚠️ Preis nicht verifiziert
Streaming (WebSocket) ⚠️ Preis nicht verifiziert
Nutzung im Code
cockpit/sancho_cockpit_server.py:239–240
nova-2 — Meeting-Aufnahmen (Minuten bis Stunden)
cockpit/sancho_cockpit_server.py:1087
nova-3 — Push-to-Talk Einzelaufnahmen
cockpit/sancho_cockpit_server.py:1332
nova-2 — WebSocket Streaming-Proxy
pipecat_server.py:112–116
DeepgramSTTService — 16kHz Mono Streaming
Google Gemini ab $0.10/MTok
ModellInputOutputNotes
gemini-2.5-pro $1.25 (≤200k)
$2.50 (>200k)
$10.00 (≤200k)
$15.00 (>200k)
Rat primär
gemini-2.5-flash $0.30/MTok $2.50/MTok Healthcheck
gemini-2.0-flash $0.10/MTok $0.40/MTok ⚠️ deprecated 01.06.2026
Batch/Flex (alle) 50% günstiger 50% günstiger async
Nutzung im Code
Rat der Weisen/rdw.py:519
gemini-2.5-pro — Rat-Anfragen bis 4000 Token
Rat der Weisen/rdw.py:1905
gemini-2.5-flash — Healthcheck-Fallback
Rat der Weisen/rdw.py:2108–2109
gemini-2.5-pro — Multi-Runden-Eval
Perplexity Sonar ab $1.00/MTok
ModellInput $/MTokOutput $/MTokPer-Request (medium)
sonar$1.00$1.00$8.00/1k req
sonar-pro$3.00$15.00$10.00/1k req
sonar-deep-research$2.00$8.00$5.00/1k req
⚠️ Hochkosten-Pfade (Top 5)
#1
Flaneur Live
claude-sonnet-4-6 + Sprachsynthese multilingual_v2 — alle 30 Sekunden
~$0.63 / Stunde
#2
Reisebericht
claude-opus-4-7 (~1500 Token Out) + 2× Sprachsynthese v3 (~620 Wörter)
~$0.16 / Bericht
#3
Rat der Weisen
gpt-4o + gemini-2.5-pro + Claude parallel (bis 4000 Token je)
~$0.08 / Anfrage (Light-Modus; Heavy: höher)
#4
OpenAI Realtime
gpt-4o-realtime-preview — Audio I/O beide Richtungen
~$0.30 / Minute Gespräch
#5
Pipecat Voice
Deepgram STT (⚠️ ausstehend) + claude-haiku-4-5 + Sprachsynthese turbo
teils unbekannt (Deepgram-Preis fehlt)
🧮 Live-Rechner
Flaneur Live
Fahrtstunden / Woche
5h
Kosten / Woche $3.15
Reisebericht
Berichte / Monat
Kosten / Monat $1.60
Rat der Weisen
Anfragen / Tag
Kosten / Monat $7.20
OpenAI Realtime
Minuten / Tag
10 Min
Kosten / Monat $90.00
🏠 Lokale Services — kein Cloud-Metering
💡
Philips Hue
Lokal LAN
🤖
Humboldt (Roborock)
Lokal LAN
📺
LG TV WebOS
Lokal LAN
😴
ResMed AirSense 11
myAir EU Cloud
📎 Quellen
34 verifizierte Quellen