💰 Kostenzähler

Anthropic Claude ab $1.00/MTok ▼

Modell	Input $/MTok	Output $/MTok	Notes
claude-opus-4-7	$5.00	$25.00	—
claude-sonnet-4-6	$3.00	$15.00	Flaneur primär
claude-haiku-4-5	$1.00	$5.00	Pipecat Voice
Batch (alle)	50% Rabatt	50% Rabatt	async
Cache Write	1.25× Input	—	Prompt-Cache
Cache Hit	0.10× Input	—	Prompt-Cache

Nutzung im Code

cockpit/sancho_cockpit_server.py:393

claude-3-5-sonnet-latest — Meeting-Transkript-Analyse

flaneur/flaneur_live_loop.py:441–458

claude-sonnet-4-6 — Primärpfad alle 30s, ~200 Token

reisebericht/reisebericht_v2.py:449–454

claude-opus-4-7 — ~1500 Token Output pro Bericht

pipecat_server.py:119–126

claude-haiku-4-5 — Voice-Turns, max 256 Token Streaming

OpenAI ab $0.15/MTok ▼

Modell	Input	Cached	Output
gpt-4o	$2.50/MTok	$1.25/MTok	$10.00/MTok
gpt-4o-mini	$0.15/MTok	—	$0.60/MTok
o1	$15.00/MTok	—	$60.00/MTok

Speech-to-Text	Preis	Notes
gpt-4o-transcribe	$0.006/Min	STT Standard
gpt-realtime-whisper	$0.017/Min	Realtime-Modus

Realtime Audio	Preis	~Min-Äquivalent
Audio Input	$32.00/MTok	~$0.06/Min
Audio Output	$64.00/MTok	~$0.24/Min

Nutzung im Code

cockpit/sancho_cockpit_server.py:393

gpt-4o-transcribe — STT Meeting-Aufnahmen

cockpit/sancho_cockpit_server.py:449

gpt-4o-mini — Transkript-Analyse nach Meeting

cockpit/sancho_cockpit_server.py:903, 910

gpt-4o-transcribe — Push-to-Talk

cockpit/sancho_cockpit_server.py:969, 973

gpt-4o-transcribe — Victor Input Polishing

cockpit/sancho_cockpit_server.py:977

gpt-4o-mini — Text-Polishing

cockpit/sancho_cockpit_server.py:1288, 1299

gpt-4o-realtime-preview — WebRTC SDP-Proxy

cockpit/sancho_cockpit_server.py:3341, 3347

gpt-4o-transcribe — voice_v2 WebSocket

cockpit/sancho_cockpit_server.py:3472

gpt-4o-realtime-preview-2024-12-17 — Realtime WS-Proxy

flaneur/flaneur_live_loop.py:462–474

gpt-4o — Fallback wenn Claude nicht antwortet, alle 30s

Rat der Weisen/rdw.py:454

gpt-4o — Rat-Anfragen bis 4000 Token

Rat der Weisen/rdw.py:2102, 2121

gpt-4o — Multi-Runden-Eval Phase 2

ElevenLabs ab $0.05/1k Zeichen ▼

Service	Modell	Preis
TTS Standard	multilingual_v2 / v3	$0.10/1.000 Zeichen
TTS Flash/Turbo	Flash / Turbo	$0.05/1.000 Zeichen
TTS Turbo v2.5	turbo_v2_5	$0.05/1.000 Zeichen
ConvAI	—	$0.08/Minute
STT Scribe	Scribe v1 / v2	$0.22/Stunde

Nutzung im Code

cockpit/sancho_cockpit_server.py:1419–1422

multilingual_v2 — TTS-Endpoint

cockpit/sancho_cockpit_server.py:2328

ConvAI — signed URL

flaneur/flaneur_live_loop.py:478–498

multilingual_v2 — ~80–100 Wörter alle 30s

reisebericht/reisebericht_v2.py:481–498

v3 — 2× pro Bericht, ~620 Wörter

watson_speak.py:27–44

multilingual_v2 — Watson-Sprachausgabe

pipecat_server.py:128–133

turbo_v2_5 — Streaming pro Turn

watson_voices/02_clone_and_generate.py:42, 67

v3 — Einmalig Voice-Klonung

watson_voices/03_pumuckl_ivc.py:32, 78

v3 — Einmalig Voice-Klonung

Deepgram ⚠️ Preis ausstehend ▼

Service	Preis	Status
nova-2 / nova-3 STT	—	⚠️ Preis nicht verifiziert
Streaming (WebSocket)	—	⚠️ Preis nicht verifiziert

Nutzung im Code

cockpit/sancho_cockpit_server.py:239–240

nova-2 — Meeting-Aufnahmen (Minuten bis Stunden)

cockpit/sancho_cockpit_server.py:1087

nova-3 — Push-to-Talk Einzelaufnahmen

cockpit/sancho_cockpit_server.py:1332

nova-2 — WebSocket Streaming-Proxy

pipecat_server.py:112–116

DeepgramSTTService — 16kHz Mono Streaming

Google Gemini ab $0.10/MTok ▼

Modell	Input	Output	Notes
gemini-2.5-pro	$1.25 (≤200k) $2.50 (>200k)	$10.00 (≤200k) $15.00 (>200k)	Rat primär
gemini-2.5-flash	$0.30/MTok	$2.50/MTok	Healthcheck
gemini-2.0-flash	$0.10/MTok	$0.40/MTok	⚠️ deprecated 01.06.2026
Batch/Flex (alle)	50% günstiger	50% günstiger	async

Nutzung im Code

Rat der Weisen/rdw.py:519

gemini-2.5-pro — Rat-Anfragen bis 4000 Token

Rat der Weisen/rdw.py:1905

gemini-2.5-flash — Healthcheck-Fallback

Rat der Weisen/rdw.py:2108–2109

gemini-2.5-pro — Multi-Runden-Eval

Perplexity Sonar ab $1.00/MTok ▼

Modell	Input $/MTok	Output $/MTok	Per-Request (medium)
sonar	$1.00	$1.00	$8.00/1k req
sonar-pro	$3.00	$15.00	$10.00/1k req
sonar-deep-research	$2.00	$8.00	$5.00/1k req