Was machst du damit?
Kunde stellt eine kurze Frage, bekommt eine kurze Antwort.
Deutsch braucht mehr Tokens pro Wort als Englisch (1.8 Tokens/Wort).
≈ 360 Tokens
≈ 270 Tokens
Bei einem SaaS mit 1.000 aktiven Nutzern und je 5 Anfragen/Tag wären das 5.000 Anfragen/Tag.
Was kostet welches Modell?
Sortiert nach Tageskosten. Günstigstes Modell grün, teuerstes rot. Die Antwort ist bei allen Anbietern teurer als die Frage.
| Modell | Anfrage | Tag | Monat |
|---|---|---|---|
DeepSeek V4 Flash DeepSeek | $0.000126 | $0,01 | $0,38 |
DeepSeek V4-Pro DeepSeek | $0.000392 | $0,04 | $1,17 |
Mistral Large 3 Mistral | $0.000585 | $0,06 | $1,76 |
Gemini 3 Flash Google | $0.00099 | $0,10 | $2,97 |
Claude Haiku 4.5 Anthropic | $0.00171 | $0,17 | $5,13 |
Gemini 3.5 Flash Google | $0.00297 | $0,30 | $8,91 |
GPT-4o OpenAI | $0.0036 | $0,36 | $10,80 |
Gemini 3.1 Pro Google | $0.00396 | $0,40 | $11,88 |
GPT-5.4 OpenAI | $0.00495 | $0,49 | $14,85 |
Claude Sonnet 4.6 Anthropic | $0.00513 | $0,51 | $15,39 |
Claude Opus 4.8 Anthropic | $0.00855 | $0,86 | $25,65 |
GPT-5.5 OpenAI | $0.0099 | $0,99 | $29,70 |
GPT-5.5 Pro OpenAI | $0,0594 | $5,94 | $178,20 |
Wenn du GPT-5.5 Pro gegen DeepSeek V4 Flash tauschst, sparst du $177,82 pro Monat. Teste vorher, ob das günstigere Modell für deine Aufgabe gut genug ist. Bei einfachen Aufgaben reicht oft das kleinste.
Diese Preisübersicht (Stand 29.05.2026, direkt an den offiziellen Anbieter-Seiten geprüft) darfst du frei zitieren. Du schreibst über KI-Kosten? Wir freuen uns über einen Link auf diese Seite als Quelle: rechenbar.de/rechner/ai-token-rechner.
Wie wir rechnen und wo du sparen kannst +
KI-Anbieter rechnen pro Token ab. Ein Token ist die kleinste Texteinheit und entspricht etwa 4 Zeichen oder ein dreiviertel Wort. Du gibst bei uns Wörter ein, wir rechnen für dich in Tokens um.
Pro Frage zahlst du zwei Beträge: einmal für deine Frage (das nennt man Input) und einmal für die Antwort (das nennt man Output). Die Antwort ist bei den meisten Anbietern 3- bis 6-mal teurer als die Frage, weil das Generieren viel mehr Rechenleistung kostet als das Lesen.
Beispiel mit Claude Sonnet 4.6: Du schickst 555 Wörter Deutsch (1.000 Tokens), bekommst 280 Wörter zurück (500 Tokens):
- Für die Frage: 1.000 × 3 $ ÷ 1.000.000 = 0,003 $
- Für die Antwort: 500 × 15 $ ÷ 1.000.000 = 0,0075 $
- Gesamt: 0,0105 $ pro Frage, bei 100 Fragen pro Tag rund 31,50 $ im Monat
Drei Wege wie du Kosten senken kannst
1. Kleineres Modell wählen: Haiku statt Opus, Flash statt Pro. Das spart oft 80 bis 90 Prozent. Bei einfachen Aufgaben (Text sortieren, Daten extrahieren, kurze Antworten) reicht das kleinste Modell locker. Nur bei komplexen Aufgaben in mehreren Schritten (Code schreiben, lange Analyse, mehrstufige Beratung) brauchst du das grosse Modell.
2. Antwort-Länge begrenzen: Die Antwort ist der teuere Teil. Sag der KI, dass sie kurz antworten soll. Oder begrenze die Antwort-Länge in deinem Programm-Code.
3. Wiederholte Inhalte cachen: Wenn du immer den gleichen Hintergrund-Text mitschickst (z.B. einen Beispiel-Vertrag oder eine Bedienungsanleitung), kann der Anbieter das speichern. Beim nächsten Mal gibt es 90 Prozent Rabatt auf den wiederholten Teil. Heisst Prompt-Caching und wird von Anthropic, OpenAI und Google angeboten.
Wann sich das teure Modell lohnt
Nicht jede Aufgabe braucht das Top-Modell. Bei einfachen Chat-Antworten ist Sonnet meist genauso gut wie Opus, kostet aber nur ein Drittel. Bei komplexem Code, langen Analysen oder Aufgaben in mehreren Schritten zahlt sich Opus oder GPT-5.5 Pro aus, weil die Erfolgsrate höher ist und du weniger nachbessern musst. Rechne nicht nur die Token-Kosten, sondern auch deine eigene Zeit für die Nacharbeit.