rechenbar.

AI-Token-Rechner

Wähle eine Vorlage oder trag selbst ein, wie viele Wörter du an die KI schickst und zurückbekommst. Du siehst sofort, was die 13 grössten AI-Modelle bei dir kosten würden. Keine Tokens-Mathematik, ein Vergleich auf einen Blick.

13 Modelle Stand 29.05.2026
13 Modelle · Stand 29.05.2026Preise in US-Dollar

Was machst du damit?

Kunde stellt eine kurze Frage, bekommt eine kurze Antwort.

Deutsch braucht mehr Tokens pro Wort als Englisch (1.8 Tokens/Wort).

≈ 360 Tokens

≈ 270 Tokens

Bei einem SaaS mit 1.000 aktiven Nutzern und je 5 Anfragen/Tag wären das 5.000 Anfragen/Tag.

Was kostet welches Modell?

Sortiert nach Tageskosten. Günstigstes Modell grün, teuerstes rot. Die Antwort ist bei allen Anbietern teurer als die Frage.

ModellAnfrageTagMonat
DeepSeek V4 Flash
DeepSeek
$0.000126$0,01$0,38
DeepSeek V4-Pro
DeepSeek
$0.000392$0,04$1,17
Mistral Large 3
Mistral
$0.000585$0,06$1,76
Gemini 3 Flash
Google
$0.00099$0,10$2,97
Claude Haiku 4.5
Anthropic
$0.00171$0,17$5,13
Gemini 3.5 Flash
Google
$0.00297$0,30$8,91
GPT-4o
OpenAI
$0.0036$0,36$10,80
Gemini 3.1 Pro
Google
$0.00396$0,40$11,88
GPT-5.4
OpenAI
$0.00495$0,49$14,85
Claude Sonnet 4.6
Anthropic
$0.00513$0,51$15,39
Claude Opus 4.8
Anthropic
$0.00855$0,86$25,65
GPT-5.5
OpenAI
$0.0099$0,99$29,70
GPT-5.5 Pro
OpenAI
$0,0594$5,94$178,20
Spar-Tipp

Wenn du GPT-5.5 Pro gegen DeepSeek V4 Flash tauschst, sparst du $177,82 pro Monat. Teste vorher, ob das günstigere Modell für deine Aufgabe gut genug ist. Bei einfachen Aufgaben reicht oft das kleinste.

Diese Preisübersicht (Stand 29.05.2026, direkt an den offiziellen Anbieter-Seiten geprüft) darfst du frei zitieren. Du schreibst über KI-Kosten? Wir freuen uns über einen Link auf diese Seite als Quelle: rechenbar.de/rechner/ai-token-rechner.

Wie wir rechnen und wo du sparen kannst +

KI-Anbieter rechnen pro Token ab. Ein Token ist die kleinste Texteinheit und entspricht etwa 4 Zeichen oder ein dreiviertel Wort. Du gibst bei uns Wörter ein, wir rechnen für dich in Tokens um.

Pro Frage zahlst du zwei Beträge: einmal für deine Frage (das nennt man Input) und einmal für die Antwort (das nennt man Output). Die Antwort ist bei den meisten Anbietern 3- bis 6-mal teurer als die Frage, weil das Generieren viel mehr Rechenleistung kostet als das Lesen.

Beispiel mit Claude Sonnet 4.6: Du schickst 555 Wörter Deutsch (1.000 Tokens), bekommst 280 Wörter zurück (500 Tokens):

  • Für die Frage: 1.000 × 3 $ ÷ 1.000.000 = 0,003 $
  • Für die Antwort: 500 × 15 $ ÷ 1.000.000 = 0,0075 $
  • Gesamt: 0,0105 $ pro Frage, bei 100 Fragen pro Tag rund 31,50 $ im Monat

Drei Wege wie du Kosten senken kannst

1. Kleineres Modell wählen: Haiku statt Opus, Flash statt Pro. Das spart oft 80 bis 90 Prozent. Bei einfachen Aufgaben (Text sortieren, Daten extrahieren, kurze Antworten) reicht das kleinste Modell locker. Nur bei komplexen Aufgaben in mehreren Schritten (Code schreiben, lange Analyse, mehrstufige Beratung) brauchst du das grosse Modell.

2. Antwort-Länge begrenzen: Die Antwort ist der teuere Teil. Sag der KI, dass sie kurz antworten soll. Oder begrenze die Antwort-Länge in deinem Programm-Code.

3. Wiederholte Inhalte cachen: Wenn du immer den gleichen Hintergrund-Text mitschickst (z.B. einen Beispiel-Vertrag oder eine Bedienungsanleitung), kann der Anbieter das speichern. Beim nächsten Mal gibt es 90 Prozent Rabatt auf den wiederholten Teil. Heisst Prompt-Caching und wird von Anthropic, OpenAI und Google angeboten.

Wann sich das teure Modell lohnt

Nicht jede Aufgabe braucht das Top-Modell. Bei einfachen Chat-Antworten ist Sonnet meist genauso gut wie Opus, kostet aber nur ein Drittel. Bei komplexem Code, langen Analysen oder Aufgaben in mehreren Schritten zahlt sich Opus oder GPT-5.5 Pro aus, weil die Erfolgsrate höher ist und du weniger nachbessern musst. Rechne nicht nur die Token-Kosten, sondern auch deine eigene Zeit für die Nacharbeit.

§
Dieser Rechner berechnet Schätzkosten für AI-API-Aufrufe in US-Dollar. Preise und Tokenisierung können sich kurzfristig ändern und je nach Kontext (z. B. Long-Context-Aufpreis bei einigen Modellen, Cached-Input-Rabatte, Batch-Pricing) abweichen. Die Wörter-zu-Tokens-Konversion (1,8 Tokens/Wort Deutsch, 1,3 Tokens/Wort Englisch) ist eine Faustregel anbieter-übergreifend. Tatsächliche Token-Zahlen können um 10-20 % abweichen. Keine Gewähr für die Richtigkeit der Tabelle. Vor Budget-Entscheidungen bitte direkt beim Anbieter prüfen.

Häufige Fragen

Was ist ein Token? +
Ein Token ist die kleinste Einheit, in der KI-Anbieter Texte zerlegen und abrechnen. Ein Token entspricht ungefähr 4 Zeichen oder einem dreiviertel Wort im Englischen. Im Deutschen ist ein Token etwas kürzer, weil deutsche Wörter länger sind. Du brauchst dich um Tokens nicht zu kümmern, weil wir intern für dich umrechnen.
Warum Wörter eingeben statt Tokens? +
Wer ein Programm baut, denkt vielleicht in Tokens. Alle anderen wissen aber, wie viele Wörter ein typischer Chat oder eine typische Frage hat. Wir nehmen dir die Umrechnung ab. Faustregel: 1 deutsches Wort sind etwa 1,8 Tokens, 1 englisches Wort etwa 1,3 Tokens.
Warum ist die Antwort teurer als die Frage? +
Eine Antwort zu generieren ist für die KI viel rechenintensiver als deine Frage zu lesen. Deshalb sind Output-Preise bei Claude und ChatGPT 5- bis 6-mal höher als Input-Preise. Bei DeepSeek ist der Unterschied kleiner. Wer sparen will, sollte die KI bitten kurze Antworten zu geben.
Wie aktuell sind die Preise? +
Stand 29.05.2026, alle Preise direkt von den Webseiten der Anbieter geprüft. Claude Opus 4.8 ist seit dem 28.05.2026 verfügbar, DeepSeek V4-Pro hat seit dem 22.05.2026 neue Preise. Wir prüfen alle drei Monate oder wenn ein Anbieter ein neues Modell veröffentlicht. Vor wichtigen Entscheidungen aber bitte selbst beim Anbieter nachschauen, weil die Preise sich schnell ändern.
Wie spare ich am meisten? +
Drei Hebel: Erstens, ein kleineres Modell wählen (Haiku statt Opus, Flash statt Pro). Das spart oft 80 bis 90 Prozent und reicht für einfache Aufgaben locker. Zweitens, die Antwort-Länge begrenzen. Drittens, wenn du den gleichen Hintergrund-Text immer wieder mitschickst, fragen ob dein Anbieter Caching unterstützt. Bei Anthropic gibt es dann 90 Prozent Rabatt auf wiederholte Inhalte.
Welche Modelle fehlen hier? +
Wir zeigen die 13 wichtigsten Modelle der 5 grössten Anbieter. Nicht drin sind: ältere Versionen (Claude 3, GPT-4 Standard, Gemini 1.5), Modelle für Audio oder Bilder (Whisper, DALL-E), kostenlose Modelle die du selbst betreibst (Llama, Qwen). Letztere haben eine andere Kostenstruktur, weil du die Server zahlst statt pro Token.
Warum US-Dollar und nicht Euro? +
Alle grossen KI-Anbieter rechnen weltweit in US-Dollar ab. Du bezahlst auch in US-Dollar (deine Kreditkarte rechnet dann um). Aktueller Kurs ist 1 Euro entspricht etwa 1,08 US-Dollar. Bei einer Schätzung wäre eine Euro-Anzeige nur ungenauer, weil der Wechselkurs schwankt.
Verwandte Rechner
Arbeitsrecht
Stundenlohn
Steuer
MwSt-Rechner
Steuer
AfA-Rechner
Finanzen
Rendite