LLM Preisrechner – API-Kosten für GPT, Claude & Gemini berechnen

Berechne in Sekunden, was dich deine LLM-Anwendung kostet. Aktuelle API-Preise für OpenAI (GPT-5, GPT-4o, o1, o3), Anthropic (Claude 4 Opus, Sonnet, Haiku), Google (Gemini 2.5 Pro & Flash), Meta (Llama 3.3), Mistral, DeepSeek, Amazon Nova und xAI Grok — inklusive Prompt-Caching, Monatshochrechnung und direktem Modellvergleich. Die Preise werden live aktualisiert.

‍

LLM Preisrechner

Input-Tokens (Prompt) Gecachte Input-Tokens Output-Tokens (Completion) Requests pro Monat

Vergleich

Klick unten auf eine Modell-Zeile, um sie hier zu vergleichen.

Modellpreise (pro Mio. Tokens)

Nur ausgewählte

Tipp: Klick auf eine Zeile fügt das Modell zum Vergleich hinzu.

Modell	Input	(Cached)	Output
Preise werden geladen …

Hinweis: Modelle nutzen unterschiedliche Tokenizer — direkte Token-Preisvergleiche können abweichen.

Was ist ein LLM Preisrechner?

Ein LLM Preisrechner (engl. LLM Cost Calculator) berechnet die API-Kosten deiner Sprachmodell-Anwendung. Anbieter wie OpenAI, Anthropic oder Google rechnen pro Token ab — getrennt für Input-Tokens (dein Prompt) und Output-Tokens (die Antwort). Unser Rechner zeigt dir auf einen Blick, ob du mit GPT-4o, Claude Sonnet oder Gemini Flash günstiger fährst.

‍

Wie berechne ich die Kosten einer LLM-API?

Die Formel:
‍

Kosten = (Input-Tokens × Input-Preis + Output-Tokens × Output-Preis) / 1.000.000‍

Beispiel GPT-4o ($2,50 / $10 pro Mio. Tokens), 1.500 Input + 500 Output:

Input: 1.500 × $2,50 / 1M = $0,00375
Output: 500 × $10 / 1M = $0,005
Pro Request: $0,00875 — bei 10.000 Requests/Monat $87,50

Der Rechner übernimmt das automatisch für alle Modelle parallel.

‍

Welche Modelle werden unterstützt?

Preise werden live von llm-prices.com geladen — immer aktuell. Unterstützt:

OpenAI: GPT-5, GPT-5 Mini, GPT-5 Nano, GPT-4o, GPT-4o-mini, GPT-4.1, o1, o3, o3-mini
Anthropic: Claude 4 Opus, Claude 4 Sonnet, Claude 3.5 Haiku
Google: Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.0 Flash, Gemini 1.5 Pro
Meta: Llama 3.3, Llama 3.1 (8B / 70B / 405B)
Mistral: Mistral Large, Ministral 3B/8B, Mixtral
DeepSeek: DeepSeek V3, DeepSeek R1
Amazon: Nova Micro, Nova Lite, Nova Pro
xAI: Grok 3, Grok 2

‍

GPT vs. Claude vs. Gemini — welches Modell ist am günstigsten?

Die Preisunterschiede sind massiv — Faktor 100 zwischen günstigstem und teuerstem Modell ist normal. Orientierung:

Budget-Klasse: Amazon Nova Micro, Gemini 1.5 Flash-8B, Ministral 3B — ab $0,035 / $0,14
Mainstream: GPT-4o-mini, Claude 3.5 Haiku — $0,15–$1 pro Mio. Tokens
Premium: GPT-5, Claude 4 Sonnet, Gemini 2.5 Pro — $3–$10 Input
Reasoning: o1, o3, Claude Opus — $15+ Input, bis $75 Output

Faustregel: Für Klassifizierung und Tag-Generierung reicht die Budget-Klasse. Für Code, Reasoning und Agenten brauchst du Premium.

‍

Was sind Input-, Output- und Cached-Tokens?

Input-Tokens (Prompt): Alles, was du ans Modell schickst — System-Prompt, User-Nachricht, Historie, Tool-Definitionen
Output-Tokens (Completion): Die Antwort. Typischerweise 4–5× teurer als Input
Cached Input-Tokens: OpenAI, Anthropic und Google bieten Prompt Caching — wiederholte System-Prompts sind bis zu 90 % günstiger

Alle drei werden vom Rechner berücksichtigt.

‍

Wie viele Tokens hat mein Prompt?

Bevor du Kosten berechnest, musst du wissen, wie viele Tokens dein Text hat. Dafür haben wir einen separaten Tokenizer gebaut, der deine Texte exakt für alle OpenAI-Modelle und geschätzt für Claude, Gemini & Co. auszählt.

‍

Kosten sparen: 7 Tipps für LLM-APIs

Kleineres Modell probieren — oft reicht GPT-4o-mini oder Claude Haiku statt Premium
System-Prompt kürzen — jedes Wort kostet bei jedem Request
Prompt Caching aktivieren — 50–90 % Ersparnis bei wiederholten Prompts
Output begrenzen — max_tokens setzen, JSON-Schema erzwingen
Batch API nutzen — OpenAI & Anthropic bieten 50 % Rabatt auf async Workloads
Embeddings statt LLM-Calls für Retrieval und Klassifizierung
Preise regelmäßig vergleichen — neue Modelle unterbieten die alten fast monatlich

‍

FAQ

Was kostet GPT-4o pro 1.000 Tokens?
$0,0025 Input, $0,01 Output. 1.000 Input-Tokens = 0,25 Cent, 1.000 Output-Tokens = 1 Cent.

‍

Ist Claude günstiger als GPT?
Kommt auf das Modell an. Claude 3.5 Haiku ist oft günstiger als GPT-4o-mini. Claude 4 Opus ist deutlich teurer als GPT-4o. Am besten direkt im Rechner vergleichen.

‍

Welches LLM-Modell ist am günstigsten?
Budget-Sieger sind Amazon Nova Micro, Gemini 1.5 Flash-8B und Ministral 3B. Produktiv fahren die meisten mit GPT-4o-mini oder Claude 3.5 Haiku am besten.

‍

Wie viel kostet ein Chatbot pro Monat?
Chatbot mit 2K Input + 500 Output bei GPT-4o-mini, 10.000 Requests: ca. $3,30/Monat. Bei GPT-5: ca. $120/Monat.

‍

Wie aktuell sind die Preise?
Live-Fetch von llm-prices.com — das Aktualisierungsdatum steht unter dem Rechner.

‍

Berücksichtigt der Rechner Vision, Audio oder Embeddings?
Nein, er fokussiert auf Text-Tokens. Bild- und Audio-Inputs haben separate Preise.

‍