LLM Preisrechner – API-Kosten für GPT, Claude & Gemini berechnen
Berechne in Sekunden, was dich deine LLM-Anwendung kostet. Aktuelle API-Preise für OpenAI (GPT-5, GPT-4o, o1, o3), Anthropic (Claude 4 Opus, Sonnet, Haiku), Google (Gemini 2.5 Pro & Flash), Meta (Llama 3.3), Mistral, DeepSeek, Amazon Nova und xAI Grok — inklusive Prompt-Caching, Monatshochrechnung und direktem Modellvergleich. Die Preise werden live aktualisiert.
Was ist ein LLM Preisrechner?
Ein LLM Preisrechner (engl. LLM Cost Calculator) berechnet die API-Kosten deiner Sprachmodell-Anwendung. Anbieter wie OpenAI, Anthropic oder Google rechnen pro Token ab — getrennt für Input-Tokens (dein Prompt) und Output-Tokens (die Antwort). Unser Rechner zeigt dir auf einen Blick, ob du mit GPT-4o, Claude Sonnet oder Gemini Flash günstiger fährst.
Wie berechne ich die Kosten einer LLM-API?
Die Formel:
Kosten = (Input-Tokens × Input-Preis + Output-Tokens × Output-Preis) / 1.000.000
Beispiel GPT-4o ($2,50 / $10 pro Mio. Tokens), 1.500 Input + 500 Output:
- Input: 1.500 × $2,50 / 1M = $0,00375
- Output: 500 × $10 / 1M = $0,005
- Pro Request: $0,00875 — bei 10.000 Requests/Monat $87,50
Der Rechner übernimmt das automatisch für alle Modelle parallel.
Welche Modelle werden unterstützt?
Preise werden live von llm-prices.com geladen — immer aktuell. Unterstützt:
- OpenAI: GPT-5, GPT-5 Mini, GPT-5 Nano, GPT-4o, GPT-4o-mini, GPT-4.1, o1, o3, o3-mini
- Anthropic: Claude 4 Opus, Claude 4 Sonnet, Claude 3.5 Haiku
- Google: Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.0 Flash, Gemini 1.5 Pro
- Meta: Llama 3.3, Llama 3.1 (8B / 70B / 405B)
- Mistral: Mistral Large, Ministral 3B/8B, Mixtral
- DeepSeek: DeepSeek V3, DeepSeek R1
- Amazon: Nova Micro, Nova Lite, Nova Pro
- xAI: Grok 3, Grok 2
GPT vs. Claude vs. Gemini — welches Modell ist am günstigsten?
Die Preisunterschiede sind massiv — Faktor 100 zwischen günstigstem und teuerstem Modell ist normal. Orientierung:
- Budget-Klasse: Amazon Nova Micro, Gemini 1.5 Flash-8B, Ministral 3B — ab $0,035 / $0,14
- Mainstream: GPT-4o-mini, Claude 3.5 Haiku — $0,15–$1 pro Mio. Tokens
- Premium: GPT-5, Claude 4 Sonnet, Gemini 2.5 Pro — $3–$10 Input
- Reasoning: o1, o3, Claude Opus — $15+ Input, bis $75 Output
Faustregel: Für Klassifizierung und Tag-Generierung reicht die Budget-Klasse. Für Code, Reasoning und Agenten brauchst du Premium.
Was sind Input-, Output- und Cached-Tokens?
- Input-Tokens (Prompt): Alles, was du ans Modell schickst — System-Prompt, User-Nachricht, Historie, Tool-Definitionen
- Output-Tokens (Completion): Die Antwort. Typischerweise 4–5× teurer als Input
- Cached Input-Tokens: OpenAI, Anthropic und Google bieten Prompt Caching — wiederholte System-Prompts sind bis zu 90 % günstiger
Alle drei werden vom Rechner berücksichtigt.
Wie viele Tokens hat mein Prompt?
Bevor du Kosten berechnest, musst du wissen, wie viele Tokens dein Text hat. Dafür haben wir einen separaten Tokenizer gebaut, der deine Texte exakt für alle OpenAI-Modelle und geschätzt für Claude, Gemini & Co. auszählt.
Kosten sparen: 7 Tipps für LLM-APIs
- Kleineres Modell probieren — oft reicht GPT-4o-mini oder Claude Haiku statt Premium
- System-Prompt kürzen — jedes Wort kostet bei jedem Request
- Prompt Caching aktivieren — 50–90 % Ersparnis bei wiederholten Prompts
- Output begrenzen —
max_tokenssetzen, JSON-Schema erzwingen - Batch API nutzen — OpenAI & Anthropic bieten 50 % Rabatt auf async Workloads
- Embeddings statt LLM-Calls für Retrieval und Klassifizierung
- Preise regelmäßig vergleichen — neue Modelle unterbieten die alten fast monatlich
FAQ
Was kostet GPT-4o pro 1.000 Tokens?
$0,0025 Input, $0,01 Output. 1.000 Input-Tokens = 0,25 Cent, 1.000 Output-Tokens = 1 Cent.
Ist Claude günstiger als GPT?
Kommt auf das Modell an. Claude 3.5 Haiku ist oft günstiger als GPT-4o-mini. Claude 4 Opus ist deutlich teurer als GPT-4o. Am besten direkt im Rechner vergleichen.
Welches LLM-Modell ist am günstigsten?
Budget-Sieger sind Amazon Nova Micro, Gemini 1.5 Flash-8B und Ministral 3B. Produktiv fahren die meisten mit GPT-4o-mini oder Claude 3.5 Haiku am besten.
Wie viel kostet ein Chatbot pro Monat?
Chatbot mit 2K Input + 500 Output bei GPT-4o-mini, 10.000 Requests: ca. $3,30/Monat. Bei GPT-5: ca. $120/Monat.
Wie aktuell sind die Preise?
Live-Fetch von llm-prices.com — das Aktualisierungsdatum steht unter dem Rechner.
Berücksichtigt der Rechner Vision, Audio oder Embeddings?
Nein, er fokussiert auf Text-Tokens. Bild- und Audio-Inputs haben separate Preise.