Model Context Protocol (MCP): Wie LLMs mit externen Tools und Daten kommunizieren

Das Model Context Protocol ist ein offener Standard, den Anthropic ursprünglich für die Anbindung externer Systeme an den Chatbot Claude entwickelt hat. Später wurde MCP als offenes Protokoll samt Framework veröffentlicht. Es verbindet große Sprachmodelle (LLMs) mit externen Tools und Datenquellen – und löst damit ein konkretes Integrationsproblem: Statt für jedes Modell und jede Datenquelle eigene, proprietäre Schnittstellen zu bauen, bietet MCP eine einheitliche Kommunikationsschicht.

‍

Was ist das Model Context Protocol?

MCP ist ein Framework, das LLMs zur Laufzeit mit kontextbezogenen Informationen versorgt und – je nach Setup – auch Aktionen in angebundenen Systemen auslösen kann. Das unterscheidet es vom klassischen Betrieb mit „statischem" Modellwissen. In der Praxis funktioniert MCP als bidirektionale Brücke zwischen dem Sprachmodell und externen Kontextsystemen. Das sogenannte „N x M"-Problem – viele individuelle Schnittstellen zwischen vielen Modellen und vielen Datenquellen – wird durch wiederverwendbare MCP-Server reduziert.

Wie funktioniert das Model Context Protocol?

MCP folgt einem Client-Server-Modell mit drei zentralen Komponenten:

MCP Host: Enthält die KI-Anwendung mit dem LLM und dient als Einstiegspunkt für Nutzerinteraktionen.
MCP Client: Übersetzt die Anfragen des LLM in MCP-konforme Requests, leitet sie an externe Komponenten weiter und konvertiert Antworten zurück in ein für das LLM lesbares Format.
MCP Server: Kapseln spezialisierte Funktionen und Datenquellen – etwa Datenbankzugriffe, Webservices oder andere Tools – und stellen diese standardisiert bereit.

MCP arbeitet mit zustandsbehafteten Sessions: Ein Client kommuniziert dabei gezielt mit einem bestimmten Server über eine Session. Für die Nachrichtenübertragung kommt JSON-RPC 2.0 zum Einsatz. Strukturierte Requests und Responses werden inklusive Metadaten und Steuerinformationen ausgetauscht. Als Transportwege nennt das Protokoll stdio (Standard Input/Output) für lokale Ressourcen und SSE (Server-sent Events) für Remote-Ressourcen mit Streaming-Verhalten.

Praxisbeispiele und Anwendungsfälle

Ein typischer Ablauf im MCP-Kontext umfasst drei Schritte: Tool Discovery, Tool-Aufruf und Aktion. Das LLM identifiziert mithilfe des MCP-Clients verfügbare Tools – zum Beispiel eine Datenbankabfrage und einen E-Mail-Versand. Anschließend übermittelt es strukturierte Requests an die zuständigen MCP-Server. Die externen Systeme verarbeiten die Daten und geben das Ergebnis zurück. So kann das Modell nicht nur antworten, sondern in einem kontrollierten Rahmen auch Handlungen in Unternehmenssoftware oder Service-Umgebungen ausführen.

Weitere Anwendungsfälle sind die Anreicherung von Kontextdaten für LLMs durch domänenspezifische Datenquellen sowie das systematische Abrufen von Inhalten aus externen Repositories.

Worauf du achten solltest

Das Protokoll definiert mehrere Sicherheitsprinzipien. Dazu gehören:

Nutzerkontrolle und Einwilligung: Es muss klar sein, welche Daten freigegeben und welche Aktionen ausgeführt werden.
Zugriffsbeschränkungen durch Permissions: Nicht jeder Client erhält Zugriff auf alle Server-Funktionen.
Sichere Behandlung sensibler Informationen: Ausgaben werden so verarbeitet, dass Angriffsrisiken in Anwendungen reduziert werden.

Außerdem wird betont, dass Tool-Beschreibungen nicht blind vertraut werden sollten. Die Absicherung der MCP-Server und der angebundenen externen Tools ist Teil der Gesamtbetrachtung.

Abgrenzung zu RAG

MCP wird häufig mit RAG (Retrieval-Augmented Generation) verglichen. RAG ergänzt die Textgenerierung durch das Abrufen relevanter Informationen aus einer Wissensquelle. MCP ist stärker auf standardisierte, bidirektionale Interaktion und die Ausführung von Aktionen über Tools und Services ausgerichtet. MCP kann damit über die reine Informationsbeschaffung hinausgehen.

Fazit

Das Model Context Protocol schafft eine strukturierte Grundlage, damit LLMs mit externen Tools und Datenquellen kommunizieren können. Durch das Client-Server-Ökosystem, JSON-RPC-2.0-Kommunikation und wiederverwendbare MCP-Server lassen sich Integrationen vereinfachen. KI-Anwendungen erhalten so dynamischen Kontext und – je nach Zielsystem – die Fähigkeit, kontrolliert in reale Abläufe einzugreifen.