KI-Sicherheit (AI Security / AI Safety): Definition, Angriffsformen & Schutzprinzipien

KI-Sicherheit beschreibt Maßnahmen, die sicherstellen, dass KI-Systeme über ihren gesamten Lebenszyklus zuverlässig, kontrollierbar und vor schädlichen Einflüssen geschützt bleiben. Der Begriff geht dabei über reine Genauigkeitsmetriken hinaus: Integrität und Vertraulichkeit von KI-Prozessen stehen ebenso im Fokus wie die Abwehr gezielter Angriffe. Für Unternehmen, die KI-Modelle produktiv einsetzen, ist das kein theoretisches Thema – Angriffe auf Daten, Modelle und Infrastruktur sind konkrete Betriebsrisiken.

‍

Was ist KI-Sicherheit?

KI-Sicherheit (engl. AI Security / AI Safety) umfasst technische Sicherheits- und Zuverlässigkeitsarbeit entlang der gesamten KI-Prozesskette: von der Datenbeschaffung über das Training bis zu Deployment und laufendem Betrieb. Der Begriff schließt zwei Perspektiven ein: AI Security fokussiert auf den Schutz vor externen Angriffen auf Systeme und Datenmodelle. AI Safety adressiert darüber hinaus Risiken, die aus dem Design und Betrieb selbst entstehen – etwa Fehlausrichtung von Zielen, mangelnde Robustheit oder unerwartetes Systemverhalten.

KI-Sicherheit ist damit ausdrücklich mehr als Cybersicherheit. Sie unterscheidet sich auch von KI-Ethik: Während KI-Sicherheit die technische Frage beantwortet, ob ein System korrekt funktioniert und keine Schäden verursacht, adressiert KI-Ethik als soziotechnischer Rahmen Themen wie Fairness, Datenschutz und die gerechte Verteilung von Vorteilen.

Angriffsformen und Risiken im Überblick

KI-Systeme sind entlang ihrer gesamten Prozesskette angreifbar. Die wichtigsten Bedrohungsformen lassen sich in drei Kategorien einteilen:

Angriffe auf Daten:

Data Poisoning: Einbringen schädlicher oder irreführender Datensätze, die Modellqualität beeinträchtigen und zu verzerrten Ergebnissen führen.
Input-Manipulation: Veränderung von Sensorwerten oder Benutzereingaben, um Systemverhalten gezielt zu steuern.
Adversarial Machine Learning: Subtile Änderungen an Bildern oder Text führen zu Fehlklassifikationen oder Fehlprognosen.
Datenpipeline-Risiken: Unbefugter Zugriff oder Modifikation während Datenbeschaffung, -speicherung und -übertragung.

Angriffe auf Modelle:

Model Inversion Attacks: Aus Modell-Outputs werden sensible Trainingsdaten rückerzeugt.
Membership Inference Attacks: Es wird abgeleitet, ob ein bestimmter Datenpunkt Teil des Trainings war.
Exploratory Attacks: KI-Systeme werden systematisch abgetastet, um Funktionsweise, Schwachstellen oder proprietäre Informationen zu erschließen.

Angriffe auf Infrastruktur und Betrieb:

Supply-Chain-Angriffe: Einbringen von bösartigem Code oder Kompromittierung von Software- und Hardwarekomponenten im Deployment.
Resource Exhaustion Attacks: Überlastung durch viele Anfragen oder Inputs, was Leistungseinbußen oder Downtime verursacht.

Hinzu kommen Model Drift and Decay: Veränderte Datenverteilungen, neue Bedrohungslagen oder technologische Obsoleszenz können dazu führen, dass Modelle weniger genau oder verlässlich werden. Auch Fairness- und Bias-Risiken gelten als sicherheitsrelevant, da Verzerrungen ethische, reputative und rechtliche Folgen haben können.

Zentrale Sicherheitsprinzipien

Zwei Grundprinzipien prägen den Schutzansatz in der KI-Sicherheit:

Segmentierung (Compartmentalization): Phasen des KI-Workflows werden voneinander getrennt und in ihrem Zugriff eingeschränkt. Dadurch lässt sich der Schaden bei einer Sicherheitsverletzung begrenzen.

Zero Trust: Internen Nutzern und Systemen wird kein implizites Vertrauen eingeräumt. Stattdessen erfolgt eine kontinuierliche Verifikation über Authentifizierung und Autorisierung.

Für den Schutz im Deployment werden sichere Container, Monitoring und eine Beschränkung des Modellzugriffs auf autorisierte Personen und Prozesse empfohlen. Ergänzend kommen Machine Learning zur Anomalieerkennung sowie Behavioral Analytics zum Einsatz, um ungewöhnliches Verhalten frühzeitig zu erkennen.

Grundpfeiler von AI Safety

AI Safety baut auf drei Kernelementen auf: Robustheit (einschließlich Abwehr feindlicher Angriffe), Alignment (Übereinstimmung der KI-Ziele mit den tatsächlichen Absichten der Entwickler) sowie Interpretierbarkeit im Sinne erklärbarer KI. Kontinuierliche Überwachung ergänzt diese Grundpfeiler: Datenabweichungen werden erkannt, Sicherheitsprotokolle, Warnmeldungen und Fallback-Mechanismen greifen, sodass das System auch außerhalb der Trainingsbedingungen stabil bleibt.

Praxisbeispiele und Anwendungsfälle

In der Praxis zeigt sich KI-Sicherheit besonders dort, wo Modelle geschäftskritische Entscheidungen unterstützen oder sensible Daten verarbeiten:

Finanzwesen: Schutz von Betrugs- und Bonitätsmodellen vor Manipulation, Model Inversion und Datenvergiftung.
Gesundheitswesen: Sicherstellung, dass Diagnosesysteme robuste Ergebnisse liefern und Patientendaten nicht rekonstruierbar sind.
Industrie und Produktion: Absicherung von KI-gestützten Steuerungs- und Wartungssystemen gegen Input-Manipulation und Ausfallrisiken.
Kundenservice und GenAI: Schutz vor Prompt-Injection, Datenabfluss und ungewollter Preisgabe interner Informationen.
Öffentlicher Sektor: Verhinderung von Bias, Missbrauch und unautorisiertem Zugriff auf besonders schützenswerte Daten.

Ein typischer Anwendungsfall ist ein Sprachmodell im Unternehmensumfeld: Ohne klare Zugriffsbeschränkungen, Monitoring und Inhaltefilter kann es sensible Informationen aus internen Quellen unbeabsichtigt wiedergeben. Hier greifen Schutzmaßnahmen wie Segmentierung, Logging, Policy Enforcement und Freigabeprozesse.

Tools und Anbieter

Für die Umsetzung von KI-Sicherheit kommen je nach Einsatzszenario unterschiedliche Werkzeuge und Anbieter in Frage:

Cloud- und Plattformanbieter: AWS, Microsoft Azure und Google Cloud bieten Sicherheits-, Monitoring- und Governance-Funktionen für KI-Workloads.
ML- und MLOps-Tools: Plattformen wie MLflow, Kubeflow oder Weights & Biases unterstützen Versionierung, Nachvollziehbarkeit und Modellüberwachung.
Security- und Observability-Tools: SIEM-, EDR- und Monitoring-Lösungen helfen bei Anomalieerkennung, Incident Response und Zugriffskontrolle.
Open-Source-Bibliotheken: Frameworks für Robustheit, Adversarial Testing und Erklärbarkeit unterstützen die Analyse von Modellverhalten.
Beratungs- und Spezialanbieter: Unternehmen mit Fokus auf AI Governance, Red Teaming und Model Risk Management begleiten die Einführung sicherer KI-Prozesse.

Wichtig ist dabei nicht das einzelne Tool, sondern die Einbettung in ein Gesamtbild aus Richtlinien, Kontrollen, Monitoring und Verantwortlichkeiten.

Fazit

KI-Sicherheit verlangt einen lebenszyklusbezogenen Ansatz. Er schützt Integrität und Vertraulichkeit entlang der gesamten Prozesskette und reduziert gleichzeitig Risiken durch unerwartetes oder nicht beabsichtigtes Systemverhalten. Wer KI produktiv einsetzt, braucht sowohl technische Schutzmaßnahmen gegen externe Angriffe als auch strukturelle Vorkehrungen für Robustheit, Ausrichtung und Transparenz.