Federated Learning: Wie KI-Modelle ohne zentralen Datenaustausch trainieren
Federated Learning (FL) ermöglicht es, ein gemeinsames KI-Modell über mehrere Geräte oder Organisationen hinweg zu trainieren – ohne dass die zugrundeliegenden Rohdaten den jeweiligen Entstehungsort verlassen. Das ist besonders relevant für Branchen, in denen Datenschutz und Compliance strenge Grenzen setzen, etwa im Gesundheitswesen oder Finanzsektor. Statt alle Datensätze zentral zu bündeln, wird das Modell zu den Daten gebracht – nicht umgekehrt.
Was ist Federated Learning?
Federated Learning ist ein Ansatz des maschinellen Lernens, bei dem mehrere Clients – also Geräte oder Server – gemeinsam ein globales KI-Modell trainieren, ohne ihre lokalen Trainingsdaten direkt auszutauschen. Jeder Client trainiert lokal auf seinem eigenen Datensatz und sendet anschließend nur Modellaktualisierungen, etwa Gewichtsanpassungen oder Gradienten, an einen zentralen Server. Dieser aggregiert die Beiträge aller Clients zu einem verbesserten globalen Modell und verteilt es erneut. Sensible Informationen verbleiben dabei typischerweise beim jeweiligen Client.
Wie funktioniert Federated Learning?
Der Ablauf folgt einem wiederkehrenden Muster aus mehreren klar definierten Schritten:
- Initialisierung: Der zentrale Server erstellt ein globales Modell und überträgt es zusammen mit Konfigurationsparametern – darunter Hyperparameter und die Anzahl der Trainings-Epochen – an die Clients.
- Lokales Training: Jeder Client trainiert das Modell mit seinen eigenen Daten über die vorgegebene Anzahl an Epochen.
- Update-Übermittlung: Nach dem Training senden die Clients aktualisierte Modellparameter oder berechnete Gradienten zurück an den Server. Rohdaten oder vollständig trainierte lokale Modelle werden nicht übertragen.
- Aggregation: Der Server führt die Updates zusammen – typischerweise über Federated Averaging, eine gewichtete Mittelwertbildung der Client-Updates.
- Iteration: Der Prozess wiederholt sich, bis das globale Modell ausreichend konvergiert.
Ein definiertes Kommunikationsprotokoll regelt dabei, in welcher Form Clients und Server Informationen austauschen. In großen Netzwerken mit vielen Clients ist eine effiziente und sichere Kommunikation ein kritischer Faktor.
Varianten: Horizontal, Vertikal und Transfer
FL lässt sich in drei Varianten unterscheiden. Horizontales föderiertes Lernen liegt vor, wenn alle Parteien denselben Merkmalsraum nutzen, aber unterschiedliche Dateninstanzen besitzen – etwa gleiche Eingabeattribute, aber verschiedene Nutzerdaten. Vertikales föderiertes Lernen beschreibt den Fall, in dem die Parteien dieselben Dateninstanzen teilen, aber unterschiedliche Merkmale messen, zum Beispiel dieselben Kunden aus verschiedenen Perspektiven. Beim Federated Transfer Learning liegen sowohl unterschiedliche Merkmale als auch unterschiedliche Dateninstanzen vor; Wissen aus einer Quellaufgabe wird genutzt, um eine verwandte Zielaufgabe im föderierten Setting zu verbessern.
Vorteile von Federated Learning
- Datenschutz und Compliance: Sensible Daten verbleiben auf den Clients. Das reduziert das Risiko, personenbezogene Informationen bei Übertragung oder Speicherung offenzulegen, und unterstützt die Einhaltung von Anforderungen wie der DSGVO (GDPR).
- Datenhoheit: Datenflüsse werden verkürzt; die Kontrolle über die Daten bleibt bei den beteiligten Organisationen.
- Zugang zu verteilten Datenquellen: FL erschließt Daten, die sonst isoliert und ungenutzt blieben.
- Geringere Kommunikationskosten: Modellupdates sind in der Regel kleiner als vollständige Datensätze, was die Übertragungslast reduziert.
Worauf du achten solltest
Federated Learning löst Datenschutzprobleme nicht vollständig. Modellupdates können trotzdem Informationen über die zugrundeliegenden Daten preisgeben. Fortgeschrittene Angriffe wie Inferenzangriffe oder Datenvergiftungsangriffe stellen reale Sicherheitsrisiken dar. Als Gegenmaßnahmen werden Differential Privacy (differenzieller Datenschutz) und sichere Aggregationsverfahren eingesetzt – beide können jedoch mit Zielkonflikten verbunden sein, etwa zwischen Datenschutzniveau und Modellqualität. Zusätzlich beeinflussen heterogene Datenverteilungen sowie unterschiedliche Rechen- und Netzwerkbedingungen der Clients die Trainingsqualität und die Konvergenzgeschwindigkeit.
Fazit
Federated Learning ermöglicht kooperatives Modelltraining über verteilte Datenquellen hinweg, ohne Rohdaten zentral zusammenzuführen. Der Ansatz stärkt Datenschutz, Datenhoheit und Compliance-Fähigkeit – stellt aber gleichzeitig neue Anforderungen an Kommunikationsarchitektur, Aggregationsverfahren und Angriffssicherheit. Wer FL einsetzt, muss diese Wechselwirkungen von Anfang an einplanen.