Few-Shot Learning: Definition, Funktionsweise und Anwendungsfälle
Few-Shot Learning (FSL) ist ein maschinelles Lernverfahren, das Modelle befähigt, neue Aufgaben oder Klassen mit nur wenigen gelabelten Beispielen zu erlernen. Der Ansatz ist besonders relevant, wenn Trainingsdaten knapp, schwer zugänglich oder kostenintensiv zu beschaffen sind. Begrifflich liegt FSL zwischen traditionellem überwachten Lernen – das große Datenmengen voraussetzt – und Zero-Shot Learning, bei dem für neue Klassen gar keine Beispiele vorliegen.
Was ist Few-Shot Learning?
Few-Shot Learning bezeichnet die Fähigkeit eines Modells, auf Basis von typischerweise ein bis zehn gelabelten Beispielen pro Klasse zu generalisieren. Das Verfahren baut auf einer „soliden Grundlage allgemeiner Kenntnisse" auf, die durch umfangreiches Vortraining entsteht. Die wenigen Beispiele dienen anschließend dazu, dieses Vorwissen auf eine neue Zielaufgabe auszurichten.
Die Anpassung kann auf zwei Wegen erfolgen: durch Fine-Tuning des Modells mit den wenigen Beispielen oder durch prompt-based Few-Shot Learning, bei dem Beispiele und Instruktionen direkt im Eingabetext übergeben werden – ohne Veränderung der internen Modellgewichte.
Wie funktioniert Few-Shot Learning?
FSL kombiniert Transfer und dateneffiziente Generalisierung. Das Modell nutzt Vorwissen aus dem Pretraining und passt es mit einem „winzigen Bruchteil" der sonst üblichen Datenmenge an. Technisch lassen sich dabei drei Ausprägungen unterscheiden:
- Meta-Learning („learning to learn"): Modelle werden über viele verschiedene Aufgaben trainiert, um neue Fähigkeiten mit wenigen Schritten zu erwerben.
- Prototypen-Ansatz: Jede Klasse wird durch einen mittleren Merkmalsvektor (Prototyp) repräsentiert. Neue Eingaben werden über Distanzmaße diesen Prototypen zugeordnet.
- Embedding- und Ähnlichkeitsvergleiche: Die Ähnlichkeit eines neuen Inputs zu bekannten Beispielen wird im Merkmalsraum geschätzt.
Bei der promptbasierten Variante erhält das Modell Instruktionen und Beispiele als Teil der Eingabe. Ein konkretes Beispiel aus der Sprachverarbeitung: Ein Entwickler stellt drei Beispieläußerungen für eine Kundendienst-Intention wie „cancel my subscription" bereit. Das Modell erkennt das Muster und klassifiziert weitere ähnliche Anfragen – ohne Umtraining. Auch in der Bildverarbeitung eignet sich FSL, um Kategorien mit sehr wenigen gelabelten Bildern zu charakterisieren.
Praxisbeispiele und Anwendungsfälle
Die belegten Anwendungsfelder reichen von medizinischer Diagnostik bis zur Finanzkriminalität:
- Medizinische Bildgebung: Eine Methode zur Erkennung seltener Krankheitsbilder wurde mit nur wenigen hundert gelabelten COVID-positiven Röntgenbildern pro Klasse trainiert. Neue Scans werden anschließend mit bekannten Fällen verglichen.
- Betrugserkennung: FSL-Modelle – darunter graphbasierte Ansätze und Fine-Tuning mit wenigen Beispielen – werden zur Erkennung betrügerischer Transaktionen eingesetzt.
- Seltene genetische Syndrome: In der Medizin unterstützt FSL die Identifikation seltener genetischer Erkrankungen, bei denen Trainingsdaten strukturell begrenzt sind.
Abgrenzung zu verwandten Verfahren
Few-Shot Learning lässt sich klar von benachbarten Ansätzen abgrenzen:
- Traditionelles überwachtes Lernen benötigt große Mengen gelabelter Daten pro Klasse.
- Zero-Shot Learning arbeitet mit null Beispielen und stützt sich ausschließlich auf semantisches Vorwissen aus dem Pretraining.
- One-Shot Learning verwendet genau ein Beispiel pro Klasse; FSL umfasst üblicherweise zwei bis zehn Beispiele.
Der Vorteil gegenüber Zero-Shot Learning: Die wenigen Beispiele „verankern" das Vorwissen und führen in ähnlichen Situationen häufig zu besseren Ergebnissen.
Fazit
Few-Shot Learning ist ein dateneffizienter Ansatz, der starkes Vortraining mit einer kleinen Menge gelabelter Beispiele verbindet. Entscheidend für die Leistungsfähigkeit sind die Qualität der wenigen Beispiele und die Generalisierungsfähigkeit des Basismodells. Für Anwendungsfälle mit knappen oder teuren Daten – etwa in der Medizin oder Betrugserkennung – bietet FSL einen praktikablen Weg, Modelle schnell und gezielt anzupassen.