10. October 2025

KI-Sicherheit: Große Modelle mit nur 250 Dokumenten angreifbar

Was, wenn der Aufwand, eine KI zu sabotieren, nicht mit ihrer Größe wächst? Eine neue Entdeckung stellt bisherige Annahmen zur KI-Sicherheit auf den Kopf und zeigt eine fundamentale, bisher übersehene Schwachstelle auf.

Die Entdeckung der Schwachstelle

Forscher haben herausgefunden, dass große KI-Modelle überraschend einfach durch Datenvergiftung manipuliert werden können. Statt Tausender Dokumente reichen bereits 250 speziell präparierte Dateien aus, um das Verhalten des Modells zu verändern.

Wie funktioniert die Attacke?

Bei der Datenvergiftung werden schädliche Daten in den Trainingsdatensatz eingeschleust. Die Studie zeigt, dass der Aufwand für solche Angriffe nicht proportional zur Modellgröße zunimmt. Große Modelle wie GPT-ähnliche Systeme sind sogar anfälliger, da sie mehr Daten absorbieren und dadurch leichter beeinflussbar werden.

Implikationen für die KI-Sicherheit

Diese Erkenntnis wirft ein neues Licht auf die Sicherheit von KI-Systemen. Bisherige Annahmen, dass größere Modelle resistenter gegen Manipulationen sind, erweisen sich als falsch. Unternehmen und Entwickler müssen ihre Trainingsprozesse überdenken, um solche Schwachstellen zu schließen.

Ausblick und Empfehlungen

Experten fordern strengere Kontrollen bei der Datenauswahl und den Einsatz von Überwachungstools. Die Entdeckung unterstreicht die Notwendigkeit, KI-Sicherheit als priorisiertes Feld zu behandeln, um zukünftige Risiken zu minimieren.

Weiterlesen auf t3n.de

← Zurück zu Aktuelles

KI-Sicherheit: Große Modelle mit nur 250 Dokumenten angreifbar

Die Entdeckung der Schwachstelle

Wie funktioniert die Attacke?

Implikationen für die KI-Sicherheit

Ausblick und Empfehlungen

Weitere Beiträge

Umsetzung der NIS2-Richtlinie durch die DENIC – was dies für Ihre .de-Domain bedeutet

Neue Wasserform in Uranus und Neptun entdeckt

Top IT-Jobs der Woche