5. Juni 2025
Das Amt der Europäischen Union für geistiges Eigentum (EUIPO) hat kürzlich eine umfassende Studie zu den verschiedenen Zusammenhängen zwischen generativer künstlicher Intelligenz (‘GenAI’) und dem Urheberrecht veröffentlicht. Die Studie fasst viele der derzeit diskutierten rechtlichen Fragen zusammen. Außerdem enthält sie einen detaillierten Überblick über mögliche technische Lösungen für (1) die Erklärung eines Opt-outs gegen das Training von KI mit urheberrechtlich geschützten Inhalten und (2) die Kennzeichnung von GenAI-EOutput in einem maschinenlesbaren Format und als s künstlich generiert erkennbar .
Nach der EU-Urheberrechtsrichtlinie ist das Training von GenAI grundsätzlich als „Text- und-Daten- Mining“ (‘TDM‘) zulässig, es sei denn, die Rechteinhaber haben sich die Nutzung der Werke ausdrücklich vorbehalten (sogenannte Opt-outs). Eine solche Vorbehaltserklärung muss in „geeigneter Weise“ erfolgen, beispielsweise durch „maschinenlesbare Mittel“ im Falle von im Internet öffentlich zugänglich gemachten Inhalten.
Darüber hinaus müssen Anbieter und Nutzer der meisten GenAI-Modelle bald Transparenzpflichten gemäß der EU KI-Verordnung (‘ KI-VO’) erfüllen. Insbesondere müssen Anbieter von GenAI-Systemen sicherstellen, dass er Output des KI-Systems in einem maschinenlesbaren Format gekennzeichnet und als künstlich generiert oder manipuliert erkennbar sind.
Weder das EU-Urheberrecht noch die KI-VO legen fest, wie diese Anforderungen in der Praxis erfüllt werden können. Es überrascht daher kaum, dass derzeit extreme Rechtsunsicherheit hinsichtlich beider Anforderungen besteht.
TDM spielt eine zentrale Rolle bei der Entwicklung von GenAI-Modellen. Bislang gibt es jedoch keinen etablierten Marktstandard, ein TDM-Opt-out zu erklären. Dies stellt Rechteinhaber, Anbieter von Trainingsdatensätzen oder GenAI-Entwickler vor enorme Herausforderungen.
Das EUIPO vergleicht mehrere technische Lösungen und unterscheidet zwischen rechtlichen und technischen Opt-outs. Zusammenfassend liefert das EUIPO einen differenzierten Vergleich mit über 17 verschiedenen Kriterien wie Typologie des Opt-outs basierend auf Standort/Datei/Werk/Repertoire, Vielseitigkeit, Robustheit, Einfachheit der Umsetzung und Offline-/Online-Anwendbarkeit. Das EUIPO hält keine der verglichenen Lösungen für ideal, insbesondere aufgrund ihrer inhärenten mangelnden Durchsetzbarkeit.
Der Studie zufolge kann das Robots Exclusion Protocol („REP“) derzeit als de facto Standard zur Erklärung des TDM-Opt-outs angesehen werden. REP wird vom EUIPO jedoch nur als vorübergehende Lösung für TDM-Opt-outs angesehen, vor allem aufgrund seiner begrenzten Granularität und Möglichkeiten es präzise einzusetzenpräzision.
Rechtlich Alternativen umfassen einseitige Opt-out-Erklärungen wie einfache Schreiben von Rechteinhabern, Datenbankenmit digitalen Erklärungen, Beschränkungen in den Lizenzbedingungen oder Website-Nutzungsbedingungen.
Technische Alternativen umfassen das TDM-Reservation Protocol, die C2PA-Text-and-Datamining-Erklärungen, die JPEG-Trust-Rights-Erklärung, die Lösungen von Spawning.AI, die Nutzung der Liccium-Infrastruktur und die Valunode Open Rights Data Exchange.
Sogenanntes Provenance Tracking ist ein Ansatz, der darauf abzielt, den gesamten Lebenszyklus eines digitalen Gegenstands zu zertifizieren, um eine zuverlässige Aufzeichnung der digitalen Historie des Gegenstands zu gewährleisten. Diese Historie wird häufig in einem maschinenlesbaren Format in den Metadaten des digitalen Gegenstands kodiert. Beispiele hierfür sind C2PA, IPTC Photo Metadata Standard, JPEG Trust oder Trace4EU.
Lösungen zur Inhaltsverarbeitung umfassen Lösungen wie Wasserzeichen und sogenanntes “Fingerprinting”. Dieser Ansatz bezieht sich darauf, dass Informationen direkt in den digitalen Gegenständen selbst enthalten sind. Mittels Fingerprinting können einzigartige Muster in Inhalten identifiziert werden, um Kopien der Inhalte zu erkennen, während bei Wasserzeichen Herkunftsinformationen eingebettet werden, um unbefugte Nutzung zu verhindern oder zurückzuverfolgen.
Darüber hinaus liefert die Studie Informationen darüber, wie KI-generierte Inhalte erkannt werden können und ob ein GenAI-Modell auf einem bestimmten Datenpunkt trainiert wurde. Dies steht zwar nicht im Zusammenhang mit Transparenzmaßnahmen, wird jedoch eine entscheidende Rolle dabei spielen,Verbraucher vor Täuschung und Aufdeckung in den der Trainingsdaten zu schützen. Eine mögliche Lösung für die Erkennung wäre der StyleGAN3-Detektor von Nvidia.
Wie bereits erwähnt, gibt die Studie keine Antworten auf rechtliche Fragen. In bestimmten Bereichen ist die Studie jedoch eine Fundgrube für Informationen über den aktuellen Marktstandard für technische Lösungen. Viele weitere wichtige Themen werden ebenfalls behandelt. Insbesondere bietet die Studie einen Überblick über folgende Punkte: (1) den sich entwickelnden Lizenzmarkt für Trainingsdaten, (2) Gerichtsverfahren im Zusammenhang mit KI, (3) andere urheberrechtliche Fragen, wie z. B. das Auswendiglernen von Inhalten innerhalb des GenAI-Modells und Überanpassung (sogenanntes “Overfitting”) des KI-Outputs.
von Thanos Rammos, LL.M. und Richard Gläser