Newsletter

Schützen Sie Ihre Online-Inhalte vor Web-Scraping durch KI-Anbieter

Lesley Broos

Lesley Broos Anwalt (Partner)

Schützen Sie Ihre Online-Inhalte vor Web-Scraping durch KI-Anbieter

Weltweit sind derzeit Klagen gegen Anbieter und Entwickler von (meist allgemeinen) KI-Tools anhängig, die ihre Systeme mit großen Datenmengen trainiert haben, die dem Urheberrecht oder Datenbankrechten Dritter unterliegen.

Laufende Verfahren

So hat beispielsweise die New York Times im Dezember 2023 ein Verfahren gegen OpenAI und ihren Partner Microsoft eingeleitet, weil OpenAI angeblich Millionen von Nachrichtenartikeln der New York Times verwendet haben soll, um ihr KI-System ohne Zustimmung zu trainieren. Ähnliche Verfahren sind auch gegen die konkurrierenden KI-Tools von Google/Alphabet (Bard, Imagen, MusicLM, Duet AI & Gemini) anhängig.

Wie verhindern Sie, dass Ihre Online-Inhalte – gegen Ihren Willen – für KI-Trainingszwecke Dritter verwendet werden? Und ist das einfach so erlaubt?

Anwendbare Gesetzgebung

Im neuen europäischen KI-Gesetz wird betont, dass die KI-Verordnung die Durchsetzung der Urheberrechtsvorschriften des Unionsrechts nicht berührt (Erwägungsgrund 108). Auf dieser Grundlage könnte man meinen, dass urheberrechtlich geschützte Werke oder Datenbanken - selbst wenn sie online veröffentlicht sind - daher auch gegen die Vervielfältigung durch KI-Entwickler geschützt sind, die Inhalte aus dem Internet „scrapen“ („kratzen“), solange Sie als Rechteinhaber keine Erlaubnis („Lizenz“) zum Kopieren dieser Werke oder Datenbanken als Trainingsmaterial für KI-Tools erteilt haben. Dies ist jedoch ein Irrglaube. 2019 wurde mit den europäischen Verordnungen über das Urheberrecht und verwandte Schutzrechte im digitalen Binnenmarkt eine wichtige Ausnahme von diesem alten Grundsatz des Rechts des geistigen Eigentums (IP) eingeführt, nämlich dass (kurz gesagt) das Text- und Data-Mining von geschütztem Material zu kommerziellen Zwecken erlaubt ist, es sei denn, der Rechteinhaber hat einen entsprechenden ausdrücklichen Vorbehalt angebracht. Maschinell lesbare Mittel (z.B. durch Aufnahme von für Scraping-Tools verständlichen Regeln in eine robots.txt-Datei) werden in diesem Zusammenhang als „angemessen“ betrachtet. Wenn Sie einen solchen Vorbehalt nicht oder nicht in angemessener Weise anbringen, riskieren Sie, dass Sie nicht erfolgreich gegen Dritte vorgehen können, die rechtmäßig auf Ihre Online-Inhalte zugreifen und Vervielfältigungen Ihrer Inhalte zu Text- und Data-Mining-Zwecken vornehmen.

Web-Scraping von (auch) personenbezogenen Daten?

Beim Training von KI-Systemen ist übrigens nicht nur die IP-Perspektive relevant, auch datenschutzrechtliche Einschränkungen sollten berücksichtigt werden. Enthält der betreffende Online-Inhalt nämlich auch personenbezogene Daten, ist Web-Scraping auch unter diesem Gesichtspunkt oft problematisch. Nicht umsonst schrieb die niederländische Datenschutzbehörde Autoriteit Persoonsgegevens Anfang dieses Jahres, dass Scraping (also: von personenbezogenen Daten) „fast immer illegal“ ist.

Weitere Informationen

Kienhuis Legal kann Ihnen dabei helfen, herauszufinden, wie Sie Ihr geistiges Eigentum an Online-Inhalten wirksam schützen können, und natürlich auch, wie KI-Entwickler innerhalb oder außerhalb Europas ihre KI-Systeme rechtmäßig mit Hilfe von Ressourcen Dritter trainieren können.


Unser German Desk freut sich auf Ihre Kontaktaufnahme.

Haben Sie noch Fragen? Wir freuen uns darauf, von Ihnen zu hören