Per Änderung der „Datenschutzrichtlinie“ will Google die Urheberechte von Autoren umgehen, um die eigene KI zu trainieren

Quelle: https://en.wikipedia.org/wiki/Google#/media/File:Googleplex_HQ_(cropped).jpg

MENLO PARK – Es ist vielleicht einer der größten Raubzüge der Menschheitsgeschichte! Der Suchmaschinenkonzern Google ermächtigt sich per Änderung der „Datenschutzrichtlinien“ einfach selbst dazu alle im Netz verfügbaren Daten zu eigenen Zwecken nutzen zu dürfen und zwar ohne Rücksichten auf Urheberrechte!

In der Bevölkerung ist inzwischen das Rechtsgefühl weit verbreitet, daß man öffentlich zugängliche Beiträge beliebig lesen kann, da man davon ausgehen kann, daß wenn ein Autor einen Text offen zugänglich macht, er ja durch diese Zugänglichmachung das Publikum dazu einlädt, diesen Text auch zu lesen!

Doch kein Autor dürfte bei einer Veröffentlichung seines Texts davon ausgegangen sein, daß dieser durch einen Dritten (Google) einfach genommen wird, auf unbekannte Weise umgeformt wird, um daraus dann etwas ganz Neues zu machten, mit dem der Dritte (Google) dann Geld verdienen will, viel Geld!

Durch das Aufkommen von „Künstlicher Intelligenz“ geht es also nicht mehr darum, wer Informationen sehen kann, sondern wer Informationen wie benutzen darf. Letzteres ist zwar z.B. im europäischen Urheberrecht geregelt, doch dieses wird durch Google offenbar gezielt umgangen:

Google hat nämlich Anfang Juli seine „Datenschutzrichtlinie“ aktualisiert und in der neuen Version ausdrücklich darauf hingewiesen, daß sich Google selbst das Recht gibt, praktisch alles, was Google online findet, für die Entwicklung der Google-KI-Tools nutzen zu können.

Das heißt aber im Umkehrschuß auch, daß Google das bisher wohl ohne eine solche Rechtsgrundlage gemacht haben dürfte/könnte!

Wie dem auch sei. Nun ist aber erstmals klar ausgesprochen, daß Google nun für sich per AGB in Anspruch nimmt, die Urheberrechte aller Autoren zu missachten, um deren Werke als eine Art Steinbruch zu nutzen, um mit dessen Output die Google-KI zu trainieren.

Mit anderen Worten: Jeder Autor muß nach dieser Änderung der „Datenschutzrichtlinie“ nun damit rechnen, daß sein Werk auch ohne Einwilligung des Autors auf irgend eine Art und Weise durch Google – bildlich gesprochen – „verwurstet“ wurde.

Als ob das nicht schon spannend genug wäre, kommt noch hinzu, daß Google diese Änderung so verfasst hat, daß sie Besuchern aus Europa, wo ein recht strenges Urheberrecht gilt, gar nicht angezeigt wird!

Google ermächtigt sich selbst auf alle Daten zuzugreifen, um die eigene KI zu trainieren

Seit der Veröffentlichung von Chat-GBT fragen sich weite Kreise der Bevölkerung: woher beziehen die Chatbots eigentlich die Daten, die sie dann später als Antworten ausgeben?

Die Antwort ist offensichtlich: Sie beziehen die Daten aus dem Internet, also wohl von jedem Bürger dieses Planeten, der dort Texte hinterlassen hat.

Unternehmen wie Google und OpenAI plündern also mit ihren ChatBots das WWW und kümmern sich hierbei offenkundig gar nicht um die Tatsache, daß es sich bei vielen dieser Daten um urheberrechtlich geschütztes Material handelt.

Der einzige Umstand, daß sich diese Firmen nicht für diesen gigantischen Raubzug vor Gericht verantworten müssen dürfte darin zu finden sein, daß sie diese Daten sofort verarbeiten und durch diese Verarbeitung den Ursprung der Daten unkenntlich machen und daß diese Daten nach dieser Unkenntlichmachung deswegen nicht mehr durch den ursprünglichen Urheber als sein eigenes Werk erkannt werden können.

Es verhält sich – bildlich gesprochen – also in etwa so, also ob man z.B. eine goldene Brosche einschmilzt und einen Barren Gold daraus macht. Der Juwelier wird in diesem Barren die von ihm ursprünglich gestaltete Brosche dann auch nicht mehr wiedererkennen können.

Google erhebt sich über das deutsche Urheberrecht

§ 11 des „Gesetzes über Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz)“ besagt:

Das Urheberrecht schützt den Urheber in seinen geistigen und persönlichen Beziehungen zum Werk und in der Nutzung des Werkes. Es dient zugleich der Sicherung einer angemessenen Vergütung für die Nutzung des Werkes.

Im diametralen Gegensatz zu dieser rechtlichen Vorgabe hat Google Anfang Juli 2023 seine AGB einleitend wie folgt umformuliert:

„Google nutzt Informationen, um unsere Dienste zu verbessern und neue Produkte, Funktionen und Technologien zu entwickeln, die unseren Nutzern und der Öffentlichkeit zugute kommen“,

Diese Passage ist sowohl in der deutschen, als auch in der englischen Version der Datenschutzrichtlinien zu finden.

Dann aber wird es spannend!

Den von Europa aus zugreifbaren „Datenschutzrichtlinien“ von Google fehlt eine Passage

Während die deutschen „Datenschutzrichtlinien“ mit dem Absatz unter der Überschrift

„Weitere hilfreiche Ressourcen“

enden, ist die korrespondierende Überschrift in den US-amerikanischen „Datenschutzrichtlinien“ dann erst bei der Hälfte angelangt und geht dann noch weiter!

Noch viel weiter unten kommt dann in der US-amerikanischen Version unter der Überschrift „publicly accessible sources“ eine Passage mit dem Text:

„Wir nutzen beispielsweise öffentlich verfügbare Informationen, um die KI-Modelle von Google zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud AI-Funktionen zu entwickeln.“

Sie ist auch z.B. in dieser PDF- Version der Google-Richtlinie enthalten. Dort heißt es ebenfalls:

„Wir nutzen beispielsweise öffentlich verfügbare Informationen, um die KI-Modelle von Google zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud AI-Funktionen zu entwickeln.“

Quelle: https://policies.google.com/privacy/archive/20221215-20230701

Das kann man aber nicht mehr der deutschen Übersetzung der Datenschutzerklärung entnehmen, denn diese endete ja früher.

Was bezweckt Google?

Wie anders soll man solche Google-AGB lesen, als so, daß Google sich

einen feuchten Kehricht um das Urheberrecht schert und einfach auf alles, was die Suchmaschine an Geschriebenem findet zugreift und selbst verarbeitet
und zweitens die Bürger außerhalb der USA mit einer defizitären Aktualisierung der Datenschutzerklärung im Unklaren über die Verwendung der von ihnen ins Netz gestellten Daten lässt

Misst man diesen Umstand z.B. am deutschen Urhebegesetz und insbesondere an dessen Tatbestandsmerkmal

„die Nutzung des Werks“,

so drängt sich einem förmlich der Verdacht auf, daß Google den Anspruch auf die Nutzung der Werke von Autoren z.B. in Deutschland gezielt nicht in seine Datenschutzerklärung aufgenommen haben könnte, weil Google eine derartige Nutzung durch dieses Gesetz ja verboten ist.

Das hätte aber dann zur Folge, daß Google seine KI auf Deutsch gar nicht trainieren könnte, weil die KI ja auf keine Daten zugreifen könnte?! Eine wenig plausible Erklärung!
Hinzu kommt, daß Google dann ja auch nicht von den USA aus auf Texte im Geltungsbereich des deutschen Urheberrechts zugreifen dürfte?! Eine ebenfalls wenig plausible Erklärung!
Vielleicht überlegen sich ja ganz clevere Gestalten auch, daß Google seine Server außerhalb des Geltungsbereichs des deutschen Urheberrechts hat und deswegen diese Daten aus Deutschland ja dort verarbeiten dürfe. Aufgrund des CLOUD-Gesetzes haben US-Behörden Zugriff auf Daten, die auf Servern von US-Firmen liegen, auch auf solche im Ausland. Das mag vielleicht sein, aber selbst wenn dem so wäre, dürfte Google die Ergebnisse dieser Arbeit, also seine KI dann wohl nicht mehr in den Geltungsbereich des deutschen Urheberrechts exportieren?! Immerhin steckt da ja im deutschen Rechtskreis urheberrechtlich geschütztes Material drin.

Es ist also nicht erkennbar, wie Google seine KI auf deutsch trainieren/anbieten möchte, ohne deutschen Urheberrecht zu verletzen, denn auch die Erlaubnis zu erteilen, einen Text als Daten-Steinbruch zum Zweck des Trainings einer KI zu nutzen bleibt nach deutschem Recht immer dem Urheber vorbehalten!

Was hat eine solche Regelung in den „Datenschutzrichtlinien“ verloren?

In der Regel beschreiben derartige Richtlinien die Art und Weise, wie ein Unternehmen die Informationen verwendet, die Sie in den unternehmenseigenen Diensten veröffentlichen.

Das ist in vorliegend nicht der Fall.

Hier scheint sich Google das Recht vorzubehalten, im öffentlichen Web veröffentlichte Daten zu sammeln und zu nutzen, als ob das gesamte Internet der eigene KI-Spielplatz von Google wäre.

Es handelt sich also im Kern um eine Selbstermächtigung durch eine AGB!

Informationssperre als letzte Lösung?

Mittlerweile wirkt sich dieses Phänomen aber auch auf Verbraucher aus.

Die Chefs von Twitter und Reddit haben den kostenlosen Zugriff auf ihre APIs deaktiviert, die es zuvor jedem ermöglichte, große Mengen an Beiträgen herunterzuladen.

Angeblich soll das die Social-Media-Seiten davor schützen, daß andere Unternehmen deren geistiges Eigentum stehlen, aber es hat auch noch andere Konsequenzen:

Die API-Änderungen von Twitter und Reddit haben wiederum Tools von Drittanbietern kaputt gemacht, die viele Menschen für den Zugriff auf diese Websites verwendet haben.

Einen Moment lang schien es sogar so, als würde Twitter öffentliche Einrichtungen wie Wetter-, Verkehrs- und Rettungsdienste dazu zwingen, zu zahlen, wenn sie twittern wollten, ein Schritt, den das Unternehmen nach heftiger Kritik zurücknahm. Reddit wird wiederum im Wesentlichen von unbezahlten Moderatoren betrieben, die sich bei ihrer Arbeit auf Tools von Drittanbietern verlassen, die wiederum auf dann nicht mehr zugänglichen APIs basieren. Da diese Unterstützung nun weggefallen ist, begannen zahlreiche der Reddit-Moderatoren ihre freiwillige Arbeit aufzugeben!