8 Minuten
Die New York Times hat eine formelle Klage gegen das KI-Startup Perplexity eingereicht und dem Unternehmen vorgeworfen, Inhalte aus ihrer Berichterstattung wörtlich oder in auffälliger Ähnlichkeit reproduziert und damit kommerziell verwertet zu haben. Dieser Rechtsstreit markiert eine neue Eskalationsstufe im anhaltenden Konflikt zwischen traditionellen Verlagen und Anbietern generativer künstlicher Intelligenz.
Vorwürfe: Scraping, Kopieren und Umgehen von Schutzmechanismen
Nach Darstellung der Klageschrift soll Perplexity Inhalte der NYT ohne Erlaubnis „extrahiert, kopiert und verbreitet“ haben. Die Zeitung führt an, wiederholte Warnungen seien ignoriert worden und dass die Datensammel-Tools von Perplexity bewusst Abwehrmaßnahmen der Times umgangen hätten — einschließlich Regeln in der Datei robots.txt, die angeben, welche Bereiche einer Website gecrawlt werden dürfen.
Die New York Times argumentiert, dieses Verhalten verstoße gegen das Urheberrecht und nehme den Lesern den Anreiz, die Verlagsseite aufzurufen oder eine gedruckte Ausgabe zu kaufen. Die Klage behauptet, dass die Antworten von Perplexity manchmal vollständige oder nahezu vollständige Reproduktionen von Artikeln liefern und damit faktisch den Bedarf eliminieren, auf den Originalbeitrag zuzugreifen.
Technisch betrachtet geht es bei den Vorwürfen sowohl um das massenhafte Abrufen (Scraping) als auch um die Art der Weiterverarbeitung der gesammelten Texte durch generative KI-Modelle. Betreiber von Nachrichtenwebsites nutzen heutzutage robots.txt, Paywalls, Captchas und weitere Maßnahmen, um die kontrollierte Nutzung ihres Inhalts zu gewährleisten. Werden diese Schutzmechanismen umgangen, sehen Verlage ihr Geschäftsmodell — Werbeeinnahmen, Abonnements, Traffic — bedroht.
Die Diskussion über Scraping berührt auch zentrale Begriffe der Online-Architektur: Crawler respektieren in der Regel robots.txt-Einträge, die von Website-Betreibern gepflegt werden. Zieht ein Dienst diese Regeln bewusst nicht in Betracht, entsteht ein rechtliches Spannungsfeld zwischen technischem Zugriff, der Frage der Lizenzierung und dem Schutz geistigen Eigentums.

Was die New York Times vom Gericht fordert
Neben der Geltendmachung finanzieller Schadensersatzansprüche verlangt die New York Times vom Gericht eine dauerhafte Verfügung, die Perplexity untersagen soll, das behauptete Verhalten weiterzuführen. In der Klageschrift wird der Fall sowohl als rechtliche als auch als wirtschaftliche Auseinandersetzung darüber formuliert, wie KI-Systeme mit urheberrechtlich geschützten Nachrichteninhalten umgehen sollten.
Ein gerichtliches Verbot (injunction) würde nicht nur Perplexity direkt treffen, sondern könnte auch Präzedenzwirkung für die gesamte Branche haben. Konkret könnten Gerichte anordnen, dass Anbieter von generativer KI technische Schutzmaßnahmen respektieren, bestimmte Inhalte nicht speichern oder reproduzieren dürfen und gegebenenfalls Lizenzvereinbarungen mit Rechteinhabern abschließen müssen.
Rechtsstrategisch setzt die NYT auf eine Kombination aus klassischem Urheberrechtsschutz und Lehren aus der sich wandelnden Rechtsprechung zur Verarbeitung großer Datenmengen durch automatisierte Systeme. Sollte das Gericht der NYT Recht geben, wären künftige KI-Nutzer von Webtexten möglicherweise verpflichtet, vorab Lizenzen zu erwerben oder klare Nutzungsvereinbarungen zu treffen.
Die Forderungen der NYT adressieren zudem wirtschaftliche Aspekte: Wenn generative KI-Tools vollständige oder nahezu vollständige Artikel wiedergeben, verringert das den Traffic auf den Seiten der Verlage und damit ihre Werbe- und Abonnement-Einnahmen. Die Times argumentiert, dass die Erhaltung journalistischer Qualität und Werthaltigkeit eine angemessene Vergütung und klare Nutzungsregeln erfordern.
Perplexity wehrt sich mit historischem Kontext
Perplexity reagierte über eine Sprecherin und teilte dem Technologie-Portal The Verge mit, dass Klagen gegen Tech-Firmen keine Neuheit seien. „Von Radio und Fernsehen über das Internet und soziale Netzwerke bis hin zu KI — Verlage haben wiederholt neue Technologieunternehmen verklagt, und diese Prozesse haben den Fortschritt selten aufgehalten“, hieß es in der Stellungnahme. Die Antwort betonte eine übergeordnete Erzählung: Technologische Umwälzungen führen routinemäßig zu juristischen Auseinandersetzungen, während sich Branchen an neue Realitäten anpassen.
Aus Sicht von Perplexity und ähnlichen Dienstleistern steht die Frage im Raum, wie generative Modelle auf öffentlich verfügbare Texte zugreifen und diese verarbeiten dürfen. Unternehmen dieser Branche verweisen oft auf das öffentliche Web als Quelle für Training und Retrieval — ein Argument, das in der juristischen Praxis unterschiedlich bewertet wird, je nach Land, Art der Nutzung und konkretem Ergebnis der KI-Ausgabe.
Perplexity betont außerdem technische Unterscheidungen: Zwischen dem Training von großen Sprachmodellen (bei dem Daten in großen Mengen verarbeitet werden) und einer direkten, textgetreuen Wiedergabe, die in ihrer Behauptung die NYT kritisiert. In vielen Fällen verteidigen KI-Anbieter ihre Methoden damit, dass Modelle Muster und Strukturen lernen, anstatt Originaltexte zu replizieren. Kritiker weisen jedoch darauf hin, dass gerade bei kurzen oder prägnanten Nachrichtenabschnitten die Gefahr nahezu wörtlicher Reproduktionen besteht.
Historisch gesehen gab es zahlreiche Rechtsstreitigkeiten, in denen neue Medienformen, etwa Radio oder Fernsehen, rechtliche Fragen aufwarfen. Diese Kontexte werden von Perplexity angeführt, um eine längerfristige Perspektive zu vermitteln — dennoch unterscheiden sich die technischen Möglichkeiten heutiger KI-Systeme erheblich von früheren Innovationen, was die rechtliche Bewertung komplexer macht.
Warum dieser Fall für Verlage und KI-Tools wichtig ist
Die Klage reiht sich in eine Welle rechtlicher Herausforderungen gegen Perplexity ein. Untersuchungen von Forbes und WIRED Anfang dieses Jahres deuteten darauf hin, dass der Dienst einige Paywalls umging und KI-Zusammenfassungen — und in manchen Fällen nahezu vollständige Kopien — geschützter Artikel erzeugte. Kurz vor der Times hatte die Chicago Tribune eine ähnliche Klage gegen Perplexity eingereicht, was unterstreicht, dass mehrere Nachrichtenorganisationen die Vorgehensweise des Startups alarmierend finden.
Was steht auf dem Spiel? Sollte ein Gericht zugunsten der Verlage entscheiden, könnten AI-Firmen, die Webinhalte aufnehmen und zusammenfassen, mit strengeren Beschränkungen, Lizenzpflichten oder technischen Auflagen konfrontiert werden, um Schutzmechanismen wie robots.txt zu respektieren. Im Umkehrschluss könnte eine Entscheidung zugunsten von Perplexity die Nutzung öffentlich zugänglicher Texte durch generative Modelle weiter erleichtern und den rechtlichen Rahmen für Training und Retrieval weiter öffnen.
Auswirkungen auf Lizenzmärkte und Medienökonomie
Ein erhebliches mögliches Ergebnis wäre eine verstärkte Nachfrage nach Lizenzen für journalistische Inhalte. Verlage könnten kollektive Lizenzierungsmodelle entwickeln oder bestehende Verwertungsrechte stärker durchsetzen, um eine Vergütung für die Nutzung ihrer Inhalte durch KI-Anbieter zu erreichen. Solche Lizenzmärkte könnten neue Erlösquellen für Medienhäuser schaffen, zugleich aber auch die Innovationsfähigkeit von Startups einschränken, die keinen Zugang zu teuren Lizenzpaketen haben.
Ferner wären technische Countermeasures denkbar: Verlage könnten ihre paywall- und bot-detection-Systeme weiter verfeinern, Watermarking-Techniken für Texte einführen oder APIs mit kontrolliertem Zugriff bereitstellen. Juristische Klarheit könnte daher gleichzeitig zur Entwicklung technischer Standards führen, die das Gleichgewicht zwischen Schutz von Urheberrecht und Zugang zu Wissen neu regeln.
Rechtliche Rahmenbedingungen und mögliche Präzedenzfälle
Auf rechtlicher Ebene berührt der Fall Kernfragen des Urheberrechts, der erlaubten Nutzung geschützter Werke und der Auslegung des sogenannten „fair use“ beziehungsweise ähnlicher Schrankenregelungen in anderen Rechtsordnungen. In den USA, wo die NYT ihren Sitz hat, könnte eine Gerichtsurteil als wegweisend für die Auslegung dieser Schranken im Kontext von KI gelten.
Ein Präzedenzfall, der Unternehmen dazu verpflichtet, robots.txt und Paywalls technisch und rechtlich zu respektieren, würde die Compliance-Anforderungen verschärfen. Gleichzeitig könnte ein Urteil zugunsten von Perplexity Innovatoren in die Lage versetzen, Informationen freier zu verarbeiten, was wiederum Wettbewerbsvorteile für KI-Anbieter mit sich bringen kann.
Worauf Leser und Entwickler jetzt achten sollten
Erwarten Sie, dass diese Rechtsstreitigkeiten sowohl Produktverhalten als auch Branchenstandards beeinflussen. Werden KI-Firmen schärfere Filter und Lizenzabkommen einführen? Werden Verlage klarere Regeln, standardisierte Lizenzmodelle oder neue Vergütungsmechanismen für ihre Berichterstattung fordern? Die Antworten darauf werden maßgeblich bestimmen, wie durchsuchbar, zusammenfassbar und monetarisierbar Nachrichteninhalte im Zeitalter der KI bleiben.
Für Entwickler von KI-Anwendungen bedeutet das: Prüfen Sie Ihre Datenquellen und -prozesse sorgfältig. Transparenz über Datenherkunft, Mechanismen zur Vermeidung wörtlicher Wiedergaben und technische Maßnahmen zur Einhaltung von robots.txt-Einträgen können künftig nicht nur rechtliche Vorteile bringen, sondern auch das Vertrauen von Partnern und Nutzern stärken.
Für Leser und Nachrichtenkonsumenten steht die Frage im Raum, wie sich der Zugang zu verlässlichen, überprüften Nachrichten verändern wird, wenn KI-Tools wesentliche Teile der Berichterstattung zusammenfassen oder reproduzieren. Langfristig könnte sich das Konsumverhalten ändern: Nutzer könnten verstärkt direkte Quellen abonnieren, wenn aggregierte KI-Ausgaben nicht die Tiefe oder Glaubwürdigkeit bieten, die professionelle Journalisten liefern.
Rechtsteams beider Seiten bereiten aktuell Schriftsätze und Beweismaterialien vor; die Medien- und Technologiebranche beobachtet den Prozess genau. Das Ergebnis könnte wegweisend sein für den Umgang mit urheberrechtlich geschützten Nachrichteninhalten durch die nächste Generation von KI-Werkzeugen und hat das Potenzial, branchenweite Standards für Datenzugriff, Lizenzierung und technische Compliance zu setzen.
Insgesamt zeigt der Fall die Notwendigkeit eines ausgewogenen Rahmens, der sowohl den Schutz kreativer und investigativer Arbeit von Journalisten als auch die innovationsfördernde Nutzung von Daten durch KI berücksichtigt. Entscheidend wird sein, ob Gerichte, Gesetzgeber und Branchenakteure Lösungen finden, die Rechtssicherheit, wirtschaftliche Fairness und technischen Fortschritt miteinander in Einklang bringen.
Quelle: smarti
Kommentar hinterlassen