Litigation Minute: Ist KI-generierter Inhalt discoverable? Was Unternehmen 2026 wissen müssen
Künstliche Intelligenz-Tools verändern schnell, wie elektronisch gespeicherte Informationen (ESI) erstellt und gespeichert werden, insbesondere in Bezug auf von großen Sprachmodellen generierte Inhalte. Während Unternehmen generative KI-Tools (GenAI) für das Entwerfen, Zusammenfassen, Analysieren und andere Geschäftsanwendungen nutzen, beschäftigen sich die Gerichte mit der Frage, ob GenAI-Daten wie Eingaben (was ein Benutzer eintippt), Ausgaben (was das KI-Tool generiert) und Aktivitätsprotokolle (Daten darüber, wann und wie Tools verwendet wurden) unter die traditionellen Entdeckungsverpflichtungen fallen.
Traditionelle Entdeckungsregeln gelten weiterhin für nicht-traditionale Daten
Unter FRCP 26(b)(1) können Parteien die Entdeckung von nicht privilegierten Materialien, die relevant und proportional zu den Bedürfnissen des Falls sind, erhalten. Die Gerichte haben klargestellt, dass neue Formen von ESI nicht allein aufgrund ihrer Neuheit ausgenommen sind. Traditionelle Entdeckungsprinzipien gelten gleichermaßen für aufkommende Quellen von ESI, einschließlich GenAI-Daten.
Schlüsselentscheidungen zur Discoverability von GenAI-Daten
Die bisher prägendste Entscheidung zur Discoverability von GenAI-Daten ist In re OpenAI, Inc., Copyright Infringement Litigation, wo ein Richter die Produktion von Millionen von GenAI-Protokollen, einschließlich Benutzeraufforderungen und Modellantworten, mit der Bedingung anordnete, dass Benutzerreferenzen anonymisiert werden. Das Gericht kam zu dem Schluss, dass diese Protokolle relevant und proportional zu den Ansprüchen der Kläger waren, dass die KI-Systeme des Beklagten urheberrechtlich geschützte Werke in ihren Ausgaben reproduzierten. Die Entscheidung betonte, dass Datenschutzbedenken durch Anonymisierung und Schutzanordnungen gemildert werden können und die Produktion von KI-Ausgaben nicht kategorisch ausschließt.
In einer separaten Entscheidung im gleichen Verfahren wies der Richter einen Antrag ab, die New York Times dazu zu zwingen, Inhalte aus ihren internen KI-Tools zu produzieren, da die Anfrage sowohl irrelevant als auch unverhältnismäßig war. Die New York Times argumentierte, dass die Überprüfung von etwa 80.000 Einträgen mehr als 1.300 Stunden in Anspruch nehmen würde – eine erhebliche Belastung angesichts des begrenzten Zusammenhangs der Daten mit den Angelegenheiten.
Relevanz und Proportionalität sind entscheidend
- Relevanz: GenAI-Daten sind discoverable, wenn sie mit einem Anspruch oder einer Verteidigung verbunden sind.
- Proportionalität: Selbst massive Mengen an GenAI-Daten können discoverable sein, wenn sie durch die Bedürfnisse des Falls gerechtfertigt sind; jedoch bleibt die Proportionalität eine hoch relevante Überlegung.
GenAI und E-Discovery in der Praxis
Angesichts der sich schnell entwickelnden Rolle von GenAI in allen Aspekten des täglichen Lebens müssen die Parteien gut vorbereitet sein, um sich in der Entdeckung damit auseinanderzusetzen. Da es selten vernünftig oder proportional ist, alle GenAI-Daten zu bewahren, ist es entscheidend, einen verteidigbaren Ansatz zu entwickeln, der gezielt, überlegt und gut dokumentiert ist.
Identifizieren Sie relevante GenAI-Daten
Bestimmen Sie, ob irgendwelche Verwalter potenziell relevanter Daten GenAI-Tools verwenden, wie die Tools verwendet werden und wo Eingaben und Ausgaben gespeichert sind. Bedenken Sie, dass relevante Aktivitätsprotokolle möglicherweise separat existieren, auch auf Drittanbieterplattformen.
Bewahren Sie, was potenziell relevant ist
Wenn mit einem Rechtsstreit zu rechnen ist, bewahren Sie GenAI-Daten auf, die sich auf Ansprüche oder Verteidigungen beziehen, insbesondere wenn die GenAI-Daten faktische Behauptungen oder substanzielle Inhalte enthalten. Die Schritte variieren je nach Plattform, können aber das Deaktivieren von Auto-Lösch-Einstellungen, das Exportieren von Chatverläufen, das Speichern wichtiger Austausche in Dokumentenarchiven und die Koordination mit der IT umfassen, um die Aufbewahrung von Protokollen und Metadaten zu verstehen. Verwalter sollten GenAI-Daten nicht bearbeiten oder selektiv kopieren, um den Kontext zu verändern, und die Verwendung persönlicher oder browserbasierter Tools offenlegen, damit diese Quellen bewertet werden können. Spezifische Aufbewahrungsmaßnahmen hängen vom Fall und den verwendeten Systemen ab; Prozessanwälte sollten bereit sein, die Aufbewahrungsbemühungen zu überwachen und Anweisungen an Verwalter und die IT des Mandanten während des rechtlichen Haltprozesses zu geben.
Frühzeitig den Umfang verhandeln
Wenn GenAI-Daten betroffen sind, sprechen Sie Relevanz und Proportionalität in ESI-Protokollen und frühen Besprechungen an. Klare Definitionen und gezielte Grenzen können Fischfangaktionen verhindern sowie Kosten und Belastungen reduzieren.
Vertraulichkeit ansprechen
Nehmen Sie Datenschutzbedenken ernst. Wo immer möglich, verwenden Sie Schutzanordnungen und Anonymisierungsprotokolle, um sensible Informationen zu verwalten und gleichzeitig den Entdeckungsverpflichtungen nachzukommen.
Aktualisieren Sie die Informationsverwaltung
Integrieren Sie GenAI-Daten in ESI-Inventare, rechtliche Haltverfahren und Aufbewahrungspolitiken, um die Entdeckungsbereitschaft zu verbessern. KI-spezifische Richtlinien, die akzeptable Nutzung und Datenschutz umfassen, sollten ebenfalls berücksichtigt werden.
Fazit
Die Discoverability von GenAI-Daten wird schnell zu einem zentralen Thema in der E-Discovery. Gerichte schaffen keine Ausnahmen für GenAI-Daten; traditionelle Entdeckungsprinzipien gelten weiterhin. Wenn GenAI-Daten im Mittelpunkt eines Streits stehen, sind sie wahrscheinlich discoverable, jedoch bleibt die Proportionalität eine bedeutende Grenze. Unternehmen und ihre Litigation-Teams sollten GenAI-Daten frühzeitig in die Entdeckungsplanung einbeziehen, eng mit E-Discovery-Spezialisten zusammenarbeiten, um die Belastung zu minimieren, und proaktiv Datenschutzbedenken verwalten.