Kaliforniens GenAI-Datentrainings-Compliance-Gesetz AB 2013: Herausforderungen und praktische nächste Schritte zum Schutz von IP
Zusammenfassung
Das neue Gesetz über Generative Künstliche Intelligenz in Kalifornien, AB 2013, leitet eine neue Ära der Transparenz für Entwickler von Generative AI (GenAI)-Systemen ein. Das Gesetz, das am 28. September 2024 unterzeichnet wurde und am 1. Januar 2026 in Kraft tritt, verpflichtet Organisationen, die GenAI-Systeme nutzen, dazu, klare, hochrangige Details zu den Datensätzen zu veröffentlichen, die für das Training oder die Entwicklung der Systeme verwendet werden.
Ob eine Organisation einfach GenAI-Modelle nutzt oder aktiv an der Entwicklung solcher Modelle beteiligt ist, die breiten Anforderungen des Gesetzes schaffen erhebliche Compliance-Anforderungen, die Unternehmen schnell umsetzen müssen, und stellen komplexe Herausforderungen zum Schutz proprietärer geistiger Eigentumswerte dar.
Wer ist betroffen?
Das Gesetz hat einen breiten Geltungsbereich. Auf hoher Ebene verlangt AB 2013 von Entwicklern, Informationen über ihre Trainingsdaten öffentlich bereitzustellen. Ein „Entwickler“ im Sinne des Gesetzes umfasst nicht nur Entwickler von GenAI-Modellen, sondern auch Organisationen, die diese „wesentlich verändern“.
Das Gesetz gilt für jedes System, das „Kaliforniern“ zur Verfügung steht und am oder nach dem 1. Januar 2022 veröffentlicht oder wesentlich verändert wurde. Eine „wesentliche Änderung“ an einem KI-System umfasst neue Versionen oder Veröffentlichungen oder andere wesentliche Änderungen an der Funktionalität oder Leistung eines KI-Systems.
Was muss offengelegt werden?
Entwickler, die unter AB 2013 fallen, müssen eine „hohe Zusammenfassung“ veröffentlichen, die die Datensätze beschreibt, die für die Entwicklung und das Training ihrer Systeme verwendet wurden. Diese Zusammenfassungen müssen Informationen enthalten wie:
- Quellen/Eigentümer der Datensätze und wie jeder Datensatz dem beabsichtigten Zweck dient.
- Ungefähre Menge (Bereiche/Schätzungen für dynamische Daten).
- Arten von Datenpunkten (Labels oder allgemeine Merkmale für nicht gekennzeichnete Daten).
- IP-Status (Vorhandensein von Urheberrecht, Markenrecht, Patenten oder vollständig öffentlichen Daten) und ob Datensätze gekauft/lizenziert wurden.
- Ob die Datensätze persönliche Informationen oder aggregierte Verbraucherinformationen enthalten.
- Ob die Datensätze synthetische Informationen enthalten.
- Alle Reinigungs-, Verarbeitungs- oder Modifikationen, die durchgeführt wurden, und deren beabsichtigter Zweck.
Compliance-Herausforderungen und strategische Tipps
AB 2013 bringt mehrere bedeutende Compliance-Herausforderungen für Entwickler von GenAI-Systemen mit sich, hauptsächlich aufgrund der breiten und manchmal mehrdeutigen Sprache des Gesetzes. Eine der Hauptsorgen betrifft die Auswirkungen der Offenlegungsanforderungen auf den Wert von IP-Vermögenswerten, insbesondere Geschäftsgeheimnissen.
Das Gesetz verlangt von Entwicklern, die Details der Trainingsdaten, die in ihren GenAI-Systemen verwendet werden, offenzulegen. Diese Informationen sind oft hochsensibel und enthalten wertvolle proprietäre und geschützte Materialien.
Ein weiteres zentrales Problem bei der Einhaltung von AB 2013 besteht darin, dass Unternehmen ausdrücklich angeben müssen, ob ihre Datensätze urheberrechtlich oder patentiert sind. Dies schafft zusätzliche IP-bezogene Risiken und könnte die Position des Unternehmens in Urheberrechts- oder Patentverletzungsfällen untergraben.
Praktische nächste Schritte
Organisationen müssen proaktiv bei der Planung ihrer Compliance-Strategie sein. Die folgenden Schritte können einen einfachen Fahrplan bieten:
- Inventarisierung aller GenAI-Systeme (öffentlich und intern), die seit Januar 2022 veröffentlicht oder geändert wurden.
- Entwicklung von Offenlegungs-Vorlagen, die jede Anforderung adressieren.
- Dokumentation der Datenquelle und -verarbeitung zur Unterstützung der Offenlegung.
- Zusammenarbeit mit juristischen Beratern, um neue Wege zu finden, um proprietäre Informationen vertraulich zu halten.
Warum es wichtig ist
Nichtbeachtung könnte zu Durchsetzungsmaßnahmen durch die kalifornische Generalstaatsanwaltschaft oder andere staatliche Stellen führen. Die erhöhte Transparenz zielt darauf ab, das Vertrauen der Verbraucher zu stärken und Bedenken hinsichtlich Urheberrecht und Datenschutz auszuräumen.