La loi sur la conformité des données de formation en GenAI de Californie AB 2013 : défis et prochaines étapes pratiques pour protéger la propriété intellectuelle
Résumé
La nouvelle loi sur l’intelligence artificielle générative de Californie, AB 2013, marque une nouvelle ère de transparence pour les développeurs de systèmes GenAI. Signée le 28 septembre 2024 et entrant en vigueur le 1er janvier 2026, cette législation exige des organisations utilisant des systèmes GenAI qu’elles publient des détails clairs et de haut niveau sur les ensembles de données utilisés dans la formation ou le développement des systèmes.
Que ce soit pour l’utilisation de modèles GenAI ou pour le développement actif de tels modèles, les exigences larges de la loi créent des impératifs de conformité lourds que les entreprises doivent mettre en œuvre rapidement, tout en présentant des défis importants et complexes pour la protection des actifs de propriété intellectuelle.
Qui est concerné ?
La loi s’applique à un large éventail d’organisations. En gros, AB 2013 exige des développeurs qu’ils publient des informations sur leurs données d’entraînement. Un « développeur » selon la loi n’est pas limité aux développeurs de modèles GenAI, mais inclut également les organisations qui « modifient substantiellement » ces modèles.
La loi s’applique à tout système, qu’il soit gratuit ou payant, qui est « disponible pour les Californiens » et qui a été soit publié, soit significativement modifié à partir du 1er janvier 2022.
Quelles informations doivent être divulguées ?
Les développeurs soumis à AB 2013 doivent publier un « résumé de haut niveau » détaillant les ensembles de données utilisés dans le développement et la formation de leurs systèmes. Ces résumés doivent inclure des informations telles que :
- Les sources / propriétaires des ensembles de données et comment chaque ensemble de données contribue à l’objectif visé.
- Volume approximatif (plages / estimations pour les données dynamiques).
- Types de points de données (étiquettes utilisées ou caractéristiques générales pour les données non étiquetées).
- État de la propriété intellectuelle (présence de droits d’auteur, marques, brevets ou données entièrement dans le domaine public) et si les ensembles de données ont été achetés / sous licence.
- Si les ensembles de données incluent des informations personnelles ou des informations agrégées sur les consommateurs.
- Si les ensembles de données contiennent des informations synthétiques.
- Tout nettoyage, traitement ou modifications effectuées, et leur objectif prévu.
Défis de conformité et conseils stratégiques
AB 2013 introduit plusieurs défis de conformité significatifs pour les développeurs de systèmes GenAI, en grande partie en raison du langage large et parfois ambigu de la loi. L’une des principales préoccupations concerne l’impact que les exigences de divulgation peuvent avoir sur la valeur des actifs de propriété intellectuelle, notamment les secrets commerciaux.
Les développeurs doivent également naviguer dans les complexités d’identification et de comptabilisation des informations personnelles ou des informations sur les consommateurs, en particulier selon les réglementations californiennes telles que le CCPA / CPRA.
Exemptions
AB 2013 inclut quelques exemptions, mais celles-ci sont étroites. Les systèmes utilisés uniquement à des fins de sécurité ou d’intégrité, pour l’exploitation aérienne dans l’espace aérien national, ou développés pour la sécurité nationale, militaire ou la défense ne sont pas couverts par cette loi.
Prochaines étapes pratiques
Les organisations doivent être proactives dans la planification de leur stratégie de conformité. Les étapes suivantes peuvent fournir une feuille de route simple :
- Inventorier tous les systèmes GenAI (publics et internes) publiés ou modifiés depuis janvier 2022.
- Développer des modèles de divulgation pour le site web répondant à chaque exigence.
- Maintenir la documentation de la provenance et du traitement des données pour soutenir les divulgations.
- Consulter des conseillers juridiques pour trouver de nouvelles façons de garder les informations de propriété et les secrets commerciaux confidentiels.
- Surveiller les développements juridiques en cours.
Pourquoi cela importe
Le non-respect de la loi pourrait entraîner des sanctions par le procureur général de Californie ou d’autres entités étatiques. Cette loi est un potentiel modèle pour d’autres États ou même pour une réglementation fédérale de l’IA.