Litigation Minute : Le contenu généré par l’IA est-il découvrable ? Ce que les entreprises doivent savoir en 2026
Les outils d’intelligence artificielle transforment rapidement la manière dont les informations électroniques sont créées et stockées, notamment en ce qui concerne le contenu généré par des modèles linguistiques avancés. À mesure que les entreprises adoptent des outils d’IA générative pour la rédaction, le résumé, l’analyse et d’autres usages commerciaux, les tribunaux se penchent sur la question de savoir si les données générées par l’IA, telles que les invites (ce que l’utilisateur tape), les sorties (ce que l’outil d’IA génère) et les journaux d’activité (données sur l’utilisation des outils), relèvent des obligations traditionnelles de découverte.
Les règles traditionnelles de découverte s’appliquent toujours
Selon la règle FRCP 26(b)(1), les parties peuvent obtenir la découverte de matériaux non protégés par le secret qui sont pertinents et proportionnels aux besoins de l’affaire. Les tribunaux ont clairement indiqué que les nouvelles formes de données électroniques ne sont pas exemptées simplement parce qu’elles sont innovantes. Les principes traditionnels de découverte s’appliquent également aux sources émergentes de données électroniques, y compris les données générées par l’IA.
Décisions clés sur la découvrabilité des données générées par l’IA
Le jugement le plus déterminant concernant la découvrabilité des données générées par l’IA est l’affaire In re OpenAI, où le juge a ordonné la production de millions de journaux d’IA, y compris les invites des utilisateurs et les réponses des modèles, à condition que les références des utilisateurs soient anonymisées. Le tribunal a conclu que ces journaux étaient pertinents et proportionnels aux revendications des plaignants selon lesquelles les systèmes d’IA reproduisaient des œuvres protégées par des droits d’auteur dans leurs sorties. La décision a souligné que les préoccupations en matière de confidentialité peuvent être atténuées par des protocoles d’anonymisation et des ordonnances de protection, et ne barrent pas de manière catégorique la production des sorties de l’IA.
Dans une décision distincte de la même affaire, le juge a refusé une demande d’obligation pour un média de produire du contenu de ses outils internes d’IA, jugeant la demande à la fois non pertinente et disproportionnée. Le média a soutenu qu’un examen d’environ 80 000 entrées prendrait plus de 1 300 heures, ce qui représente une charge substantielle étant donné le lien limité avec les questions en jeu.
Relevance et Proportionalité
- 1) Pertinence : Les données générées par l’IA sont découvrables lorsqu’elles sont liées à une revendication ou une défense.
- 2) Proportionalité : Même de grands volumes de données générées par l’IA peuvent être découvrables lorsqu’ils sont justifiés par les besoins de l’affaire, mais la proportionnalité reste une question très pertinente.
Pratiques de la découverte électronique
Étant donné le rôle en évolution rapide de l’IA générative dans tous les aspects de la vie quotidienne, les parties doivent être bien préparées à l’aborder directement dans le cadre de la découverte. Étant rarement raisonnable ou proportionnel de préserver toutes les données générées par l’IA, il est essentiel de développer une approche défendable qui soit ciblée, raisonnée et bien documentée dès les premières étapes de l’engagement.
Identifier les données générées par l’IA pertinentes
Déterminez si des responsables de données potentiellement pertinentes utilisent des outils d’IA, comment ces outils sont utilisés et où les invites et les sorties sont stockées. Gardez à l’esprit que des journaux d’activité pertinents peuvent exister séparément, y compris sur des plateformes tierces.
Préserver ce qui est potentiellement pertinent
Lorsque des litiges sont anticipés, préservez les données générées par l’IA qui se rapportent à des revendications ou des défenses, en particulier lorsque ces données peuvent contenir des assertions factuelles ou un contenu substantiel. Les étapes varient selon la plateforme mais peuvent inclure la désactivation des paramètres de suppression automatique, l’exportation des historiques de discussion, la sauvegarde des échanges clés dans des dépôts de documents, et la coordination avec le service informatique pour comprendre la conservation des journaux et des métadonnées.
Négocier la portée dès le début
Si des données générées par l’IA sont impliquées, traitez la pertinence et la proportionnalité dans les protocoles de données électroniques et lors des discussions initiales. Des définitions claires et des limites ciblées peuvent prévenir des recherches abusives et réduire les coûts et la charge.
Aborder la confidentialité
Prenez les préoccupations en matière de confidentialité au sérieux. Lorsque cela est possible, utilisez des ordonnances de protection et des protocoles d’anonymisation pour gérer les informations sensibles tout en respectant les obligations de découverte.
Mettre à jour la gouvernance de l’information
Intégrez les données générées par l’IA dans les inventaires de données électroniques, les procédures de conservation légale et les politiques de conservation pour améliorer la préparation à la découverte. Des politiques spécifiques concernant l’utilisation acceptable et la confidentialité des données doivent également être envisagées.
Conclusion
La découvrabilité des données générées par l’IA devient rapidement un enjeu central dans la découverte électronique. Les tribunaux ne créent pas d’exemptions pour les données générées par l’IA ; les principes traditionnels de découverte s’appliquent toujours. Lorsque les données générées par l’IA vont au cœur d’un litige, elles seront probablement découvrables, mais la proportionnalité reste une limite significative. Les entreprises et leurs équipes de litige doivent aborder les données générées par l’IA dès la planification de la découverte, travailler étroitement avec des spécialistes de la découverte électronique pour minimiser la charge, et gérer proactivement les préoccupations en matière de confidentialité.
Restez à l’écoute pour une prochaine minute de litige sur l’intersection des données générées par l’IA avec le privilège avocat-client et la doctrine du travail produit.