Directives du règlement européen sur l’IA : Précisions sur le droit d’auteur
Le Bureau de l’IA de l’UE a publié un projet de Code de Pratique (CoP) le 11 mars concernant les obligations des fournisseurs de modèles d’IA à usage général (GPAI) dans le cadre de la loi sur l’IA de l’UE. Ce projet est considéré comme plus opérationnel que ses prédécesseurs. La CoP doit être finalisée d’ici le 2 mai, laissant aux fournisseurs de modèles GPAI seulement trois mois avant l’entrée en vigueur de leurs obligations le 2 août.
Les enjeux sont importants : le non-respect des obligations par un fournisseur risque des amendes allant jusqu’à 3 % du chiffre d’affaires annuel mondial ou 15 millions d’euros (16,2 millions de dollars), selon le montant le plus élevé, et pourrait même entraîner une interdiction de l’UE sur le modèle.
Pratique et conformité
La loi sur l’IA de l’UE introduit le concept de CoP comme un guide détaillé pour les fournisseurs de modèles GPAI afin de répondre à leurs obligations. Bien que l’adhésion à la CoP soit volontaire, elle permettra de démontrer la conformité avec la loi jusqu’à ce que des normes harmonisées pour ces obligations soient établies. Alternativement, les fournisseurs peuvent choisir d’autres moyens de conformité, sous réserve d’une évaluation individuelle par la Commission européenne.
La troisième version du projet de CoP assouplit les mesures liées au droit d’auteur, qui sont désormais basées sur le principe que la conformité doit être commensurable et proportionnée à la taille et à la capacité de chaque fournisseur.
Politique de droit d’auteur
Les fournisseurs de modèles GPAI doivent mettre en place une politique pour se conformer à la législation européenne sur le droit d’auteur. Les spécifications de la CoP exigent :
- Les fournisseurs doivent assigner des responsabilités internes pour la conformité, et un document unique doit décrire tous les engagements en matière de droit d’auteur. La publication d’un résumé de la politique à jour est encouragée.
- Les fournisseurs doivent atténuer le risque qu’un système d’IA en aval, dans lequel le modèle est intégré, génère de manière répétée du contenu enfreignant le droit d’auteur. Ils doivent déployer des efforts raisonnables pour empêcher la mémorisation du contenu d’entraînement qui pourrait conduire à une telle production. Les fournisseurs doivent également interdire l’utilisation enfreignant le droit d’auteur de leur modèle dans leur politique d’utilisation et leurs conditions générales, avec une exception pour les modèles open-source.
Le premier projet de CoP stipulait qu’en cas de modification et d’ajustement, les obligations d’un fournisseur ne concernaient que ces actions. Bien que cela ait été supprimé du texte de la CoP, cette affirmation reste présente dans le Q&R sur les modèles GPAI du Bureau de l’IA. Le Bureau a également indiqué qu’il inclura cette question dans son guide sur la loi sur l’IA de l’UE.
Exclusions et formation
Les fournisseurs doivent identifier et se conformer aux réservations de droits lisibles par machine, ou opt-outs, des titulaires de droits pour l’utilisation de leur contenu pour le text and data mining qui serait autrement autorisée en vertu de l’exception de droit d’auteur TDM de l’UE. Un considérant appelle à ce que cette obligation s’applique à l’entraînement de l’IA effectué à l’extérieur de l’UE ainsi qu’à l’intérieur.
Les spécifications de la CoP indiquent que pour le text and data mining de matériel légalement accessible :
- Conformément à l’exception de droit d’auteur TDM, les fournisseurs ne doivent pas contourner les mesures technologiques effectives (par exemple, les paywalls) lorsqu’ils parcourent le web eux-mêmes ou par l’intermédiaire d’agents.
- Les fournisseurs doivent faire des efforts raisonnables pour exclure les domaines de piraterie de leur exploration.
- Lorsqu’ils utilisent du matériel d’entraînement qu’ils n’ont pas eux-mêmes exploré ou par l’intermédiaire d’agents, et pour lequel ils n’ont pas obtenu l’autorisation du titulaire de droits, les fournisseurs doivent faire des efforts raisonnables pour obtenir des informations sur la conformité du matériel avec les réservations de droits dans le Robot Exclusion Protocol (robots.txt).
Reconnaissance des opt-outs lisibles par machine
Les fournisseurs doivent utiliser des robots d’exploration qui lisent et suivent les instructions exprimées dans le robots.txt, en accord avec l’avis d’experts juridiques et techniques sur la lisibilité par machine. Des meilleurs efforts doivent être fournis pour se conformer aux autres protocoles appropriés lisibles par machine exprimant des opt-outs, par exemple, des métadonnées basées sur des actifs ou des localisations, qui sont soit le produit d’un processus de normalisation intersectorielle, soit une solution largement adoptée approuvée par un processus de discussion des parties prenantes au niveau de l’UE.
La CoP souligne que les titulaires de droits restent libres de réaliser leur opt-out par d’autres moyens appropriés. Cependant, de telles alternatives ne seront pas expressément couvertes par la mesure de la CoP pour identifier et se conformer aux réservations de droits.
Conclusion
Bien que la CoP ne résolve pas toutes les incertitudes juridiques et techniques concernant la conformité des modèles GPAI selon la loi, elle offre une première voie structurée de conformité. Étant donné que la loi sur l’IA de l’UE stipule simplement que les fournisseurs doivent mettre en œuvre une politique pour se conformer à la législation sur le droit d’auteur de l’UE et à l’exception TDM, la CoP ajoute beaucoup de spécifications. En particulier, la clarification concernant le robots.txt comme norme actuelle pour les opt-outs TDM réduit considérablement les incertitudes tout en ouvrant la voie à l’établissement de normes supplémentaires par les parties prenantes.
Un défi clé reste la définition des mesures que les fournisseurs de modèles doivent prendre pour prévenir la production de contenu enfreignant le droit d’auteur par des systèmes en aval. Le dernier projet s’est éloigné du terme surajustement, critiqué comme une simple description technique, mais l’approche actuelle — empêcher la mémorisation répétée du contenu d’entraînement dans la production — reste ambiguë. Les révisions apportées dans le processus de rédaction reflètent que les contributions des parties prenantes sur ce qui est pratique et réalisable sont prises en compte. Il est désormais temps pour les parties prenantes de faire entendre leur voix, avec une invitation à soumettre des retours finaux d’ici le 30 mars et à participer aux dernières discussions.