Directrices del Acta de IA de la UE: Especificaciones sobre Derechos de Autor
La Oficina de IA de la UE ha publicado un nuevo borrador del Código de Práctica (CoP) que establece obligaciones para los proveedores de modelos de propósito general bajo el Acta de IA de la UE. Este borrador, datado el 11 de marzo, se considera más práctico que sus versiones anteriores. La CoP debe ser finalizada para el 2 de mayo, lo que deja a los proveedores de modelos de AI solo tres meses antes de que sus obligaciones entren en vigor el 2 de agosto.
Las consecuencias de no cumplir son significativas: un proveedor podría enfrentar multas de hasta el 3% de su facturación global anual o 15 millones de euros (16.2 millones de dólares), lo que sea mayor, e incluso una posible prohibición de la UE sobre el modelo.
Práctica y Cumplimiento
El Acta de IA de la UE introduce el concepto de una CoP como una guía detallada para que los proveedores de modelos de propósito general (GPAI) cumplan con sus obligaciones. Aunque la adhesión al CoP es voluntaria, demostrar su cumplimiento puede ser beneficioso hasta que se establezcan «normas armonizadas». Los proveedores pueden optar por otros medios de cumplimiento, sujetos a evaluación individual por parte de la Comisión Europea.
El tercer borrador de la CoP facilita las medidas relacionadas con los derechos de autor, basándose en el principio de que el cumplimiento debe ser proporcional al tamaño y capacidad de cada proveedor.
Política de Derechos de Autor
Los proveedores de modelos GPAI deben implementar una política para cumplir con la legislación de derechos de autor europea. Las especificaciones de la CoP requieren:
- Los proveedores deben asignar responsabilidades internas de cumplimiento, y un único documento debe describir todos los compromisos relevantes en materia de derechos de autor. Se recomienda publicar un resumen de la política actualizado.
- Se les pide a los proveedores que mitiguen el riesgo de que un sistema de IA downstream, al que se integra el modelo, genere repetidamente resultados que infrinjan derechos de autor. Deben hacer «esfuerzos razonables» para prevenir la memorización del contenido de entrenamiento que podría llevar a tales resultados.
- Los proveedores deben prohibir el uso que infrinja derechos de autor en su política de uso y términos y condiciones, con una excepción para los modelos de código abierto.
- La CoP aclara que estas medidas deben ser tomadas independientemente de si la integración del modelo es vertical (por parte del proveedor) u horizontal (por otra entidad).
El primer borrador de la CoP afirmaba que en el caso de modificaciones y ajustes, las obligaciones del proveedor solo se relacionaban con estas acciones. Aunque esta declaración fue eliminada del texto de la CoP, sigue presente en las preguntas y respuestas del modelo GPAI de la Oficina de IA.
Opt-Outs y Entrenamiento
Los proveedores deben identificar y cumplir con las reservas de derechos legibles por máquina, o opt-outs, de los titulares de derechos para el uso de su contenido para minería de texto y datos (TDM), que de otro modo estaría permitido bajo la excepción de derechos de autor de la UE. Esta obligación también se aplica a la formación de IA realizada fuera de la UE.
Las especificaciones de la CoP indican que para la minería de texto y datos de material legalmente accesible:
- Consistente con la excepción de derechos de autor de TDM, los proveedores no deben eludir medidas tecnológicas efectivas (por ejemplo, muros de pago) al rastrear la web ellos mismos o mediante agentes.
- Los proveedores deben hacer «esfuerzos razonables» para excluir «dominios de piratería» de su rastreo.
- Cuando los proveedores utilizan material de entrenamiento que no han rastreado ellos mismos, deben hacer «esfuerzos razonables» para obtener información sobre si el material fue obtenido respetando las reservas de derechos en el Protocolo de Exclusión de Robots (robots.txt).
Reconocimiento de Opt-Outs Legibles por Máquina
Los proveedores deben utilizar rastreadores web que lean y sigan las instrucciones expresadas en robots.txt, alineándose con la opinión de expertos legales y técnicos sobre la legibilidad por máquina.
Se deben hacer «esfuerzos razonables» para cumplir con otros protocolos apropiados legibles por máquina que expresen opt-outs, como metadatos basados en activos o ubicación. Esto aclara borradores anteriores que requerían cumplir con «medios» vagos de opt-outs.
La CoP subraya que los titulares de derechos son libres de hacer valer su opt-out por cualquier otro medio apropiado, aunque estas alternativas no estarán cubiertas expresamente por la CoP.
Conclusiones
Aunque la CoP no resuelve todas las incertidumbres legales y técnicas para el cumplimiento de modelos GPAI bajo la ley, ofrece un primer camino estructurado de cumplimiento. La clarificación del robots.txt como el estándar actual para opt-outs de TDM reduce significativamente las incertidumbres y allana el camino para que las partes interesadas establezcan normas adicionales.
Un desafío clave sigue siendo definir lo que los proveedores de modelos deben hacer para prevenir la producción de resultados que infrinjan derechos de autor por sistemas downstream. La revisión reciente ha eliminado el término «overfitting», pero la prevención de la memorización repetida del contenido de entrenamiento sigue siendo ambigua.
Las partes interesadas están invitadas a enviar comentarios finales hasta el 30 de marzo y participar en las últimas rondas de discusión, representando una última oportunidad para que se escuchen sus voces.