A União Europeia ainda está presa em um impasse de direitos autorais de IA
Com as recentes alterações nos requisitos de direitos autorais da União Europeia (UE) no Código de Prática da Lei de Inteligência Artificial, a expectativa é que a crescente demanda por IA seja mantida por enquanto. No entanto, isso também traz novos desafios.
Implementação da Lei de Inteligência Artificial
Como parte da implementação da Lei de Inteligência Artificial da União Europeia (Regulamento (UE) 2024/1689), a Comissão Europeia publicou várias diretrizes, incluindo o Código de Prática (CoP) para a implementação da Lei de IA, emitido em julho de 2025. Este CoP abrange três questões principais: transparência sobre a construção dos modelos de IA, como os provedores devem lidar com a segurança e proteção dos modelos, e como cumprir os direitos autorais em dados de treinamento de IA.
Desafios de Direitos Autorais
Enquanto a conformidade com os dois primeiros aspectos é relativamente simples, a questão dos direitos autorais se revela mais complexa. Para modelos de IA avançados, mais dados de treinamento melhoram o desempenho. Contudo, as obrigações de direitos autorais reduzem a quantidade de dados disponíveis e, por meio de requisitos de licenciamento, aumentam o custo dos dados de treinamento.
Algumas disposições do CoP sobre direitos autorais são razoáveis, como a proibição da reprodução de conteúdo protegido por direitos autorais nas saídas dos modelos. No entanto, outras são problemáticas, como a exigência de transparência sobre as origens dos conjuntos de dados utilizados para o treinamento de modelos.
A Ilusão da Transparência Total
O CoP e a Lei de IA têm como objetivo melhorar a transparência sobre o uso de dados de treinamento de modelos. No entanto, isso ignora o problema dos altos custos de transação e as taxas de licenciamento que surgem ao negociar acordos com milhões de titulares de direitos online. O modelo de publicidade online não é facilmente transferível para o licenciamento de IA.
Além disso, a definição ampla de dados de treinamento de IA no CoP abrange todos os dados usados para pré-treinamento, ajuste fino e aprendizado por reforço, independentemente de serem protegidos por direitos de propriedade intelectual. Isso inclui dados pessoais protegidos por direitos de privacidade e dados sintéticos gerados pelos desenvolvedores de modelos.
Impacto nas Comunidades Linguísticas Menores
Essa abordagem pode resultar em conjuntos de dados de treinamento tendenciosos, penalizando especialmente comunidades menores de idiomas e culturas da UE. Os modelos de IA líderes já apresentam viés em favor das grandes comunidades de língua inglesa.
Consequências e Conclusões Políticas
A aplicação sutil do fortalecimento dos direitos autorais no CoP, limitando-se aos dados mais relevantes utilizados para o treinamento de IA, possibilitou que a maioria dos desenvolvedores de IA concordasse com o CoP. No entanto, uma solução mais satisfatória exigiria um debate sobre o papel da IA em melhorar o aprendizado, a pesquisa e a inovação, longe das limitações dos direitos autorais.
Um caminho melhor seria que a legislação de direitos autorais, ou pelo menos sua aplicação a modelos de IA, se inspirasse em recursos de inovação presentes na legislação de patentes, permitindo que modelos de IA e usuários aprendessem com todo o conteúdo e dados legalmente acessíveis.
Essa mudança de enfoque poderia, em última análise, liberar o aprendizado irrestrito e o uso transformador dos dados, promovendo um regime de inovação eficiente que possa colocar a União Europeia em uma posição competitiva no cenário global de IA.