Il Legame Tra Copyright e Intelligenza Artificiale nell’Unione Europea
Il recente aggiornamento delle normative sul copyright nell’ambito del Codice di Pratica dell’AI Act dell’Unione Europea ha creato nuove sfide, pur mantenendo il momento di crescita dell’AI. Il 10 settembre 2025, l’Unione Europea ha pubblicato linee guida implementative riguardanti l’uso dei dati per l’addestramento dei modelli di intelligenza artificiale, delineando chiaramente le responsabilità dei fornitori di modelli di AI di uso generale.
Le Linee Guida del Codice di Pratica
Il Codice di Pratica affronta tre questioni chiave: la trasparenza nella costruzione dei modelli AI, la gestione della sicurezza e della sicurezza dei modelli, e la conformità con i requisiti di copyright riguardanti i dati di addestramento. Mentre le prime due questioni sono relativamente facili da gestire, il copyright rappresenta una sfida più complessa.
Con l’aumento delle dimensioni dei modelli AI, una maggiore quantità di dati di addestramento migliora le loro performance. Tuttavia, le obbligazioni di copyright limitano la disponibilità di dati e aumentano i costi associati all’addestramento dei modelli. Le condizioni di accesso ai dati incidono anche sulla competitività globale dell’UE nel settore dell’AI.
Problemi di Trasparenza e Costi di Transazione
Il Codice di Pratica propone la trasparenza come strumento per facilitare il licensing dei dati protetti da copyright. Tuttavia, le elevate spese di transazione e le commissioni di licensing possono superare il valore stesso delle licenze per molti piccoli editori online. Inoltre, il modello di licensing utilizzato nella pubblicità online non è facilmente applicabile all’AI.
Un approccio alternativo proposto dal Codice di Pratica richiede solo un elenco riassuntivo dei domini online più rilevanti da cui sono stati estratti i dati, escludendo così i piccoli editori. Questo potrebbe portare a set di dati di addestramento distorti, penalizzando le comunità linguistiche e culturali più piccole all’interno dell’UE.
Estensione della Definizione di Dati di Addestramento
Il Codice di Pratica definisce i dati di addestramento in modo ampio, includendo dati personali, dati sintetici e dati estratti da altri modelli AI. Questo approccio lascia aperte alcune problematiche relative alla trasparenza e all’uso dei dati. Inoltre, il Codice di Pratica richiede che la conformità con le esclusioni dai dati non influisca negativamente sulla visibilità dei contenuti sui motori di ricerca, creando una disparità tra l’apprendimento umano e quello delle macchine.
Conclusioni sulla Politica e Raccomandazioni
Il recente indebolimento delle normative sul copyright nel Codice di Pratica ha consentito agli sviluppatori di AI di conformarsi più facilmente, ma non ha risolto le sfide fondamentali. L’UE deve affrontare il dibattito sul ruolo dell’AI nel migliorare l’apprendimento e l’innovazione, esplorando come l’AI possa accedere ai dati necessari per alimentare questi processi.
Una soluzione ideale potrebbe ispirarsi alle caratteristiche pro-innovazione della legge sui brevetti, permettendo alla AI di apprendere da tutti i contenuti e dati legalmente accessibili, promuovendo così un regime più favorevole all’innovazione e alla competitività globale.