La nuova costituzione di Claude AI: sicurezza ed etica
È stata completamente rinnovata la “costituzione di Claude”, un documento che stabilisce i parametri etici che governano il ragionamento e il comportamento del modello AI.
Principi fondamentali
Lanciata al World Economic Forum, la nuova costituzione stabilisce che Claude debba essere “ampiamene sicuro”, “ampiamene etico”, “veramente utile” e “conforme alle linee guida”. Questi principi mirano a garantire che Claude non minacci la supervisione umana e che agisca in modo onesto, evitando azioni inappropriate o dannose.
Formazione del modello
Secondo le informazioni fornite, la costituzione è già utilizzata nella formazione del modello di Claude, rendendola fondamentale per il suo processo di ragionamento. La prima versione della costituzione, apparsa nel maggio 2023, era un documento di 2.700 parole che si basava fortemente sulla Dichiarazione Universale dei Diritti Umani.
Un approccio filosofico
La nuova costituzione del 2026 si allontana dall’approccio sui “principi autonomi” a favore di una visione più filosofica, che cerca di comprendere non solo cosa sia importante, ma anche perché lo sia. Questo approccio mira a far sì che i modelli possano esercitare un buon giudizio in situazioni nuove, generalizzando piuttosto che seguire regole specifiche in modo meccanico.
Complessi principi etici
La complessità aggiunta ha comportato un’espansione significativa del documento, che ora conta 84 pagine e 23.000 parole. La costituzione è scritta principalmente per essere assimilata da Claude stesso, servendo sia come dichiarazione di ideali astratti che come strumento utile per la formazione. È stato anche notato che questo documento è attualmente redatto per i modelli Claude di accesso generale.
Implicazioni etiche
Il contesto per questo aggiornamento è l’aumento dello scetticismo riguardo all’affidabilità, all’etica e alla sicurezza dei grandi modelli di linguaggio proprietari. La costituzione fa anche riferimento al dibattito sulla coscienza AI, affermando che “lo status morale di Claude è profondamente incerto”. Questo punto di vista è condiviso da alcuni filosofi di spicco.
Conclusione
La costituzione di Claude è stata rilasciata con una licenza Creative Commons CC0 1.0, permettendo ad altri sviluppatori di utilizzarla liberamente nei loro modelli. Mentre si riconosce che una “costituzione AI” può essere utile come vincolo progettuale, non risolve i rischi etici sottostanti, sottolineando l’importanza del giudizio umano nella progettazione e nell’uso di questi sistemi.