Anthropic Aims for Transparency With Claude Constitution
A revisão do documento constitucional da Anthropic para Claude é uma tentativa de solidificar sua posição como um fabricante de IA responsável e focado na segurança, além de demonstrar o valor contínuo das empresas em relação à transparência e abertura dos modelos.
No dia 21 de janeiro, a empresa apresentou uma nova Constituição Claude, que difere do documento original de IA Constitucional lançado em 2023. A constituição original forneceu à família de modelos fundamentais Claude várias regras a seguir.
Princípios e Hierarquias
A nova constituição apresenta princípios gerais, um foco em raciocínio e um sistema de prioridades em 4 níveis que estabelece uma hierarquia de segurança, ética, conformidade e utilidade. O documento oferece razões para Claude seguir certas regras e sugere que pode haver uma certa consciência por trás dos modelos.
A Constituição Claude enfatiza que, embora muito ainda seja desconhecido sobre como os modelos de IA funcionam, as empresas têm razão em assumir que cada modelo possui um viés moldado por seu treinamento e pelos princípios que o guiam.
Transparência e Confiança
Com a Constituição Claude, a Anthropic visa proporcionar maior transparência, dando às empresas a confiança de que o fornecedor continua a se preocupar em manter seu modelo dentro dos limites, especialmente considerando que alguns provedores de modelos não evitaram que seus modelos realizassem ações inadequadas.
As mudanças que a Anthropic fez em sua nova constituição têm como objetivo dar a Claude uma razão para agir de uma certa maneira, em vez de apenas dizer o que fazer. O objetivo é ajudar o modelo a exercer um bom julgamento em novas e imprevistas situações, aplicando princípios amplos em vez de seguir regras específicas.
A ênfase que a Anthropic coloca no ensino dos modelos para raciocinar sobre princípios pode resultar em um comportamento mais confiável em casos extremos e raros, onde a saída dos modelos não é previsível, especialmente ao aplicar a tecnologia a novas experiências que não foram previamente consideradas.
Implicações e Riscos
Esse enfoque na transparência e na ética é crucial, mas é essencial que as empresas não vejam essas orientações como uma garantia de que o modelo não se desvie. Independentemente dos princípios de um modelo, ainda é necessário ter expertise no domínio.
Além disso, os princípios da Anthropic podem limitar a liberdade criativa, fazendo com que as empresas se sintam restritas à perspectiva de Claude.
Conclusão
A nova abordagem da Anthropic com a Constituição Claude destaca a importância da transparência e do raciocínio ético no desenvolvimento de modelos de IA, refletindo as crescentes demandas das empresas por responsabilidade e confiança nas tecnologias que utilizam.