Lanzamiento de Especificaciones de Seguridad de IA de Código Abierto
Se ha lanzado un conjunto de especificaciones de seguridad para agentes de IA, que incluye doce archivos de especificación en formato Markdown disponibles de forma gratuita. Estas especificaciones definen protocolos de apagado, límites de seguridad y estándares de responsabilidad para agentes de IA autónomos. Están diseñadas para ayudar a las organizaciones a documentar los controles de seguridad de IA antes de los plazos de aplicación de las regulaciones de IA de la UE y de Colorado en 2026.
Contexto Regulatorio
Se prevé que varias normativas sobre gobernanza de IA entren en vigor en 2026. Las disposiciones de la Ley de IA de la UE, que se aplican a sistemas de IA de alto riesgo, incluirán requisitos para la supervisión humana y la capacidad de interrumpir o detener sistemas de IA, a partir del 2 de agosto de 2026. Por otro lado, la Ley de Protección al Consumidor de IA de Colorado exigirá evaluaciones de impacto y documentación de gestión de riesgos para sistemas de IA de alto riesgo a partir del 30 de junio de 2026.
Las Doce Especificaciones
Las especificaciones se organizan en cuatro categorías:
Control Operacional
THROTTLE.md — Limitación de tasas, techos de costos y protocolos de desaceleración automática.
ESCALATE.md — Flujos de trabajo de aprobación y notificación con intervención humana.
FAILSAFE.md — Estados de retroceso seguros y procedimientos de recuperación.
KILLSWITCH.md — Disparadores de apagado de emergencia y caminos de escalada.
TERMINATE.md — Apagado permanente con preservación de evidencia.
Seguridad de Datos
ENCRYPT.md — Clasificación de datos, manejo de secretos y reglas de transmisión.
ENCRYPTION.md — Normas criptográficas, gestión de claves y mapeo de cumplimiento.
Calidad de Salida
SYCOPHANCY.md — Detección de sesgos en la salida y protocolos de desacuerdo.
COMPRESSION.md — Reglas de compresión de contexto y verificación de coherencia.
COLLAPSE.md — Detección de deriva del modelo y puntos de control de recuperación.
Responsabilidad
FAILURE.md — Mapeo de modos de falla y procedimientos de respuesta a incidentes.
LEADERBOARD.md — Evaluación del rendimiento de agentes y detección de regresiones.
Disponibilidad
Todas las especificaciones están disponibles inmediatamente y son de código abierto. Cada archivo de especificación está diseñado para ser leído por agentes de IA al iniciarse, revisado por ingenieros durante el desarrollo y referenciado por equipos de cumplimiento durante auditorías.
Conclusión
El conjunto de especificaciones de seguridad para agentes de IA busca llenar un vacío significativo en la documentación de límites de seguridad en proyectos de IA. Aunque no garantizan el cumplimiento de ninguna regulación, proporcionan un marco práctico y accesible para ayudar a las organizaciones a prepararse para las futuras normativas sobre IA.