27/06/2026

Agentes de IA autónomos: la guía de gobernanza y cumplimiento

Lo esencial

Un agente de IA autónomo persigue un objetivo y pasa a la acción con poca o ninguna intervención humana, combinando un modelo con capacidad de planificación, memoria y acceso a herramientas.
Es precisamente la autonomía lo que preocupa a los reguladores: el reglamento de IA, el NIST y la ISO/IEC 42001 calibran sus exigencias según el grado de independencia con que actúa un sistema.
Los problemas más difíciles tienen que ver con la responsabilidad y la supervisión, no con el rendimiento. Cuando un agente actúa sobre varios sistemas a la velocidad de la máquina, ¿quién responde y quién puede detenerlo?
Un modelo de gobernanza operativo se resuelve en seis pasos: inventariar, clasificar, diseñar la supervisión, aplicar controles técnicos, registrar y auditar, y repartir la responsabilidad a lo largo de la cadena de valor.
La mayoría de los contenidos publicados definen los agentes autónomos. Casi ninguno explica a un equipo de cumplimiento cómo gobernarlos. Esta guía aborda lo segundo.

Gobernar los agentes de IA autónomos bajo supervisión humana

Qué son realmente los agentes de IA autónomos

Un agente de IA autónomo es un software capaz de comprender un objetivo, decidir cómo alcanzarlo y actuar en consecuencia sin esperar a que una persona apruebe cada paso. Salesforce, Microsoft y NVIDIA describen el mismo mecanismo de fondo: el agente percibe su entorno, razona para trazar un plan, actúa mediante herramientas conectadas y aprende del resultado (glosario de NVIDIA). Retirado el barniz comercial, un agente se reduce a dos componentes: un modelo que aporta el razonamiento y un andamiaje que aporta la planificación, la memoria y el acceso a herramientas, archivos e interfaces de programación. Ese andamiaje es lo que separa a un agente de un simple asistente conversacional. Un chatbot responde. Un agente actúa. Puede abrir un ticket, mover fondos entre dos cuentas, modificar una configuración, enviar un correo o invocar otro servicio, y luego decidir el siguiente paso según lo ocurrido. The Future Society, en su análisis de 2025 sobre cómo el reglamento de IA alcanza a los agentes, los define funcionalmente como sistemas que persiguen de forma autónoma objetivos complejos y de largo plazo, y técnicamente como un modelo de propósito general dotado de un andamiaje de razonamiento y acceso a herramientas (The Future Society). Conviene pensar la autonomía como un espectro y no como un interruptor:

La IA asistiva responde a una petición y se detiene.
La IA agentica encadena varios pasos, pero pide confirmación a menudo.
La IA autónoma recorre un ciclo completo, del objetivo al resultado, y solo se manifiesta cuando lo necesita, o cuando ha terminado.

Cuanto más a la derecha se sitúe en este espectro, menos ve una persona de cada decisión individual, y más debe desplazarse la gobernanza del control de las salidas a la limitación de los comportamientos. Si aún ordena su dispositivo a escala de programa, nuestra guía de gobernanza de la IA sienta las bases sobre las que se apoya este artículo.

Por qué los agentes autónomos rompen la gobernanza tradicional

Gran parte de los dispositivos de gobernanza de la IA se pensaron para sistemas que producen una salida que luego usa una persona. Un modelo de riesgo puntúa una solicitud y una persona decide. Un modelo de lenguaje redacta un texto y una persona lo corrige. Los agentes autónomos eliminan esa pausa. Ejecutan la acción ellos mismos, lo que traslada el riesgo de la calidad de una salida a las consecuencias de un comportamiento. Tres propiedades hacen a los agentes más difíciles de gobernar que los modelos que contienen. Primero, la planificación a largo plazo. Un agente encadena muchos pasos y los pequeños errores se acumulan. Una suposición equivocada en el segundo paso puede desencadenar veinte acciones posteriores antes de que nadie lo advierta. La acción es el producto, y una acción es más difícil de deshacer que un texto. Segundo, el problema de las muchas manos. Un agente suele funcionar sobre un modelo construido por una empresa, integrado en un producto por una segunda y puesto en marcha por una tercera. The Future Society lo califica como el reto central de la gobernanza de agentes: la responsabilidad se dispersa entre proveedores de modelos, proveedores de sistemas y responsables del despliegue, cada uno con solo una parte del contexto y de los controles (The Future Society). Cuando algo sale mal, la responsabilidad sigue siendo opaca mientras los deberes no se hayan atribuido de antemano. Tercero, la fragilidad ante los ataques. Como leen contenidos externos y actúan en consecuencia, los agentes pueden ser secuestrados. La inyección de instrucciones inserta órdenes hostiles en una página web, un documento o un correo, y el agente las sigue en lugar de su tarea real. La investigación de red team del NIST muestra que ataques inéditos contra agentes de IA tienen éxito en el 81% de los casos, frente al 11% de las defensas de referencia (solicitud de información del NIST). Un agente secuestrado con acceso a herramientas no es un problema de contenido: es un actor, dentro de sus sistemas, que ejecuta el trabajo del atacante. Las técnicas de ataque que conviene modelar están catalogadas en referencias como MITRE ATLAS. Añada la velocidad a estas tres propiedades. Los agentes actúan más rápido de lo que una persona puede observar, lo que inutiliza cualquier supervisión concebida como control posterior. La supervisión debe integrarse en la ruta de acción del agente, no añadirse después.

Cómo tratan los reguladores y las normas a los agentes autónomos

Aún no existe una ley propia de los agentes. Sin embargo, en todos los grandes regímenes emerge un patrón claro: cuanto más autónomamente actúa un sistema, más se exige a quien lo opera. Tres marcos importan por encima del resto.

Reglamento de IA: la autonomía eleva el listón

El reglamento de IA no nombra a los agentes, pero los alcanza en dos ejes, como expone el análisis de The Future Society. El primero es el modelo subyacente: los agentes construidos sobre modelos de IA de propósito general con riesgo sistémico arrastran a sus proveedores a las obligaciones del capítulo V (artículo 55). El segundo es el propio sistema agentico, clasificado conforme al capítulo III. Un agente usado como componente de seguridad o en un caso de uso del anexo III es de alto riesgo, y como un agente generalista puede servir a muchos fines, puede caer en el alto riesgo por defecto salvo que su proveedor excluya deliberadamente esos usos (The Future Society). Cuando un sistema es de alto riesgo, el artículo 14 sobre la supervisión humana se aplica directamente, y su redacción parece escrita para la autonomía. Los sistemas de alto riesgo deben diseñarse de modo que puedan «ser supervisados de manera efectiva por personas físicas» durante su uso, y la persona encargada debe poder «decidir no utilizar el sistema o ignorar, anular o revertir su salida» e «intervenir en el funcionamiento o interrumpir el sistema mediante un botón de parada o un procedimiento similar» (artículo 14 del reglamento de IA). La frase decisiva lo ata todo a la autonomía: las medidas de supervisión deben ser «proporcionales a los riesgos, al nivel de autonomía y al contexto de uso». Ese es el quid: más autonomía significa más supervisión, por ley. Queda la cuestión de la viabilidad. Como argumenta un análisis de Tech Policy Press, el artículo 14 da por supuesto que el comportamiento de un agente puede hacerse legible y sus acciones detenerse o revertirse, algo técnicamente difícil para agentes que actúan a velocidad de máquina sobre una autoridad distribuida, y ningún acto de ejecución específico para agentes ha resuelto la cuestión. Las obligaciones de transparencia del artículo 50 añaden un segundo hilo: las personas deben saber cuándo interactúan con un sistema de IA. Para el mapeo detallado, consulte nuestra comparativa de marcos de gobernanza. En España, la AEPD y la AESIA ya ofrecen referencias operativas sobre supervisión y seguridad que los equipos pueden reutilizar.

NIST: rejillas de controles para los agentes

En Estados Unidos, el NIST es el más rápido en lo concreto. Su Center for AI Standards and Innovation puso en marcha en febrero de 2026 una iniciativa de normalización para agentes de IA, y su entregable más tangible en preparación es un conjunto de rejillas de controles COSAiS ligadas a la SP 800-53, que cubren sistemas de un solo agente y de múltiples agentes con controles elegidos a partir de modelos de amenaza explícitos (documento conceptual COSAiS del NIST). Todo ello se asienta sobre el marco de gestión del riesgo de IA del NIST, cuyas funciones gobernar, mapear, medir y gestionar ya dan estructura al riesgo agentico. Nuestra guía operativa del NIST AI RMF detalla su aplicación.

ISO/IEC 42001: el andamiaje de gestión

Ni el reglamento de IA ni el NIST explican cómo levantar el programa que sostendrá estos deberes. La ISO/IEC 42001 sí. Como norma certificable de sistema de gestión de la IA, aporta la política, los roles, el tratamiento del riesgo y los controles de ciclo de vida que convierten una supervisión puntual en un sistema repetible. Trátela como el recipiente de la gobernanza de agentes y no como un proyecto aparte; nuestra explicación de la ISO 42001 presenta su arquitectura.

Un modelo operativo de gobernanza para los agentes autónomos

Los marcos describen el objetivo. No dicen qué hacer el lunes por la mañana. Este es un modelo en seis pasos que convierte las obligaciones anteriores en un verdadero programa de gobernanza de agentes. Se apoya en los cuatro pilares que The Future Society extrae de la literatura (evaluación del riesgo, transparencia, controles técnicos de despliegue y supervisión humana), reordenados según la lógica de trabajo de un equipo.

1. Inventariar y registrar cada agente

No se gobierna un agente cuya existencia se desconoce. El primer punto ciego son los agentes en la sombra: herramientas levantadas en las áreas de negocio, con credenciales y acceso a herramientas, pero nunca registradas. Construya un inventario único donde cada agente tenga un responsable, una finalidad, la lista de herramientas y datos que puede alcanzar y un identificador único que haga atribuibles sus acciones. Es la misma disciplina que hace manejable la IA en la sombra, aplicada a sistemas que actúan en lugar de limitarse a responder.

2. Clasificar y graduar el riesgo de cada agente

Con el inventario en la mano, clasifique cada agente según los regímenes aplicables. Pase un filtro de anexo III para los usos de alto riesgo, determine si el modelo subyacente lo arrastra a las obligaciones GPAI y gradúe el agente por el radio de impacto de sus acciones, no por la inteligencia de su modelo. Para los agentes que afectan a los derechos de las personas, la evaluación de impacto en los derechos fundamentales es el instrumento adecuado, y su mecánica se solapa con el trabajo de evaluación de impacto que los equipos de GRC ya realizan en materia de datos personales.

3. Diseñar la supervisión humana antes del despliegue

El artículo 14 se satisface con el diseño, no con las buenas intenciones. Decida, para cada agente y cada clase de acción, qué modo de supervisión se aplica:

Humano en el bucle: el agente propone y una persona aprueba cada acción relevante antes de su ejecución.
Humano sobre el bucle: el agente actúa y una persona supervisa, puede intervenir y detenerlo.
Humano al mando: el agente opera dentro de límites estrictos que una persona fija, audita y puede revocar.

Las acciones de alto impacto (mover fondos, cambiar accesos, contactar con clientes) deben pasar por un punto de control o una autorización. Cada agente necesita una parada que funcione, el «botón de parada» literal del artículo 14, y una persona designada cuya función es accionarla.

4. Aplicar controles técnicos de despliegue

La supervisión sobre el papel fracasa sin controles en el código. Otorgue a los agentes un acceso de mínimo privilegio, de modo que un agente secuestrado pueda hacer poco. Añada rechazos de acción en tiempo real, para que el agente decline lo que excede su mandato, y un apagado de emergencia que un operador, o una barrera automatizada, pueda activar. Son los controles técnicos de despliegue que el análisis europeo de la cadena de valor atribuye conjuntamente a proveedores y responsables del despliegue, y la primera línea de defensa frente a las inyecciones de instrucciones medidas por el NIST.

5. Registrar, auditar y monitorizar

Cada acción relevante de un agente debería producir un registro inmutable y consultable: qué hizo, por qué, con qué autoridad y con qué resultado. Los registros de actividad son a la vez una herramienta de supervisión y la base probatoria de una auditoría o un incidente. Cuando un agente cause un daño, tendrá que reconstruir la cadena, y por eso el registro de los agentes debería alimentar el mismo flujo que su proceso de notificación de incidentes de IA conforme al artículo 73.

6. Atribuir la responsabilidad a lo largo de la cadena de valor

Por último, deje por escrito quién responde de qué antes de que algo salga mal. El proveedor del modelo, el proveedor del sistema y el responsable del despliegue controlan riesgos distintos y poseen pruebas distintas. Los contratos y una matriz RACI interna deberían asignar cada deber (infraestructura de monitorización, umbrales de alerta, supervisión operativa) al actor que de verdad puede cumplirlo. Así el problema de las muchas manos deja de ser una excusa y se convierte en una atribución. Una plataforma de gobernanza que reúne inventario, clasificaciones, controles y pruebas en un solo lugar, en vez de en un conjunto de herramientas desconectadas, es lo que mantiene esa atribución al día.

Agentes autónomos, IA agentica y automatización

Los términos circulan de forma imprecisa, y las distinciones importan para la gobernanza porque cada nivel conlleva un riesgo distinto.

La automatización tradicional sigue reglas fijas. Es predecible y fácil de gobernar, pero no puede afrontar nada para lo que no se la haya programado.
La IA agentica usa un modelo para planificar y adaptarse a lo largo de varios pasos, pero suele operar dentro de una tarea definida con frecuentes puntos de control humanos.
Los agentes de IA autónomos recorren el ciclo completo con una intervención humana mínima, eligiendo sus propios pasos y usando herramientas para alcanzar un objetivo.

Un motor de reglas que señala una factura es automatización. Un sistema que lee la factura, la juzga válida, programa el pago y concilia el libro mayor es un agente autónomo. La brecha de gobernanza no es sutil: la automatización requiere pruebas, mientras que los agentes autónomos requieren supervisión, controles y responsabilidad porque toman por sí solos decisiones relevantes.

Errores frecuentes al gobernar agentes autónomos

Tratar a los agentes como software corriente. La gestión del cambio y las revisiones de acceso pensadas para aplicaciones estáticas pasan por alto que el comportamiento de un agente es emergente, no fijo.
Acceso a herramientas no gobernado. El riesgo de un agente es la suma de lo que sus herramientas pueden tocar. Unas credenciales demasiado amplias convierten un fallo pequeño en uno grande.
Un apagado de emergencia que no funciona. Un botón de parada que nadie ha probado, o que no puede interrumpir una acción en curso, es solo decorado.
Una supervisión que no escala. Aprobar cada acción frustra el propósito, y vigilar miles de acciones por minuto es imposible. Ajuste el modo de supervisión al impacto de la acción.
Ningún inventario. Todos los demás controles dependen de saber que el agente existe. Los agentes en la sombra son la causa primera de la mayoría de los incidentes.

Preguntas frecuentes

¿Qué es un agente de IA autónomo, en pocas palabras? Es un software que recibe un objetivo, decide cómo lograrlo y ejecuta por sí mismo los pasos usando herramientas y datos, sin que una persona apruebe cada acción. El rasgo distintivo es que actúa, mientras que un chatbot solo responde. ¿Es ChatGPT un agente autónomo? Por sí solo, no. Un chatbot independiente responde a las peticiones y se detiene. Se vuelve agentico cuando se le dota de planificación, memoria y acceso a herramientas que le permiten actuar sobre varios sistemas hacia un objetivo. El modelo es el cerebro; el agente es el cerebro más el andamiaje que le permite actuar. ¿Regula el reglamento de IA a los agentes de IA autónomos? Sí, de forma indirecta. El reglamento no nombra a los agentes, pero los alcanza a través del modelo de propósito general en el que se apoyan y a través de la clasificación del sistema de alto riesgo. Cuando un agente es de alto riesgo, el artículo 14 exige una supervisión humana efectiva, proporcional al nivel de autonomía del sistema (artículo 14). ¿Cuál es el mayor riesgo de los agentes de IA autónomos? La combinación de autonomía y acceso a herramientas. Un agente que puede actuar sobre el mundo también puede ser secuestrado para actuar contra usted. El NIST midió una tasa de éxito de los ataques del 81% en condiciones de red team, por lo que el mínimo privilegio y una parada que funcione no son negociables. ¿Qué diferencia hay entre la IA agentica y los agentes de IA autónomos? La IA agentica designa la capacidad de planificar y actuar a lo largo de varios pasos. Un agente de IA autónomo es un sistema que ejerce esa capacidad con una intervención humana mínima, recorriendo por sí solo un ciclo completo del objetivo al resultado. La mayoría de los sistemas agenticos actuales mantienen a una persona en el bucle o sobre el bucle; la plena autonomía es el extremo alto del mismo espectro. ¿Cómo se gobiernan en la práctica los agentes de IA autónomos? Inventaríe cada agente, clasifíquelo y gradúe su riesgo, diseñe el modo de supervisión humana antes del despliegue, imponga controles técnicos como el mínimo privilegio y un apagado de emergencia, registre cada acción relevante y atribuya la responsabilidad entre proveedor del modelo, proveedor del sistema y responsable del despliegue.

Conclusión

Los agentes de IA autónomos llevan la IA del consejo a la acción, y la gobernanza debe moverse con ellos. Los marcos ya apuntan en la misma dirección: supervisión, controles y responsabilidad crecen con la autonomía. Lo que faltaba es un modelo operativo que traduzca ese principio a la práctica diaria, e inventariar, clasificar, diseñar la supervisión, controlar, registrar y atribuir la responsabilidad es ese modelo. AI Sigil ofrece a las organizaciones reguladas un único sistema de referencia para gestionarlo, de modo que cada agente de su parque sea conocido, clasificado, supervisado y auditable. Empiece por mapear su marco de gobernanza de la IA y luego integre en él a sus agentes antes de que se integren ellos solos.

Elena Vargas