Litigio: ¿Es el contenido generado por IA descubrible? Lo que las empresas deben saber en 2026
Las herramientas de inteligencia artificial están remodelando rápidamente la forma en que se crea y almacena la información electrónica, especialmente en lo que respecta al contenido generado por modelos de lenguaje avanzado. A medida que las empresas adoptan herramientas de IA generativa para redactar, resumir, analizar y otros usos comerciales, los tribunales están tratando de determinar si los datos de IA generativa, como las solicitudes (lo que un usuario escribe), las salidas (lo que genera la herramienta de IA) y los registros de actividad, entran dentro de las obligaciones tradicionales de descubrimiento.
Las reglas tradicionales de descubrimiento aún rigen los datos no tradicionales
Según la regla FRCP 26(b)(1), las partes pueden obtener descubrimientos de materiales no privilegiados que sean relevantes y proporcionales a las necesidades del caso. Los tribunales han dejado claro que las nuevas formas de información electrónica no están exentas simplemente porque sean novedosas. Los principios de descubrimiento tradicional se aplican de igual manera a las fuentes emergentes de información electrónica, incluidos los datos de IA generativa.
Decisiones clave sobre la descubribilidad de datos de IA generativa
Una de las decisiones más definitorias hasta ahora sobre la descubribilidad de los datos de IA generativa es el caso de In re OpenAI, donde se obligó a la producción de millones de registros de IA generativa, incluidas las solicitudes de los usuarios y las respuestas del modelo, con la condición de que se anonimizaran las referencias de los usuarios. El tribunal concluyó que estos registros eran relevantes y proporcionales a las reclamaciones de los demandantes que afirmaban que los sistemas de IA del demandado reproducían obras protegidas por derechos de autor en sus salidas. La decisión enfatizó que las preocupaciones de privacidad pueden mitigarse mediante la anonimización y órdenes de protección y no impiden de manera categórica la producción de salidas de IA.
En una decisión separada en la misma litigación, se negó una solicitud para obligar al New York Times a producir contenido de sus herramientas internas de IA, encontrando que la solicitud era irrelevante y desproporcionada. Argumentó que revisar aproximadamente 80,000 entradas tomaría más de 1,300 horas, lo que representa una carga sustancial dada la conexión limitada de los datos con los problemas del caso.
Relevancia y proporcionalidad siguen siendo claves
Estas decisiones subrayan dos conceptos clave de descubrimiento:
- 1) Relevancia: Los datos de IA generativa son descubribles cuando están vinculados a una reclamación o defensa.
- 2) Proporcionalidad: Incluso volúmenes masivos de datos de IA generativa pueden ser descubribles cuando están justificados por las necesidades del caso, pero la proporcionalidad sigue siendo una consulta relevante.
IA generativa y descubrimiento electrónico en la práctica
Dada la rápida evolución del rol de la IA generativa en todos los aspectos de la vida diaria, las partes deben estar bien preparadas para abordarla de manera directa durante el descubrimiento. Dado que rara vez es razonable o proporcional preservar todos los datos de IA generativa, es crítico desarrollar un enfoque defensible que sea específico, razonado y bien documentado desde las primeras etapas del compromiso.
- Identificar datos relevantes de IA generativa: Determine si algunos custodios de datos potencialmente relevantes utilizan herramientas de IA generativa, cómo se utilizan las herramientas y dónde se almacenan las solicitudes y salidas. Tenga en cuenta que pueden existir registros de actividad relevantes por separado, incluso en plataformas de terceros.
- Preservar lo que es potencialmente relevante: Cuando se anticipa litigio, preserve los datos de IA generativa que se relacionen con reclamaciones o defensas, particularmente donde los datos de IA generativa puedan contener afirmaciones fácticas o contenido sustantivo. Los pasos varían según la plataforma, pero pueden incluir desactivar configuraciones de autolimpieza, exportar historiales de chat, guardar intercambios clave en repositorios de documentos y coordinarse con IT para entender la retención de registros y metadatos.
- Negociar el alcance desde temprano: Si se implica datos de IA generativa, aborde la relevancia y proporcionalidad en los protocolos de información electrónica y en las discusiones iniciales de reunión. Definiciones claras y límites específicos pueden prevenir búsquedas indiscriminadas y reducir costos y cargas.
- Abordar la confidencialidad: Tome en serio las preocupaciones de privacidad. Siempre que sea posible, utilice órdenes de protección y protocolos de anonimización para gestionar información sensible mientras cumple con las obligaciones de descubrimiento.
- Actualizar la gobernanza de la información: Incorpore los datos de IA generativa en los inventarios de información electrónica, procedimientos de retención y políticas de retención para mejorar la preparación para el descubrimiento. También se deben considerar políticas específicas de IA en torno al uso aceptable y la confidencialidad de los datos.
Conclusión
La descubribilidad de los datos de IA generativa se está convirtiendo rápidamente en un tema central en el descubrimiento electrónico. Los tribunales no están excluyendo a los datos de IA generativa; los principios de descubrimiento tradicionales siguen aplicándose. Cuando los datos de IA generativa van al corazón de una disputa, probablemente serán descubribles, pero la proporcionalidad sigue siendo un límite significativo. Las empresas y sus equipos de litigio deben abordar los datos de IA generativa desde el principio en la planificación del descubrimiento, trabajar en estrecha colaboración con especialistas en descubrimiento electrónico para minimizar la carga y gestionar proactivamente las preocupaciones de privacidad.